Код для каждого задания находится в директории reinforcment_larning/hw1
(Отчёт)[https://app.clear.ml/reports/d2dc4394044e49baba2b3153569f1261/71e7a445dc644ea09febb498f2dac284]
Код для двух сред располагается в директории reinforcment_larning/hw2
(Отчёт)[https://app.clear.ml/reports/27f37854dd5d4bc8ac9f1cf1f8490b3e/311a10c1a9d7438eb0c3421078b0c9cc]
Код для заданий располагается в директории reinforcment_larning/hw3
Код для агента - reinforcment_larning/hw3/agent.py
Код для задания 1 и 2 (в задании отличается только флаг warmstart
, если флаг True
, то используется values, полученные на предыдущем шаге)