Slides de la charla sobre DRL y calibración dada en el CIII.
Parte de los slides son sacados de los cursos de la ECI 2019, y adaptados para una charla de 1 hora.
Material original DRL: Juan Gomez Romero
Los notebook contienen ejemplos de un agente que "aprende" a resolver tareas.
El primero es cartpole, es un ejemplo clásico de teoría de control (péndulo invertido). El entorno virtual será CartPole-v0 de OpenAI.
$ DQN_cartpole.ipynb
El segundo es lunalander. Una nave espacial "aprende" a estabilizar su vuelo y aterrizar en la zona indicada.
En este ejercicio utilizamos el entorno virtual LunarLander-v2 de OpenAI.
$ DQN_lunalander.ipynb