GithubHelp home page GithubHelp logo

wagamezj / drl2.0 Goto Github PK

View Code? Open in Web Editor NEW

This project forked from joanby/drl2.0

0.0 0.0 0.0 6.05 MB

La combinación más inteligente de Deep Q-Learning, Políticas de Gradiente, Actor-Crítico y DDPG utilizando PyTorch

Home Page: https://www.udemy.com/course/draft/3193148/?referralCode=3F4E5C8F05F535941AB7

Jupyter Notebook 100.00%

drl2.0's Introduction

Aprendizaje por Refuerzo Profundo 2.0 en Python

Con el equipo de SuperDataScience y Juan Gabriel Gomila , solamente en Udemy

Bienvenido al curso Aprendizaje por Refuerzo Profundo 2.0 en Python

En este curso, aprenderemos e implementaremos un nuevo modelo de IA increíblemente inteligente, llamado el Gradiente de Política Determinista de doble retardo (Twin Delayed DDPG, en inglés), que combina las técnicas más avanzadas en Inteligencia Artificial, incluyendo el Aprendizaje de Doble Profundidad, Políticas de Gradiente y Actor-Crítico. El modelo es tan robusto que por primera vez en nuestros cursos, somos capaces de resolver las aplicaciones de IA virtual más desafiantes (entrenar a una hormiga/araña y medio humanoide a caminar y correr a través de un terreno).

Para abordar este modelo de la manera correcta, estructuramos el curso en tres partes:

Parte 1: Fundamentos.

En esta parte estudiaremos todos los fundamentos de la Inteligencia Artificial que te permitirán entender y dominar la IA de este curso. Estos incluyen Q-Learning, Deep Q-Learning, Políticas de Gradiente, Actor-Crítico y mucho más.

Parte 2: La teoría del DDPG de doble retardo.

Estudiaremos a fondo toda la teoría que hay detrás del modelo. Verás claramente todo el proceso de construcción y entrenamiento de la IA a través de una serie de diapositivas de visualización. No sólo aprenderás la teoría en detalle, sino que también darás forma a toda la intuición para saber cómo aprende y trabaja la IA. Los fundamentos de la Parte 1, combinados con la muy detallada teoría de la Parte 2, harán que este modelo altamente avanzado sea accesible para ti, y con el tiempo serás una de las pocas personas que puede dominar y entender este modelo.

Parte 3: La implementación del DDPG de doble retardo.

Implementaremos el modelo desde cero, paso a paso, y a través de sesiones interactivas, una nueva característica de este curso que te hará practicar en muchos ejercicios de codificación mientras implementamos el modelo. Al hacerlos no seguirás el curso de forma pasiva sino muy activa, permitiéndote así mejorar eficazmente tus habilidades en programación e IA.

Y por último, pero no menos importante, haremos toda la implementación en Colaboratory, o Google Colab, que es una plataforma de IA totalmente gratuita y de código abierto que te permitirá programar y entrenar algunas IA sin tener que instalar ningún paquete en tu equipo. En otras palabras, puedes estar 100% seguro de que al pulsar el botón de ejecución, la IA comenzará a entrenar y al final obtendrás los videos de la araña y el humanoide corriendo.

drl2.0's People

Contributors

joanby avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.