Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción a Reinforcement Learning
- Visión general del aprendizaje por refuerzo y sus aplicaciones
- Diferencias entre aprendizaje supervisado, no supervisado y de refuerzo
- Conceptos clave: agente, entorno, recompensas y política
Procesos de decisión de Markov (MDP)
- Descripción de los estados, las acciones, las recompensas y las transiciones de estado
- Funciones de valor y la ecuación de Bellman
- Programación dinámica para la resolución de MDPs
Algoritmos principales de RL
- Métodos tabulares: Q-Learning y SARSA
- Métodos basados en políticas: algoritmo REINFORCEMENT
- Frameworks de Actores-Críticos y sus aplicaciones
Profundo Reinforcement Learning
- Introducción a las redes Q profundas (DQN)
- Experimenta la reproducción y las redes de destino
- Gradientes de políticas y métodos avanzados de RL profundo
Frameworks y herramientas de RL
- Introducción a OpenAI Gimnasio y otros entornos de RL
- Uso de PyTorch o TensorFlow para el desarrollo de modelos RL
- Formación, pruebas y evaluación comparativa de agentes de RL
Desafíos en RL
- Equilibrio entre la exploración y la explotación en la formación
- Lidiar con recompensas escasas y problemas de asignación de créditos
- ScalaDesafíos computacionales y de bilidad en RL
Manos a la obra Activities
- Implementación de algoritmos Q-Learning y SARSA desde cero
- Entrenando a un agente basado en DQN para jugar un juego sencillo en OpenAI Gimnasio
- Ajuste fino de los modelos RL para mejorar el rendimiento en entornos personalizados
Resumen y próximos pasos
Requerimientos
- Sólida comprensión de los principios y algoritmos de aprendizaje automático
- Competencia en Python programación
- Familiaridad con las redes neuronales y los marcos de aprendizaje profundo
Audiencia
- Ingenieros de aprendizaje automático
- Especialistas en IA
14 Horas
Testimonios (1)
Entrenador respondiendo preguntas al vuelo.
Adrian
Curso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traducción Automática