Programa del Curso

Introducción al Afinado de Modelos LLM de DeepSeek

  • Resumen de los modelos de DeepSeek, como DeepSeek-R1 y DeepSeek-V3
  • Comprender la necesidad de afinar modelos LLM
  • Comparación entre el afinado y la ingeniería de prompts

Preparando el Conjunto de Datos para el Afinado

  • Curaduría de conjuntos de datos específicos del dominio
  • Técnicas de preprocesamiento y limpieza de datos
  • Tokenización y formateo del conjunto de datos para modelos LLM de DeepSeek

Configuración del Entorno de Afinado

  • Configuración de aceleración con GPU y TPU
  • Configuración de Hugging Face Transformers con modelos LLM de DeepSeek
  • Comprender los hiperparámetros para el afinado

Afinando Modelos LLM de DeepSeek

  • Implementación del afinado supervisado
  • Uso de LoRA (Adaptación de Rango Bajo) y PEFT (Afinado Eficiente de Parámetros)
  • Ejecución de afinado distribuido para conjuntos de datos a gran escala

Evaluando y Optimizando Modelos Afinados

  • Evaluación del rendimiento del modelo con métricas de evaluación
  • Manejo del sobreajuste y el subajuste
  • Optimización de la velocidad de inferencia y eficiencia del modelo

Implementación de Modelos Afinados de DeepSeek

  • Empaquetamiento de modelos para implementación a través de API
  • Integración de modelos afinados en aplicaciones
  • Escalamiento de implementaciones con computación en la nube y en el borde

Casos Prácticos y Aplicaciones del Mundo Real

  • Modelos LLM afinados para finanzas, salud y soporte al cliente
  • Estudios de casos de aplicaciones industriales
  • Consideraciones éticas en modelos de IA específicos del dominio

Resumen y Próximos Pasos

Requerimientos

  • Experiencia con marcos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con transformadores y modelos de lenguaje grandes (LLMs)
  • Comprensión de técnicas de preprocessado de datos y entrenamiento del modelo

Publico objetivo

  • Investigadores de IA explorando el ajuste fino (fine-tuning) de LLMs
  • Ingenieros de aprendizaje automático desarrollando modelos AI personalizados
  • Desarrolladores avanzados implementando soluciones impulsadas por IA
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas