Programa del Curso
Machine Learning Introducción
- Tipos de aprendizaje automático – supervisado vs no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- El flujo de trabajo del data mining: comprensión del negocio, preparación de datos, modelado, implementación
- Elegir el algoritmo adecuado para la tarea
- Sobreajuste y el compromiso sesgo-varianza
Python y Resumen de Bibliotecas ML
- Por qué usar lenguajes de programación para ML
- Elegir entre R y Python
- Tutorial rápido de Python y Jupyter Notebooks
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Prueba y Evaluación de Algoritmos ML
- Generalización, sobreajuste y validación del modelo
- Estrategias de evaluación: holdout, cross-validation, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
- Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva lift
- Selección y búsqueda en cuadrícula del modelo para ajuste
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Gestión de valores faltantes y outliers
- Estandarización, normalización y transformación
- Codificación de datos cualitativos y manipulación de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs multiclase
- Regresión logística y funciones discriminantes
- Naïve Bayes, k-vecinos más cercanos
- Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
- Máquinas de vectores soporte y núcleos
- Técnicas de aprendizaje en conjunto
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Unsupervised Learning
- Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs
- Reducción de dimensionalidad: PCA, análisis factorial, SVD
- Escala multidimensional
Mining de Texto
- Preprocesamiento y tokenización del texto
- Bolsa de palabras, stemming y lematización
- Análisis de sentimiento y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras
Sistemas de Recomendación
- Filtrado colaborativo basado en usuarios e ítems
- Diseño y evaluación de motores de recomendaciones
Minería de Patrones Asociativos
- Conjuntos frecuentes y algoritmo Apriori
- Análisis de cesta de compras y razón lift
Detección de Outliers
- Análisis de valores extremos
- Métodos basados en distancia y densidad
- Detección de outliers en datos de alta dimensionalidad
Machine Learning Estudio de Caso
- Comprender el problema del negocio
- Preprocesamiento de datos y ingeniería de características
- Selección y ajuste de parámetros del modelo
- Evaluación y presentación de hallazgos
- Implementación
Resumen y Próximos Pasos
Requerimientos
- Comprensión básica de estadísticas y álgebra lineal
- Familiaridad con conceptos de análisis de datos o inteligencia empresarial
- Alguna exposición a la programación (preferiblemente en Python o R) es recomendada
- Interés en aprender machine learning aplicado para proyectos basados en datos
Publido objetivo
- Analistas y científicos de datos
- Estadísticos y profesionales de investigación
- Desarrolladores y profesionales IT explorando herramientas de machine learning
- Cualquiera involucrado en proyectos de ciencia de datos o análisis predictivo
Testimonios (3)
A pesar de tener que faltar un día debido a reuniones con clientes, siento que tengo una comprensión mucho más clara de los procesos y técnicas utilizados en Machine Learning y cuándo usaría una aproximación sobre otra. Nuestro desafío ahora es practicar lo que hemos aprendido y comenzar a aplicarlo a nuestro dominio de problemas.
Richard Blewett - Rock Solid Knowledge Ltd
Curso - Machine Learning – Data science
Traducción Automática
Me gusta que la formación se centrara en ejemplos y codificación. Pensaba que era imposible condensar tanta información en tres días de entrenamiento, pero me equivoqué. La formación abarcó muchos temas y todo se hizo de una manera muy detallada (especialmente el ajuste de los parámetros del modelo - no esperaba que hubiera tiempo para esto y quedé gratamente sorprendido).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática
Mostrando muchos métodos con guiones previamente preparados - materiales muy bien preparados y fáciles de rastrear
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática