Contacta con nosotros

Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional versus observabilidad impulsada por AIOps
  • Arquitectura de AIOps y componentes clave

Recolección y normalización de datos operativos

  • Tipos de datos de observabilidad: métricas, registros y trazas
  • Ingesta de datos desde múltiples fuentes (servidores, contenedores, nube)
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd)

Correlación de datos y detección de anomalías

  • Correlación de series temporales y métodos estadísticos
  • Uso de modelos de aprendizaje automático para detectar anomalías
  • Detección de incidentes en sistemas distribuidos

Alertado y reducción de ruido

  • Diseño de reglas umbral inteligentes para alertas
  • Supresión, desduplicación y agrupamiento de alertas
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie

Análisis de causa raíz y visualización

  • Uso de paneles para visualizar métricas y detectar tendencias
  • Exploración de eventos y líneas temporales para el análisis de causa raíz
  • Rastreo de problemas a través de capas con herramientas de trazado distribuido

Automatización y remediación

  • Activación de scripts o flujos de trabajo automatizados a partir de incidentes
  • Integración con sistemas de gestión de servicios (ServiceNow, Jira)
  • Casos de uso: autocuración, escalado y redistribución del tráfico

Plataformas AIOps de código abierto y comerciales

  • Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Criterios de evaluación para seleccionar una plataforma AIOps
  • Demostración y práctica con un stack seleccionado

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de operaciones de TI y monitoreo de sistemas
  • Experiencia con herramientas o paneles de monitoreo
  • Familiaridad con formatos básicos de registros y métricas

Público objetivo

  • Equipos de operaciones responsables de infraestructura y aplicaciones
  • Ingenieros de Fiabilidad del Sitio (SRE)
  • Equipos de monitoreo y observabilidad de TI
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas