Programa del Curso
Introducción a Apache Spark
- El papel de Spark en el procesamiento de big data
- Arquitectura de Spark y sus componentes
Configuración Apache Spark
- Requisitos de hardware y software
- Procedimientos de instalación para los modos autónomo y de clúster
- Prácticas recomendadas de configuración para administradores de sistemas
Administración de clústeres de Spark
- Herramientas y técnicas de gestión de clústeres
- Supervisión de aplicaciones de Spark y recursos de clúster
- Configuraciones de seguridad y gestión de usuarios
Ajuste y optimización del rendimiento
- Asignación y programación de recursos
- Tuning Spark para un rendimiento óptimo
- Identificación y resolución de cuellos de botella comunes
Solución de problemas y resolución de problemas
- Desafíos comunes de la administración de Spark
- Herramientas y técnicas de diagnóstico para la resolución de problemas
- Enfoque paso a paso para resolver problemas comunes
- Procedimientos recomendados para mantener un entorno de Spark saludable
Temas de Administración Avanzada
- Integración con otras herramientas de big data
- Garantizar la alta disponibilidad y la recuperación ante desastres
- Actualización y escalado de clústeres de Spark
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de configuración y gestión de redes
- Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
- Interés en aprender sobre sistemas de computación distribuida y gestión de big data
Audiencia
- Administradores de sistemas
Testimonios (5)
Un montón de ejemplos prácticos, diferentes formas de abordar un mismo problema, y a veces trucos no tan obvios de cómo mejorar la solución actual
Rafal - Nordea
Curso - Apache Spark MLlib
Traducción Automática
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre Spark Streaming, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática