Temario del curso
Introducción
- Apache Spark vs Hadoop MapReduce
Resumen de las características y arquitectura de Apache Spark
Elegir un lenguaje de programación
Configurar Apache Spark
Crear una aplicación de ejemplo
Elegir el conjunto de datos
Realizar análisis de datos en el conjunto de datos
Procesamiento de datos estructurados con Spark SQL
Procesamiento de datos en streaming con Spark Streaming
Integrar Apache Spark con herramientas de aprendizaje automático de terceros
Usar Apache Spark para el procesamiento de grafos
Optimizar Apache Spark
Resolución de problemas
Resumen y conclusión
Requerimientos
- Experiencia con la línea de comandos de Linux
- Comprensión general del procesamiento de datos
- Experiencia en programación con Java, Scala, Python o R
Audiencia
- Desarrolladores
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre Spark Streaming, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática