Temario del curso
Introducción
Visión general de los enfoques de acceso a datos (Hive, bases de datos, etc.)
Visión general de las características y la arquitectura de Spark
Instalación y configuración de Spark
Comprensión de Dataframes en Spark
Definición de tablas e importación de conjuntos de datos
Consulta de DataFrames utilizando SQL
Ejecución de agregaciones, JOINs y consultas anidadas
Carga y acceso a datos
Consulta de diferentes tipos de datos
- JSON, Parquet, etc.
Consulta de Data Lakes con SQL
Solución de problemas
Resumen y conclusión
Requerimientos
- Experiencia con consultas SQL
- Experiencia en programación en cualquier lenguaje
Audiencia
- Analistas de datos
- Científicos de datos
- Ingenieros de datos
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre Spark Streaming, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática