Programa del Curso
Sección 1: Data Management en HDFS
- Varios formatos de datos (JSON / Avro / Parquet)
- Esquemas de compresión
- Enmascaramiento de datos
- Laboratorios : Análisis de diferentes formatos de datos; Habilitación de la compresión
Sección 2: Cerdo Avanzado
- Funciones definidas por el usuario
- Introducción a las Bibliotecas de Cerdos (ElephantBird / Data-Fu)
- Carga de datos estructurados complejos con Pig
- Afinación de cerdos
- Labs: secuencias de comandos pig avanzadas, análisis de tipos de datos complejos
Sección 3 : Avanzado Hive
- Funciones definidas por el usuario
- Tablas comprimidas
- Hive Ajuste del rendimiento
- Labs: creación de tablas comprimidas, evaluación de formatos de tabla y configuración
Sección 4 : HBasa avanzada
- Modelado de esquemas avanzado
- Compresión
- Ingesta masiva de datos
- Comparación de mesa ancha / mesa alta
- HBase y Cerdo
- HBase y Hive
- Ajuste del rendimiento de HBase
- Laboratorios: afinación de HBase; acceder a los datos de HBase de Pig & Hive; Uso de Phoenix para el modelado de datos
Requerimientos
- Cómodo con el lenguaje de programación Java (la mayoría de los ejercicios de programación están en Java)
- Cómodo en el entorno Linux (ser capaz de navegar por la línea de comandos Linux, editar archivos usando VI / Nano)
- un conocimiento práctico de Hadoop.
Entorno de laboratorio
Instalación cero: ¡ No es necesario instalar el software Hadoop en las máquinas de los estudiantes! Se proporcionará un clúster de Hadoop en funcionamiento para los estudiantes.
Los estudiantes necesitarán lo siguiente
- un cliente SSH (Linux y Mac ya tienen clientes ssh, para Windows se recomienda Utty )
- un navegador para acceder al clúster. Recomendamos el navegador Firefox
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Durante los ejercicios, James me explicó cada paso en detalle donde me estaba atascando. Yo era completamente nuevo en NIFI. Él explicó el propósito real de NIFI, incluso conceptos básicos como ser código abierto. Cubrió todos los conceptos de Nifi, desde nivel principiante hasta nivel desarrollador.
Firdous Hashim Ali - MOD A BLOCK
Curso - Apache NiFi for Administrators
Traducción Automática
Preparación y organización del formador, y calidad de los materiales proporcionados en GitHub.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
Traducción Automática
Que lo tuviera en primer lugar.
Peter Scales - CACI Ltd
Curso - Apache NiFi for Developers
Traducción Automática
cosas prácticas de hacer, también teoría fue bien servida por Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Traducción Automática