Temario del curso
Sección 1: Gestión de Datos en HDFS
- Varios Formatos de Datos (JSON / Avro / Parquet)
- Esquemas de Compresión
- Mascaramiento de Datos
- Laboratorios: Analizar diferentes formatos de datos; habilitar compresión
Sección 2: Pig Avanzado
- Funciones Definidas por el Usuario
- Introducción a Bibliotecas de Pig (ElephantBird / Data-Fu)
- Carga de Datos Estructurados Complejos usando Pig
- Ajuste de Pig
- Laboratorios: scripting avanzado en Pig, analizar tipos de datos complejos
Sección 3: Hive Avanzado
- Funciones Definidas por el Usuario
- Tablas Comprimidas
- Ajuste de Rendimiento en Hive
- Laboratorios: crear tablas comprimidas, evaluar formatos y configuración de tablas
Sección 4: HBase Avanzado
- Modelado de Esquemas Avanzado
- Compresión
- Ingesta de Datos en Bloque
- Comparación entre Tablas Anchas y Altas
- HBase y Pig
- HBase y Hive
- Ajuste de Rendimiento en HBase
- Laboratorios: ajustar HBase; acceder a datos de HBase desde Pig & Hive; Usar Phoenix para el modelado de datos
Requerimientos
- familiaridad con el lenguaje de programación Java (la mayoría de los ejercicios de programación están en Java)
- comodidad en un entorno Linux (capacidad para navegar por la línea de comandos de Linux, editar archivos usando vi/nano)
- conocimientos prácticos de Hadoop.
Entorno del laboratorio
Cero Instalación: ¡No es necesario instalar software de Hadoop en las máquinas de los estudiantes! Se proporcionará un clúster de Hadoop funcional para los estudiantes.
Los estudiantes necesitarán lo siguiente
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Durante los ejercicios, James me explicó cada paso con más detalle siempre que me quedaba atascado. Era completamente nuevo en NIFI. Me explicó el propósito real de NIFI, incluso conceptos básicos como open source. Cubrió todos los conceptos de Nifi, desde el nivel principiante hasta el nivel desarrollador.
Firdous Hashim Ali - MOD A BLOCK
Curso - Apache NiFi for Administrators
Traducción Automática
Que lo tuviera en primer lugar.
Peter Scales - CACI Ltd
Curso - Apache NiFi for Developers
Traducción Automática
aspectos prácticos de hacerlo, y también la teoría fue bien explicada por Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Traducción Automática
Me gustó mucho la VM. El profesor tenía un conocimiento muy profundo no solo del tema principal sino también de otros temas; además, era muy amable y agradable. También me gustó las instalaciones en Dubái.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
Traducción Automática