ROCm para Windows
ROCm es una plataforma de código abierto para la programación de GPUs que admite GPUs AMD y también proporciona compatibilidad con CUDA y OpenCL. ROCm expone al programador los detalles del hardware y le brinda control total sobre el proceso de paralelización. Sin embargo, esto también requiere una buena comprensión de la arquitectura del dispositivo, el modelo de memoria, el modelo de ejecución y las técnicas de optimización.
ROCm para Windows es un desarrollo reciente que permite a los usuarios instalar y usar ROCm en el sistema operativo Windows, que es ampliamente utilizado con fines personales y profesionales. ROCm para Windows permite a los usuarios aprovechar el poder de las GPUs AMD para diversas aplicaciones, como inteligencia artificial, juegos, gráficos y computación científica.
Esta formación en vivo guiada por un instructor (en línea o presencial) está dirigida a desarrolladores de nivel principiante a intermedio que desean instalar y usar ROCm en Windows para programar GPUs AMD y explotar su paralelismo.
Al finalizar esta formación, los participantes podrán:
- Configurar un entorno de desarrollo que incluya la plataforma ROCm, una GPU AMD y Visual Studio Code en Windows.
- Crear un programa básico de ROCm que realice la suma de vectores en la GPU y recupere los resultados de la memoria de la GPU.
- Utilizar la API de ROCm para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, ejecutar kernels y sincronizar hilos.
- Usar el lenguaje HIP para escribir kernels que se ejecutan en la GPU y manipulan datos.
- Usar funciones integradas, variables y bibliotecas de HIP para realizar tareas y operaciones comunes.
- Usar los espacios de memoria de ROCm y HIP, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria.
- Usar los modelos de ejecución de ROCm y HIP para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
- Depurar y probar programas de ROCm y HIP utilizando herramientas como ROCm Debugger y ROCm Profiler.
- Optimizar programas de ROCm y HIP utilizando técnicas como coalescencia, almacenamiento en caché, prefetching y perfilado.
Formato del curso
- Lección interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinarlo.
Temario del curso
Introducción
- ¿Qué es ROCm?
- ¿Qué es HIP?
- ROCm vs CUDA vs OpenCL
- Descripción general de las características y arquitectura de ROCm y HIP
- ROCm para Windows vs ROCm para Linux
Instalación
- Instalación de ROCm en Windows
- Verificación de la instalación y comprobación de la compatibilidad del dispositivo
- Actualización o desinstalación de ROCm en Windows
- Solución de problemas comunes de instalación
Primeros pasos
- Creación de un nuevo proyecto ROCm utilizando Visual Studio Code en Windows
- Exploración de la estructura y los archivos del proyecto
- Compilación y ejecución del programa
- Visualización de la salida mediante printf y fprintf
API de ROCm
- Uso de la API de ROCm en el programa host
- Consulta de información y capacidades del dispositivo
- Asignación y liberación de memoria del dispositivo
- Copia de datos entre el host y el dispositivo
- Ejecución de kernels y sincronización de hilos
- Gestión de errores y excepciones
Lenguaje HIP
- Uso del lenguaje HIP en el programa de dispositivo
- Escritura de kernels que se ejecutan en la GPU y manipulan datos
- Uso de tipos de datos, calificadoradores, operadores y expresiones
- Uso de funciones integradas, variables y bibliotecas
Modelo de memoria de ROCm y HIP
- Uso de diferentes espacios de memoria, como global, compartido, constante y local
- Uso de diferentes objetos de memoria, como punteros, matrices, texturas y superficies
- Uso de diferentes modos de acceso a la memoria, como solo lectura, solo escritura, lectura-escritura, etc.
- Uso del modelo de consistencia de memoria y mecanismos de sincronización
Modelo de ejecución de ROCm y HIP
- Uso de diferentes modelos de ejecución, como hilos, bloques y cuadrículas
- Uso de funciones de hilo, como hipThreadIdx_x, hipBlockIdx_x, hipBlockDim_x, etc.
- Uso de funciones de bloque, como __syncthreads, __threadfence_block, etc.
- Uso de funciones de cuadrícula, como hipGridDim_x, hipGridSync, grupos cooperativos, etc.
Depuración
- Depuración de programas ROCm y HIP en Windows
- Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de ruptura, pila de llamadas, etc.
- Uso de ROCm Debugger para depurar programas ROCm y HIP en dispositivos AMD
- Uso de ROCm Profiler para analizar programas ROCm y HIP en dispositivos AMD
Optimización
- Optimización de programas ROCm y HIP en Windows
- Uso de técnicas de coalescencia para mejorar el ancho de banda de memoria
- Uso de técnicas de almacenamiento en caché y prefetching para reducir la latencia de memoria
- Uso de técnicas de memoria compartida y local para optimizar los accesos a la memoria y el ancho de banda
- Uso de perfilado y herramientas de perfilado para medir y mejorar el tiempo de ejecución y la utilización de recursos
Resumen y próximos pasos
Requerimientos
- Comprensión del lenguaje C/C++ y conceptos de programación paralela
- Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria
- Experiencia con herramientas de línea de comandos y editores de código
- Familiaridad con el sistema operativo Windows y PowerShell
Audiencia
- Desarrolladores que desean aprender a instalar y usar ROCm en Windows para programar GPUs AMD y explotar su paralelismo
- Desarrolladores que desean escribir código de alto rendimiento y escalable que pueda ejecutarse en diferentes dispositivos AMD
- Programadores que desean explorar los aspectos de bajo nivel de la programación de GPUs y optimizar el rendimiento de su código
Los cursos públicos requieren más de 5 participantes.
ROCm para Windows - Reserva
ROCm para Windows - Consulta
ROCm para Windows - Solicitud de consultoría
Próximos cursos
Cursos Relacionados
Desarrollo de aplicaciones con Huawei Ascend y CANN
21 HorasHuawei Ascend es una familia de procesadores de IA diseñados para inferencia y entrenamiento de alto rendimiento.
Esta capacitación en vivo dirigida por un instructor (en línea o presencial) está orientada a ingenieros de IA y científicos de datos de nivel intermedio que deseen desarrollar y optimizar modelos de redes neuronales utilizando la plataforma Ascend de Huawei y el kit de herramientas CANN.
Al finalizar esta capacitación, los participantes podrán:
- Configurar y preparar el entorno de desarrollo de CANN.
- Desarrollar aplicaciones de IA utilizando flujos de trabajo con MindSpore y CloudMatrix.
- Optimizar el rendimiento en NPUs Ascend mediante operadores personalizados y estrategias de partición (tiling).
- Implementar modelos en entornos edge o en la nube.
Formato del curso
- Clases interactivas y discusión grupal.
- Práctica con el kit de herramientas Huawei Ascend y CANN en aplicaciones de ejemplo.
- Ejercicios guiados centrados en la construcción, el entrenamiento y la implementación de modelos.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso según su infraestructura o conjuntos de datos, contáctenos para organizarla.
Despliegue de Modelos de IA con CANN y Procesadores de IA Ascend
14 HorasCANN (Compute Architecture for Neural Networks) es la pila de computación para inteligencia artificial de Huawei, diseñada para desplegar y optimizar modelos de IA en procesadores de IA Ascend.
Esta formación impartida por un instructor (en línea o presencial) está dirigida a desarrolladores e ingenieros de IA de nivel intermedio que deseen implementar de manera eficiente modelos de IA entrenados en hardware Huawei Ascend, utilizando la herramienta CANN junto con frameworks como MindSpore, TensorFlow o PyTorch.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura de CANN y su papel en el pipeline de despliegue de IA.
- Convertir y adaptar modelos provenientes de frameworks populares a formatos compatibles con Ascend.
- Utilizar herramientas como ATC, la conversión de modelos OM y MindSpore para inferencia en edge (dispositivos periféricos) y en la nube.
- Diagnosticar problemas de implementación y optimizar el rendimiento en hardware Ascend.
Formato del Curso
- Clase interactiva y demostraciones prácticas.
- Prácticas de laboratorio utilizando herramientas CANN y simuladores o dispositivos Ascend.
- Escenarios prácticos de implementación basados en modelos de IA del mundo real.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
Inferencia y despliegue de IA con CloudMatrix
21 HorasCloudMatrix es la plataforma unificada de Huawei para el desarrollo y despliegue de inteligencia artificial, diseñada para respaldar pipelines de inferencia escalables y de calidad productiva.
Este taller impartido por instructores (en línea o presencial) está dirigido a profesionales de IA de nivel principiante a intermedio que deseen desplegar y monitorear modelos de inteligencia artificial utilizando la plataforma CloudMatrix con integración de CANN y MindSpore.
Al finalizar esta formación, los participantes serán capaces de:
- Utilizar CloudMatrix para empaquetado, despliegue y servicio de modelos.
- Convertir y optimizar modelos para conjuntos de chips Ascend.
- Configurar pipelines para tareas de inferencia en tiempo real y por lotes.
- Monitorear despliegues y ajustar el rendimiento en entornos de producción.
Formato del curso
- Conferencia interactiva y debate.
- Práctica directa con CloudMatrix mediante escenarios reales de despliegue.
- Ejercicios guiados enfocados en la conversión, optimización y escalado.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso según su infraestructura de IA o entorno en la nube, contáctenos para coordinarlo.
Programación de GPU en Aceleradores Biren AI
21 HorasLos aceleradores GPU Biren AI son GPUs de alto rendimiento diseñadas para cargas de trabajo de IA y HPC, con soporte para entrenamiento e inferencia a gran escala.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de nivel intermedio a avanzado que deseen programar y optimizar aplicaciones utilizando la pila GPU propietaria de Biren, con comparaciones prácticas frente a entornos basados en CUDA.
Al finalizar esta formación, los participantes podrán:
- Comprender la arquitectura GPU de Biren y su jerarquía de memoria.
- Configurar el entorno de desarrollo y utilizar el modelo de programación de Biren.
- Traducir y optimizar código estilo CUDA para plataformas Biren.
- Aplicar técnicas de ajuste de rendimiento y depuración.
Formato del curso
- Conferencia interactiva y discusión.
- Uso práctico del SDK de Biren en cargas de trabajo GPU de muestra.
- Ejercicios guiados centrados en el portado y el ajuste de rendimiento.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso según tu pila de aplicaciones o necesidades de integración, por favor contáctanos para coordinarlo.
Desarrollo en Cambricon MLU con BANGPy y Neuware
21 HorasLas unidades de aprendizaje automático (MLU) de Cambricon son chips de IA especializados, optimizados para inferencia y entrenamiento en escenarios de borde y centros de datos.
Esta formación impartida por instructores (en línea o presencial) está dirigida a desarrolladores de nivel intermedio que desean construir y desplegar modelos de IA utilizando el framework BANGPy y el SDK de Neuware en hardware Cambricon MLU.
Al finalizar esta capacitación, los participantes serán capaces de:
- Configurar y preparar los entornos de desarrollo de BANGPy y Neuware.
- Desarrollar y optimizar modelos basados en Python y C++ para las MLU de Cambricon.
- Desplegar modelos en dispositivos de borde y centros de datos que ejecuten el entorno de ejecución de Neuware.
- Integrar flujos de trabajo de aprendizaje automático con funciones de aceleración específicas para MLU.
Formato del curso
- Clase interactiva y debate.
- Práctica directa con BANGPy y Neuware para el desarrollo y despliegue.
- Ejercicios guiados enfocados en optimización, integración y pruebas.
Opciones de personalización del curso
- Para solicitar una formación personalizada basada en su modelo de dispositivo Cambricon o caso de uso, contáctenos para coordinarlo.
Introducción a CANN para Desarrolladores de Frameworks de IA
7 HorasCANN (Compute Architecture for Neural Networks) es el kit de herramientas de computación de inteligencia artificial de Huawei, utilizado para compilar, optimizar y desplegar modelos de IA en procesadores AI Ascend.
Esta capacitación impartida por un instructor, disponible en modalidad online o presencial, está dirigida a desarrolladores de IA de nivel principiante que deseen comprender cómo CANN se integra en el ciclo de vida del modelo, desde el entrenamiento hasta el despliegue, y cómo funciona junto con frameworks como MindSpore, TensorFlow y PyTorch.
Al finalizar esta capacitación, los participantes podrán:
- Comprender el propósito y la arquitectura del kit de herramientas CANN.
- Configurar un entorno de desarrollo con CANN y MindSpore.
- Convertir y desplegar un modelo de IA sencillo en hardware Ascend.
- Adquirir conocimientos fundamentales para futuros proyectos de optimización o integración con CANN.
Formato del Curso
- Clase interactiva y discusión en grupo.
- Prácticas con despliegue de modelos sencillos.
- Guía paso a paso del toolchain de CANN y los puntos de integración.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar los detalles.
CANN para la implementación de IA en el borde
14 HorasEl kit de herramientas Ascend CANN de Huawei permite una potente inferencia de IA en dispositivos de borde, como el Ascend 310. CANN proporciona las herramientas esenciales para compilar, optimizar y desplegar modelos en entornos con recursos limitados de cómputo y memoria.
Esta formación impartida por un instructor (en línea o presencial) está dirigida a desarrolladores e integradores de IA de nivel intermedio que deseen desplegar y optimizar modelos en dispositivos de borde Ascend utilizando el conjunto de herramientas CANN.
Al finalizar esta formación, los participantes podrán:
- Preparar y convertir modelos de IA para el Ascend 310 utilizando las herramientas de CANN.
- Construir pipelines de inferencia ligeros utilizando MindSpore Lite y AscendCL.
- Optimizar el rendimiento del modelo en entornos con recursos limitados de cómputo y memoria.
- Desplegar y monitorear aplicaciones de IA en casos de uso reales en el borde.
Formato del curso
- Clase interactiva con demostraciones.
- Laboratorios prácticos con modelos y escenarios específicos para el borde.
- Ejemplos de despliegue en tiempo real sobre hardware de borde virtual o físico.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinarlo.
Comprendiendo la Pila de Cómputo con IA de Huawei: De CANN a MindSpore
14 HorasLa pila de IA de Huawei, que abarca desde el SDK CANN de bajo nivel hasta el framework MindSpore de alto nivel, ofrece un entorno de desarrollo y despliegue de IA estrechamente integrado y optimizado para el hardware Ascend.
Esta capacitación en vivo con instrucción (en línea o presencial) está dirigida a profesionales técnicos de nivel principiante e intermedio que desean comprender cómo los componentes CANN y MindSpore trabajan conjuntamente para administrar el ciclo de vida de la IA y tomar decisiones sobre la infraestructura.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura por capas de la pila de cómputo con IA de Huawei.
- Identificar cómo CANN respalda la optimización de modelos y el despliegue a nivel de hardware.
- Evaluar el framework MindSpore y su cadena de herramientas en relación con las alternativas del mercado.
- Ubicar la pila de IA de Huawei dentro de entornos empresariales o de nube/infraestructura propia.
Formato del Curso
- Conferencia interactiva y debates.
- Demostraciones en vivo del sistema y recorridos basados en casos prácticos.
- Laboratorios guiados opcionales sobre el flujo de modelos desde MindSpore hasta CANN.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinarla.
Optimización del rendimiento de redes neuronales con CANN SDK
14 HorasCANN SDK (Compute Architecture for Neural Networks) es la base de computación para IA de Huawei que permite a los desarrolladores ajustar y optimizar el rendimiento de las redes neuronales implementadas en procesadores de IA Ascend.
Esta capacitación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de IA de nivel avanzado e ingenieros de sistemas que desean optimizar el rendimiento de inferencia utilizando el conjunto avanzado de herramientas de CANN, incluyendo el Motor de Gráficos, TIK y desarrollo de operadores personalizados.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura en tiempo de ejecución y el ciclo de vida del rendimiento de CANN.
- Utilizar herramientas de perfilado y el Motor de Gráficos para análisis y optimización del rendimiento.
- Crear y optimizar operadores personalizados utilizando TIK y TVM.
- Resolver cuellos de botella de memoria y mejorar el flujo de procesamiento de modelos.
Formato del curso
- Clase interactiva y discusión.
- Laboratorios prácticos con perfilado en tiempo real y ajuste de operadores.
- Ejercicios de optimización utilizando ejemplos de implementación en casos extremos.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarla.
SDK CANN para Pipelines de Visión por Computadora y PLN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) ofrece herramientas potentes de implementación y optimización para aplicaciones de IA en tiempo real en visión por computadora y PLN, especialmente en hardware Huawei Ascend.
Esta capacitación en vivo con instructor (en línea o presencial) está dirigida a profesionales de IA de nivel intermedio que deseen construir, implementar y optimizar modelos de visión e idioma utilizando el SDK CANN para casos de uso productivos.
Al finalizar esta capacitación, los participantes serán capaces de:
- Implementar y optimizar modelos CV y PLN usando CANN y AscendCL.
- Utilizar las herramientas CANN para convertir modelos e integrarlos en pipelines en vivo.
- Optimizar el rendimiento de inferencia para tareas como detección, clasificación y análisis de sentimientos.
- Construir pipelines CV/PLN en tiempo real para escenarios de implementación en bordes o en la nube.
Formato del Curso
- Conferencia interactiva y demostración.
- Laboratorio práctico con implementación de modelos y perfilamiento de rendimiento.
- Diseño de pipelines en vivo utilizando casos de uso reales de CV y PLN.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para gestionarla.
Construcción de Operadores de IA Personalizados con CANN TIK y TVM
14 HorasCANN TIK (Tensor Instruction Kernel) y Apache TVM permiten la optimización avanzada y la personalización de operadores de modelos de IA para el hardware Huawei Ascend.
Esta formación en vivo con instructores (en línea o presencial) está dirigida a desarrolladores de sistemas de nivel avanzado que deseen construir, implementar y ajustar operadores personalizados para modelos de IA utilizando el modelo de programación TIK de CANN y la integración del compilador TVM.
Al finalizar esta formación, los participantes serán capaces de:
- Escribir y probar operadores personalizados de IA usando el DSL de TIK para procesadores Ascend.
- Integrar operadores personalizados en el tiempo de ejecución de CANN y en el gráfico de ejecución.
- Usar TVM para la programación, ajuste automático y evaluación comparativa de operadores.
- Depurar y optimizar el rendimiento a nivel de instrucciones para patrones de cómputo personalizados.
Formato del curso
- Expositivo interactivo y demostración práctica.
- Codificación práctica de operadores utilizando los pipelines de TIK y TVM.
- Pruebas y ajuste en hardware Ascend o en simuladores.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinarla.
Migración de Aplicaciones CUDA a Arquitecturas GPU Chinas
21 HorasLas arquitecturas de GPU chinas, como Huawei Ascend, Biren y los MLU de Cambricon, ofrecen alternativas a CUDA adaptadas para los mercados locales de inteligencia artificial y computación de alto rendimiento.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a programadores de GPU y especialistas en infraestructura de nivel avanzado que deseen migrar y optimizar aplicaciones CUDA existentes para su implementación en plataformas de hardware chinas.
Al finalizar esta formación, los participantes podrán:
- Evaluar la compatibilidad de las cargas de trabajo de CUDA existentes con las alternativas de chips chinos.
- Portar bases de código CUDA a entornos como Huawei CANN, Biren SDK y Cambricon BANGPy.
- Comparar el rendimiento e identificar puntos de optimización entre plataformas.
- Afrontar los desafíos prácticos en el soporte y despliegue entre diferentes arquitecturas.
Formato del Curso
- Clases interactivas y debate.
- Talleres prácticos de traducción de código y comparación de rendimiento.
- Ejercicios guiados centrados en estrategias de adaptación multi-GPU.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso basada en su plataforma o proyecto CUDA, póngase en contacto con nosotros para coordinarlo.
Optimización del Rendimiento en Ascend, Biren y Cambricon
21 HorasAscend, Biren y Cambricon son plataformas de hardware de inteligencia artificial líderes en China, cada una ofreciendo herramientas únicas de aceleración y perfilado para cargas de trabajo de IA a escala de producción.
Esta formación práctica (online o presencial) está dirigida a ingenieros avanzados de infraestructura de IA y rendimiento que deseen optimizar los flujos de trabajo de inferencia y entrenamiento de modelos en múltiples plataformas de chips de IA chinos.
Al finalizar esta formación, los participantes podrán:
- Ejecutar benchmarks de modelos en las plataformas Ascend, Biren y Cambricon.
- Identificar cuellos de botella del sistema e ineficiencias de memoria/cómputo.
- Aplicar optimizaciones a nivel de grafo, de kernel y de operador.
- Ajustar los pipelines de implementación para mejorar el throughput (ancho de banda) y la latencia.
Formato del Curso
- Clase interactiva y discusión.
- Uso práctico de herramientas de perfilado y optimización en cada plataforma.
- Ejercicios guiados centrados en escenarios prácticos de ajuste.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso basada en su entorno de rendimiento o tipo de modelo, por favor contáctenos para coordinar.