Web Scraping con Python
El Web Scraping es una técnica para extraer datos de un sitio web y luego guardarlos en un archivo o base de datos local.
Esta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a desarrolladores que desean utilizar Python para automatizar el proceso de rastreo de muchos sitios web para extraer datos para su procesamiento y análisis.
Al final de esta formación, los participantes serán capaces de:
- Instalar y configurar Python y todos los paquetes relevantes.
- Recuperar y analizar datos almacenados en muchos sitios web.
- Comprender cómo funcionan los sitios web y cómo está estructurado su HTML.
- Construir arañas para rastrear la web a gran escala.
- Utilizar Selenium para rastrear páginas web impulsadas por AJAX.
Formato del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y prácticas.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Este curso asume conocimientos de programación.
- Para solicitar una formación personalizada para este curso, por favor contáctenos para organizarlo.
Temario del curso
Introducción
Configuración del entorno de desarrollo
Python Cartilla: Estructuras de Datos, Condicionales, Manejo de Archivos, etc.
Python Paquetes para Web Scraping: Scrapy y BeautifulSoup
Cómo funciona un sitio web
Cómo se estructura HTML
Hacer una solicitud web
Raspado de una página HTML
Trabajar con XPath y CSS
Filtrado de datos mediante iones Express regulares
Creación de un rastreador web
Rastreo de páginas AJAX y JavaScript con Selenium.
Mejores prácticas de Web Scraping
Solución de problemas
Resumen y conclusión
Requerimientos
- Programming experiencia, preferiblemente en Python. Si los participantes tienen experiencia en programación en un lenguaje distinto a Python, la capacitación puede extenderse para incluir más ejercicios introductorios de Python.
Audiencia
- Desarrolladores
Los cursos públicos requieren más de 5 participantes.
Web Scraping con Python - Reserva
Web Scraping con Python - Consulta
Web Scraping con Python - Solicitud de consultoría
Solicitud de consultoría
Testimonios (1)
Muchos ejemplos y temas diferentes han sido cubiertos, desde investigaciones básicas hasta la gestión de inicio de sesión y la administración de páginas dinámicas.
Daniele Tagliaferro - Creditsafe Italia Srl
Curso - Web Scraping with Python
Traducción Automática
Próximos cursos
Cursos Relacionados
Escalando el Análisis de Datos con Python y Dask
14 HorasEsta capacitación guiada por un instructor (en línea o presencial) en Argentina está dirigida a científicos de datos e ingenieros de software que deseen utilizar Dask con el ecosistema de Python para construir, escalar y analizar grandes conjuntos de datos.
Al final de esta formación, los participantes podrán:
- Configurar el entorno para comenzar a procesar big data con Dask y Python.
- Explorar las características, bibliotecas, herramientas y APIs disponibles en Dask.
- Comprender cómo Dask acelera la computación paralela en Python.
- Aprender a escalar el ecosistema de Python (Numpy, SciPy y Pandas) utilizando Dask.
- Optimizar el entorno de Dask para mantener un alto rendimiento al manejar grandes conjuntos de datos.
Análisis de Datos en Python Usando Pandas y Numpy
14 HorasEsta formación en vivo dirigida por un instructor en Argentina (en línea o presencial) está destinada a desarrolladores y analistas de datos de nivel intermedio que desean mejorar sus habilidades en el análisis y manipulación de datos usando Python, Pandas y NumPy.
Al finalizar esta formación, los participantes podrán:
- Configurar un entorno de desarrollo que incluya Python, Pandas y NumPy.
- Crear una aplicación de análisis de datos utilizando Pandas y NumPy.
- Ejecutar operaciones avanzadas de manipulación, ordenación y filtrado de datos.
- Realizar operaciones agregadas y analizar datos de series temporales.
- Visualizar datos usando Matplotlib y otras bibliotecas de visualización.
- Depurar y optimizar su código de análisis de datos.
FARM (FastAPI, React y MongoDB) Desarrollo de Full Stack
14 HorasEsta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a desarrolladores que desean utilizar la pila FARM (FastAPI, React y MongoDB) para crear aplicaciones web dinámicas, de alto rendimiento y escalables.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno de desarrollo necesario que integre FastAPI, React y MongoDB.
- Comprenda los conceptos clave, las características y los beneficios de la pila FARM.
- Aprenda a crear API REST con FastAPI.
- Aprenda a diseñar aplicaciones interactivas con React.
- Desarrolle, pruebe e implemente aplicaciones (front-end y back-end) mediante la pila FARM.
Desarrollando APIs con Python y FastAPI
14 HorasEsta capacitación en vivo dirigida por un instructor en Argentina (en línea o presencial) está dirigida a desarrolladores que desean usar FastAPI con Python para crear, probar e implementar API RESTful de manera más fácil y rápida.
Al final de esta formación, los participantes serán capaces de:
- Configurar el entorno de desarrollo necesario para desarrollar APIs con Python y FastAPI.
- Crear APIs de forma más rápida y sencilla utilizando la biblioteca FastAPI.
- Aprender a crear modelos de datos y esquemas basados en Pydantic y OpenAPI.
- Conectar APIs a una base de datos utilizando SQLAlchemy.
- Implementar seguridad y autenticación en APIs utilizando las herramientas de FastAPI.
- Crear imágenes de contenedor e implementar APIs web en un servidor en la nube.
Fundamentos de Aprendizaje Automático con Python
14 HorasEl objetivo de este curso es proporcionar una competencia básica en la aplicación de métodos Machine Learning en la práctica. A través del uso del lenguaje de programación Python y sus diversas bibliotecas, y basado en una multitud de ejemplos prácticos, este curso enseña cómo usar los bloques de construcción más importantes de Machine Learning, cómo tomar decisiones de modelado de datos, interpretar las salidas de los algoritmos y validar los resultados.
Nuestro objetivo es brindarle las habilidades para comprender y usar las herramientas más fundamentales de la caja de herramientas Machine Learning con confianza y evitar las trampas comunes de las aplicaciones de Data Science.
Aprendizaje Automático con Python – 4 Días
28 Horasel objetivo de este curso es proporcionar una competencia general en la aplicación de métodos de aprendizaje automático en la práctica. Mediante el uso del lenguaje de programación Python y sus diversas bibliotecas, y basado en una multitud de ejemplos prácticos, este curso enseña cómo utilizar los bloques de construcción más importantes del aprendizaje automático, cómo tomar decisiones de modelado de datos, interpretar el las salidas de los algoritmos y validar los resultados.
nuestro objetivo es darle las habilidades para entender y utilizar las herramientas más fundamentales de la caja de herramientas machine learning con confianza y evitar las trampas comunes de las aplicaciones de Ciencias de la información.
Acelerando los Flujos de Trabajo de Python Pandas con Modin
14 HorasEsta capacitación en vivo dirigida por un instructor en Argentina (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean usar Modin para crear e implementar cálculos paralelos con Pandas para un análisis de datos más rápido.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno necesario para comenzar a desarrollar Pandas flujos de trabajo a escala con Modin.
- Comprender las características, la arquitectura y las ventajas de Modin.
- Conoce las diferencias entre Modin, Dask y Ray.
- Realice Pandas operaciones más rápido con Modin.
- Implemente toda la API Pandas y las funciones.
Python para la Generación de Lenguaje Natural
21 HorasEn este entrenamiento en vivo dirigido por un instructor en Argentina, los participantes aprenderán a utilizar Python para producir texto de alta calidad en lenguaje natural creando su propio sistema NLG desde cero. También se examinarán estudios de caso y se aplicarán conceptos relevantes a proyectos prácticos de laboratorio para generar contenido.
Al finalizar este entrenamiento, los participantes podrán:
- Utilizar NLG para generar automáticamente contenido en diversas industrias, desde el periodismo hasta la inmobiliaria y la prensa deportiva y meteorológica.
- Seleccionar y organizar el contenido fuente, planificar oraciones y preparar un sistema para la generación automática de contenido original.
- Comprender la cadena de producción NLG y aplicar las técnicas adecuadas en cada etapa.
- Entender la arquitectura de un sistema Natural Language Generation (NLG).
- Implementar los algoritmos y modelos más apropiados para análisis y ordenación.
- Extraer datos de fuentes públicas y bases de datos curadas para utilizar como material del texto generado.
- Reemplazar procesos manuales y laboriosos de escritura con la creación automática de contenido generada por computadora.
Python para el Aprendizaje Automático Avanzado
21 HorasEn este curso dirigido por un instructor y en vivo en Argentina, los participantes aprenderán las técnicas de machine learning más relevantes y avanzadas en Python mientras construyen una serie de aplicaciones demo que involucran imágenes, música, texto y datos financieros.
Al finalizar este entrenamiento, los participantes serán capaces de:
- Implementar algoritmos y técnicas de machine learning para resolver problemas complejos.
- Aplicar deep learning y aprendizaje semi-supervisado a aplicaciones que involucran imágenes, música, texto y datos financieros.
- Llevar los algoritmos de Python a su máximo potencial.
- Utilizar bibliotecas y paquetes como NumPy y Theano.
Python: automatiza las cosas aburridas
14 HorasEsta capacitación en vivo dirigida por un instructor en Argentina se basa en el popular libro "Automate the Boring Stuff with Python", de Al Sweigart. Está dirigido a principiantes y cubre conceptos esenciales Python de programación a través de ejercicios prácticos y discusiones. La atención se centra en aprender a escribir código para aumentar drásticamente la productividad de la oficina.
Al final de esta formación, los participantes sabrán cómo programar en Python y aplicar esta nueva habilidad para:
- Automatizar tareas escribiendo simples programas en Python.
- Escribir programas que puedan reconocer patrones de texto con "expresiones regulares".
- Generar y actualizar hojas de cálculo Excel de forma programática.
- Analizar archivos PDF y documentos Word.
- Explorar sitios web y extraer información de fuentes en línea.
- Escribir programas que envíen notificaciones por correo electrónico.
- Utilizar las herramientas de depuración de Python para resolver errores rápidamente.
- Controlar el ratón y el teclado de forma programática para hacer clics y escribir por usted.
Programación Python para Finanzas
35 HorasPython es un lenguaje de programación que ha ganado gran popularidad en la industria financiera. Adoptado por los mayores bancos de inversión y fondos de cobertura, se está utilizando para crear una amplia gama de aplicaciones financieras que van desde programas de negociación básicos hasta sistemas de gestión de riesgos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Python para desarrollar aplicaciones prácticas para resolver una serie de problemas específicos relacionados con las finanzas.
Al final de esta formación, los participantes serán capaces de:
- Comprender los fundamentos del lenguaje de programación Python
- Descargar, instalar y mantener las mejores herramientas de desarrollo para crear aplicaciones financieras en Python
- Seleccionar y utilizar los paquetes y técnicas de programación más adecuados de Python para organizar, visualizar y analizar datos financieros de diversas fuentes (CSV, Excel, bases de datos, web, etc.)
- Construir aplicaciones que resuelvan problemas relacionados con la asignación de activos, el análisis de riesgos, el rendimiento de las inversiones y más
- Solucionar problemas, integrar, implementar y optimizar una aplicación en Python
Audiencia
- Desarrolladores
- Analistas
- Quants
Formato del curso
- Parte teórica, parte discusión, ejercicios y práctica intensiva
Nota
- Esta capacitación tiene como objetivo proporcionar soluciones para algunos de los principales problemas que enfrentan los profesionales de las finanzas. Sin embargo, si tiene un tema, herramienta o técnica en particular que desee agregar o ampliar, por favor contáctenos para organizarlo.
Python Avanzado
28 HorasEste curso de formación en vivo dirigido por un instructor en Argentina (en línea o presencial) está destinado a desarrolladores que deseen aprender técnicas avanzadas de programación en Python, incluyendo cómo aplicar este lenguaje versátil para resolver problemas en áreas como aplicaciones distribuidas, análisis y visualización de datos, programación de interfaces de usuario (UI) y scripting de mantenimiento.
Programación Python
28 HorasEste curso está diseñado para aquellos que deseen aprender el lenguaje de programación de Python. El énfasis está en el lenguaje Python, las bibliotecas principales, así como en la selección de las mejores y más útiles bibliotecas desarrolladas por la comunidad Python. Python impulsa las empresas y es utilizado por científicos de todo el mundo, es uno de los lenguajes de programación más populares.
El curso puede ser entregado usando Python 2.7.x o 3.x, con ejercicios prácticos haciendo uso de la potencia total de ambas versiones del lenguaje. Este curso puede ser entregado en cualquier sistema operativo (todos los sabores de UNIX, incluyendo Linux y Mac OS X, así como Microsoft Windows).
Los ejercicios prácticos constituyen alrededor del 70% del tiempo de curso, y alrededor del 30% son demostraciones y presentaciones. Pueden hacerse discusiones y preguntas a lo largo del curso.
Nota: el entrenamiento puede ser adaptado a necesidades específicas previa solicitud antes de la fecha del curso propuesto.
Automatización de Pruebas con Selenium y Python
14 HorasSelenium es una biblioteca de código abierto para automatizar las pruebas de aplicaciones web en varios navegadores. El selenio interactúa con un navegador como lo hace la gente: haciendo clic en enlaces, rellenando formularios y validando texto. Es la herramienta más popular para la automatización de pruebas de aplicaciones web. Selenium se basa en el marco WebDriver y tiene excelentes enlaces para numerosos lenguajes de scripting, incluido Python.
En esta capacitación, los participantes combinan el poder de Python con Selenium para automatizar la prueba de una aplicación web de muestra. Al combinar la teoría con la práctica en un entorno de laboratorio en vivo, los participantes obtendrán el conocimiento y la práctica necesarios para automatizar sus propios proyectos de prueba web utilizando Python y Selenium.
Audiencia
Probadores y Desarrolladores
Formato del curso
Conferencia parcial, discusión parcial, práctica práctica intensa
Resumen de texto con Python
14 HorasEn Python Machine Learning, la función de Resumen de Texto es capaz de leer el texto de entrada y generar un resumen de texto. Esta capacidad está disponible desde la línea de comandos o como una API/Biblioteca de Python. Una aplicación emocionante es la creación rápida de resúmenes ejecutivos; esto es particularmente útil para organizaciones que necesitan revisar grandes volúmenes de datos de texto antes de generar informes y presentaciones.
En esta formación dirigida por un instructor, los participantes aprenderán a usar Python para crear una aplicación simple que genere automáticamente un resumen de texto de entrada.
Al final de esta formación, los participantes serán capaces de:
- Usar una herramienta de línea de comandos que resume texto.
- Diseñar y crear código de Resumen de Texto utilizando bibliotecas de Python.
- Evaluar tres bibliotecas de resumen de Python: sumy 0.7.0, pysummarization 1.0.4, readless 1.0.17
Audiencia
- Desarrolladores
- Científicos de datos
Formato del curso
- En parte conferencia, en parte discusión, ejercicios y práctica práctica intensa