260€
Presentación
En la era del Big Data, dominar herramientas como Apache Spark se ha vuelto crucial para gestionar y analizar grandes volúmenes de datos de forma rápida y eficiente. Este Curso de Spark SQL con PySpark te permitirá adquirir competencias avanzadas en la creación y manipulación de DataFrames, la ejecución de consultas SQL sobre grandes conjuntos de datos, y el desarrollo de modelos de machine learning. Nuestra formación está diseñada para ofrecer un enfoque práctico y comprensible, con ejemplos reales y ejercicios adaptados a las necesidades actuales del mercado laboral. Si quieres convertirte en una persona experta en Spark SQL con PySpark, este curso te proporcionará las habilidades necesarias para destacar en el sector.
Universidades colaboradoras
Para qué te prepara
El Curso de Spark SQL con PySpark te capacita para desarrollar aplicaciones distribuidas, manipular y analizar grandes conjuntos de datos, optimizar consultas y ejecutar modelos de machine learning. Además, te prepara para implementar soluciones de Big Data de alto rendimiento en diferentes entornos, con un enfoque en la eficiencia y escalabilidad, habilidades muy demandadas en el mercado laboral actual.
Objetivos
- Aprender a manejar DataFrames y RDDs para gestionar grandes volúmenes de datos.
- Ejecutar consultas SQL eficientes sobre grandes conjuntos de datos con PySpark.
- Implementar transformaciones complejas y operaciones avanzadas en PySpark.
- Optimizar el rendimiento de las aplicaciones en Spark mediante particiones y caching.
- Desarrollar y ajustar modelos de machine learning utilizando Spark MLlib.
- Configurar entornos de desarrollo en Spark para diferentes plataformas.
- Aplicar técnicas de procesamiento en tiempo real con Spark Streaming
A quién va dirigido
Este Curso de Spark SQL con PySpark está dirigido a profesionales del análisis de datos, ingeniería de software, ciencia de datos y cualquier persona interesada en el procesamiento de grandes volúmenes de datos con Apache Spark. Tanto si tienes experiencia previa como si estás buscando aprender desde cero, este curso te proporcionará las habilidades necesarias.
Salidas Profesionales
Al finalizar el Curso de Spark SQL con PySpark, podrás trabajar en ingeniería de datos, desarrollo de Big Data, ciencia de datos o arquitectura de soluciones en grandes empresas tecnológicas y startups, y sectores como banca y retail. Las habilidades adquiridas te posicionarán como un/a profesional capacitado en el manejo de datos masivos y procesamiento distribuido.
Temario
UNIDAD DIDÁCTICA 1. FUNDAMENTOS DE APACHE SPARK
- Introducción a Apache Spark: arquitectura y componentes
- RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
- Transformaciones y acciones en RDDs
- Programación funcional en Spark: Scala y Python
- Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes
UNIDAD DIDÁCTICA 2. INTRODUCCIÓN A PYSPARK Y SPARK SQL
UNIDAD DIDÁCTICA 3. CREACIÓN Y MANIPULACIÓN DE DATAFRAMES
UNIDAD DIDÁCTICA 4. CONSULTAS SQL SOBRE DATAFRAMES
UNIDAD DIDÁCTICA 5. TRANSFORMACIONES Y OPERACIONES AVANZADAS
UNIDAD DIDÁCTICA 6. OPTIMIZACIÓN Y AJUSTE DEL RENDIMIENTO
UNIDAD DIDÁCTICA 7. GESTIÓN Y ALMACENAMIENTO DE DATOS
UNIDAD DIDÁCTICA 8. SPARK STREAMING Y MACHINE LEARNING
Titulación
Solicitar información