Curso de Spark SQL con PySpark
100% Online
3 meses
260€

    Curso de Spark SQL con PySpark

    100% Online
    3 meses
    260€
    Seguridad y confianza en tus pagos online.

    Presentación

    En la era del Big Data, dominar herramientas como Apache Spark se ha vuelto crucial para gestionar y analizar grandes volúmenes de datos de forma rápida y eficiente. Este Curso de Spark SQL con PySpark te permitirá adquirir competencias avanzadas en la creación y manipulación de DataFrames, la ejecución de consultas SQL sobre grandes conjuntos de datos, y el desarrollo de modelos de machine learning. Nuestra formación está diseñada para ofrecer un enfoque práctico y comprensible, con ejemplos reales y ejercicios adaptados a las necesidades actuales del mercado laboral. Si quieres convertirte en una persona experta en Spark SQL con PySpark, este curso te proporcionará las habilidades necesarias para destacar en el sector.
    Qs World University Rankings

    Universidades colaboradoras

    Para qué te prepara
    El Curso de Spark SQL con PySpark te capacita para desarrollar aplicaciones distribuidas, manipular y analizar grandes conjuntos de datos, optimizar consultas y ejecutar modelos de machine learning. Además, te prepara para implementar soluciones de Big Data de alto rendimiento en diferentes entornos, con un enfoque en la eficiencia y escalabilidad, habilidades muy demandadas en el mercado laboral actual.
    Objetivos
    - Aprender a manejar DataFrames y RDDs para gestionar grandes volúmenes de datos. - Ejecutar consultas SQL eficientes sobre grandes conjuntos de datos con PySpark. - Implementar transformaciones complejas y operaciones avanzadas en PySpark. - Optimizar el rendimiento de las aplicaciones en Spark mediante particiones y caching. - Desarrollar y ajustar modelos de machine learning utilizando Spark MLlib. - Configurar entornos de desarrollo en Spark para diferentes plataformas. - Aplicar técnicas de procesamiento en tiempo real con Spark Streaming
    A quién va dirigido
    Este Curso de Spark SQL con PySpark está dirigido a profesionales del análisis de datos, ingeniería de software, ciencia de datos y cualquier persona interesada en el procesamiento de grandes volúmenes de datos con Apache Spark. Tanto si tienes experiencia previa como si estás buscando aprender desde cero, este curso te proporcionará las habilidades necesarias.
    Salidas Profesionales
    Al finalizar el Curso de Spark SQL con PySpark, podrás trabajar en ingeniería de datos, desarrollo de Big Data, ciencia de datos o arquitectura de soluciones en grandes empresas tecnológicas y startups, y sectores como banca y retail. Las habilidades adquiridas te posicionarán como un/a profesional capacitado en el manejo de datos masivos y procesamiento distribuido.
    Temario

    UNIDAD DIDÁCTICA 1. FUNDAMENTOS DE APACHE SPARK

    1. Introducción a Apache Spark: arquitectura y componentes
    2. RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
    3. Transformaciones y acciones en RDDs
    4. Programación funcional en Spark: Scala y Python
    5. Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes

    UNIDAD DIDÁCTICA 2. INTRODUCCIÓN A PYSPARK Y SPARK SQL

    UNIDAD DIDÁCTICA 3. CREACIÓN Y MANIPULACIÓN DE DATAFRAMES

    UNIDAD DIDÁCTICA 4. CONSULTAS SQL SOBRE DATAFRAMES

    UNIDAD DIDÁCTICA 5. TRANSFORMACIONES Y OPERACIONES AVANZADAS

    UNIDAD DIDÁCTICA 6. OPTIMIZACIÓN Y AJUSTE DEL RENDIMIENTO

    UNIDAD DIDÁCTICA 7. GESTIÓN Y ALMACENAMIENTO DE DATOS

    UNIDAD DIDÁCTICA 8. SPARK STREAMING Y MACHINE LEARNING

    Titulación
    Solicitar información