Curso de Big Data con Apache Spark
100% Online
6 meses
260€
Curso de Big Data con Apache Spark
    Curso de Big Data con Apache Spark

    Curso de Big Data con Apache Spark

    100% Online
    6 meses
    260€
    Seguridad y confianza en tus pagos online.

    Presentación

    En la actual era digital, la cantidad de datos generados cada día es exponencialmente mayor, abarcando desde registros de transacciones comerciales hasta interacciones en redes sociales. Este fenómeno ha dado lugar a lo que se conoce como Big Data, un concepto que trasciende la simple acumulación de datos para convertirse en un recurso estratégico fundamental para empresas y organizaciones de todos los sectores. Este Curso de Big Data con Apache Spark ofrece una oportunidad única para sumergirse en el mundo del análisis de datos a gran escala. Desde los conceptos básicos de Big Data hasta técnicas avanzadas de procesamiento en tiempo real y machine learning, obtendrás una comprensión completa de cómo aprovechar al máximo este recurso invaluable gracias a la herramienta Apache Spark.
    Qs World University Rankings

    Universidades colaboradoras

    Para qué te prepara
    Este Curso de Big Data con Apache Spark te prepara para manejar y analizar grandes volúmenes de datos en entornos empresariales complejos. Aprenderás a aplicar técnicas avanzadas de minería de datos, machine learning y procesamiento en tiempo real utilizando Apache Spark. Además, desarrollarás habilidades para optimizar consultas y gestionar eficientemente recursos en entornos de computación en la nube.
    Objetivos
    - Comprender la distinción entre Big Data y Thick Data. - Dominar técnicas de Data Mining y aprendizaje automático. - Configurar y utilizar el ecosistema Hadoop. - Desarrollar habilidades en programación funcional con Apache Spark. - Utilizar DataFrames y Datasets para manipulación estructurada de datos. - Implementar streaming de datos con Spark y Kafka. - Aplicar algoritmos de machine learning y análisis de grafos con Spark.
    A quién va dirigido
    Este Curso de Big Data con Apache Spark está diseñado para profesionales y estudiantes de informática, ciencias de datos, ingeniería de software y disciplinas relacionadas que deseen adquirir habilidades avanzadas en Big Data y Apache Spark. También es adecuado para gerentes y ejecutivos/as para impulsar la toma de decisiones estratégicas en sus organizaciones.
    Salidas Profesionales
    Al completar este Curso de Big Data con Apache Spark podrás trabajar en ámbitos como ciencia de datos, ingeniería Big Data, análisis de datos, arquitectura de soluciones en la nube, consultoría de Business Intelligence, entre otros roles especializados. Las empresas buscan habilidades en estas herramientas para impulsar la innovación y obtener una ventaja competitiva en el mercado.
    Temario

    UNIDAD DIDÁCTICA 1. LA REVOLUCIÓN DE LOS DATOS MASIVOS: BIG DATA Y THICK DATA

    1. ¿Qué es Big Data?
    2. ¿Y Thick Data? ¿Cuál es el matiz para diferenciar ambos términos?
    3. El gran auge del big data
    4. La importancia de almacenar y extraer información
    5. ¿Cuál es el papel de las fuentes de datos?
    6. Soluciones novedosas gracias a la selección de datos
    7. Naturaleza de las fuentes de datos Big Data

    UNIDAD DIDÁCTICA 2. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

    1. Introducción a la minería de datos y el aprendizaje automático
    2. Proceso KDD
    3. Modelos y Técnicas de Data Mining
    4. Áreas de aplicación
    5. Minería de Textos y Web Mining
    6. Data mining y marketing

    UNIDAD DIDÁCTICA 3. ECOSISTEMA HADOOP

    1. ¿Qué es Hadoop? Relación con Big Data
    2. Instalación y configuración de infraestructura y ecosistema Hadoop
    3. Sistema de archivos HDFS
    4. MapReduce con Hadoop
    5. Apache Hive
    6. Apache Hue
    7. Apache Spark

    UNIDAD DIDÁCTICA 4. FUNDAMENTOS DE APACHE SPARK

    1. Introducción a Apache Spark: arquitectura y componentes
    2. RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
    3. Transformaciones y acciones en RDDs
    4. Programación funcional en Spark: Scala y Python
    5. Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes

    UNIDAD DIDÁCTICA 5. API DE DATASETS EN SPARK

    1. DataFrames y Datasets: API estructurada para datos
    2. Lectura y escritura de DataFrames desde diferentes fuentes
    3. Transformaciones en DataFrames: filtros, joins, agregaciones, etc
    4. Funciones SQL en Spark: Spark SQL
    5. Optimización de queries en Spark

    UNIDAD DIDÁCTICA 6. STREAMING DE DATOS CON SPARK

    1. Introducción al streaming de datos: conceptos clave
    2. Spark Streaming: API DStream y receptores
    3. Micro-batches y ventanas en streaming
    4. Integración de Spark Streaming con Kafka
    5. Aplicaciones de streaming: análisis de tweets, detección de fraudes, etc

    UNIDAD DIDÁCTICA 7. MACHINE LEARNING CON SPARK

    1. Introducción al Machine Learning: tipos de aprendizaje
    2. MLlib: biblioteca de Machine Learning en Spark
    3. Regresión lineal y logística con Spark
    4. Clasificación de texto con Spark
    5. Clustering con Spark: K-Means, K-NN
    6. Algoritmos avanzados: Random Forest, Gradient Boosting

    UNIDAD DIDÁCTICA 8. GRAPHS Y ALGORITMOS DE REDES

    1. Introducción a GraphX: API para grafos en Spark
    2. Representación de grafos en GraphX
    3. Algoritmos básicos de grafos: PageRank, Shortest Path
    4. Análisis de comunidades en grafos
    5. Aplicaciones de GraphX: recomendación de productos, análisis de redes sociales

    UNIDAD DIDÁCTICA 9. BIG DATA EN LA NUBE

    1. Introducción a la computación en la nube: AWS, Azure, GCP
    2. Servicios de Big Data en la nube: EMR, Dataproc, BigQuery
    3. Implementación de Spark en la nube
    4. Seguridad y escalabilidad en la nube
    Titulación
    Solicitar información