Curso de Big Data con Apache Spark

100% Online

200 horas

260€

Matricularme

Curso de Big Data con Apache Spark

Name: Curso de Big Data con Apache Spark
Author: nombre

100% Online

200 horas

260€

Matricularme

Presentación

En la actual era digital, la cantidad de datos generados cada día es exponencialmente mayor, abarcando desde registros de transacciones comerciales hasta interacciones en redes sociales. Este fenómeno ha dado lugar a lo que se conoce como Big Data, un concepto que trasciende la simple acumulación de datos para convertirse en un recurso estratégico fundamental para empresas y organizaciones de todos los sectores. Este Curso de Big Data con Apache Spark ofrece una oportunidad única para sumergirse en el mundo del análisis de datos a gran escala. Desde los conceptos básicos de Big Data hasta técnicas avanzadas de procesamiento en tiempo real y machine learning, obtendrás una comprensión completa de cómo aprovechar al máximo este recurso invaluable gracias a la herramienta Apache Spark.

Para qué te prepara

Este Curso de Big Data con Apache Spark te prepara para manejar y analizar grandes volúmenes de datos en entornos empresariales complejos. Aprenderás a aplicar técnicas avanzadas de minería de datos, machine learning y procesamiento en tiempo real utilizando Apache Spark. Además, desarrollarás habilidades para optimizar consultas y gestionar eficientemente recursos en entornos de computación en la nube.

Objetivos

- Comprender la distinción entre Big Data y Thick Data. - Dominar técnicas de Data Mining y aprendizaje automático. - Configurar y utilizar el ecosistema Hadoop. - Desarrollar habilidades en programación funcional con Apache Spark. - Utilizar DataFrames y Datasets para manipulación estructurada de datos. - Implementar streaming de datos con Spark y Kafka. - Aplicar algoritmos de machine learning y análisis de grafos con Spark.

A quién va dirigido

Este Curso de Big Data con Apache Spark está diseñado para profesionales y estudiantes de informática, ciencias de datos, ingeniería de software y disciplinas relacionadas que deseen adquirir habilidades avanzadas en Big Data y Apache Spark. También es adecuado para gerentes y ejecutivos/as para impulsar la toma de decisiones estratégicas en sus organizaciones.

Salidas Profesionales

Al completar este Curso de Big Data con Apache Spark podrás trabajar en ámbitos como ciencia de datos, ingeniería Big Data, análisis de datos, arquitectura de soluciones en la nube, consultoría de Business Intelligence, entre otros roles especializados. Las empresas buscan habilidades en estas herramientas para impulsar la innovación y obtener una ventaja competitiva en el mercado.

Plataforma de aprendizaje avanzada con inteligencia artificial integrada
Contenidos actualizados por especialistas del sector
Aprendizaje experiencial mediante participación activa del estudiante
Flexibilidad y adaptabilidad del proceso formativo
Enfoque interdisciplinario
Seguimiento por un tutor experto

Temario

UNIDAD DIDÁCTICA 1. LA REVOLUCIÓN DE LOS DATOS MASIVOS: BIG DATA Y THICK DATA

¿Qué es Big Data?
¿Y Thick Data? ¿Cuál es el matiz para diferenciar ambos términos?
El gran auge del big data
La importancia de almacenar y extraer información
¿Cuál es el papel de las fuentes de datos?
Soluciones novedosas gracias a la selección de datos
Naturaleza de las fuentes de datos Big Data

UNIDAD DIDÁCTICA 2. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

Introducción a la minería de datos y el aprendizaje automático
Proceso KDD
Modelos y Técnicas de Data Mining
Áreas de aplicación
Minería de Textos y Web Mining
Data mining y marketing

UNIDAD DIDÁCTICA 3. ECOSISTEMA HADOOP

¿Qué es Hadoop? Relación con Big Data
Instalación y configuración de infraestructura y ecosistema Hadoop
Sistema de archivos HDFS
MapReduce con Hadoop
Apache Hive
Apache Hue
Apache Spark

UNIDAD DIDÁCTICA 4. FUNDAMENTOS DE APACHE SPARK

Introducción a Apache Spark: arquitectura y componentes
RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
Transformaciones y acciones en RDDs
Programación funcional en Spark: Scala y Python
Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes

UNIDAD DIDÁCTICA 5. API DE DATASETS EN SPARK

DataFrames y Datasets: API estructurada para datos
Lectura y escritura de DataFrames desde diferentes fuentes
Transformaciones en DataFrames: filtros, joins, agregaciones, etc
Funciones SQL en Spark: Spark SQL
Optimización de queries en Spark

UNIDAD DIDÁCTICA 6. STREAMING DE DATOS CON SPARK

Introducción al streaming de datos: conceptos clave
Spark Streaming: API DStream y receptores
Micro-batches y ventanas en streaming
Integración de Spark Streaming con Kafka
Aplicaciones de streaming: análisis de tweets, detección de fraudes, etc

UNIDAD DIDÁCTICA 7. MACHINE LEARNING CON SPARK

Introducción al Machine Learning: tipos de aprendizaje
MLlib: biblioteca de Machine Learning en Spark
Regresión lineal y logística con Spark
Clasificación de texto con Spark
Clustering con Spark: K-Means, K-NN
Algoritmos avanzados: Random Forest, Gradient Boosting

UNIDAD DIDÁCTICA 8. GRAPHS Y ALGORITMOS DE REDES

Introducción a GraphX: API para grafos en Spark
Representación de grafos en GraphX
Algoritmos básicos de grafos: PageRank, Shortest Path
Análisis de comunidades en grafos
Aplicaciones de GraphX: recomendación de productos, análisis de redes sociales

UNIDAD DIDÁCTICA 9. BIG DATA EN LA NUBE

Introducción a la computación en la nube: AWS, Azure, GCP
Servicios de Big Data en la nube: EMR, Dataproc, BigQuery
Implementación de Spark en la nube
Seguridad y escalabilidad en la nube

Titulación

Claustro

Ir a Linkedin

Rafael Marín Sastre

Ingeniero técnico en informática de sistemas por la Universidad de Granada (UGR).  

Apasionado de la informática y de las nuevas tecnologías, cuenta con 10 años de experiencia y vocación en el ámbito TIC y la programación de software. Es experto en desarrollo web, programación de aplicaciones, análisis de datos, big data, ciberseguridad y diseño y experiencia de usuario (UX/UI). 

Ir a Linkedin

Alan Sastre

Ocupa el puesto de CTO (Chief Technology Officer) y formador. Diseña e imparte formación en diferentes áreas como desarrollo web, bases de datos, big data, business intelligence y ciencia de datos. Además, trabaja diaramente con las tecnologías del ecosistema Java, C# y Phyton.

Ir a Linkedin

Dani Pérez Lima

Global IT support manager de una multinacional con más de 20 años de experiencia en el mundo IT, además de un apasionado de la virtualización de sistemas y de la transmisión de conocimiento en el ámbito de la tecnología.

Ir a Linkedin

José Domingo Muñoz Rodríguez

Ingeniero informático, profesor de secundaria de ASIR y coorganizador de OpenStack Sevilla con dilata experiencia en sistemas GNU/Linux. Administra clouds públicos y gestiona un cloud privado con OpenStack.

Ir a Linkedin

Juan Benito Pacheco

Como tech lead, ayuda a organizaciones a escalar sus servicios e infraestructura. Lleva más de 5 años programando tanto en front-end como back-end con JavaScript, Angular, Python o Django, entre otras tecnologías.

Ir a Linkedin

Juan Diego Pérez Jiménez

Profesor de Ciclos Formativos de Grado Superior de Informática. Más de 10 años creando páginas web y enseñando cómo hacerlas, cómo usar bases de datos y todo lo relacionado con la informática.

Solicitar información

Acepto el tratamiento de mis datos con la finalidad prevista en la información básica