2195€
Presentación
El Máster en Data Engineering es una disciplina altamente relevante en el contexto actual, donde los datos se han convertido en uno de los activos más valiosos para las organizaciones. El estado del arte en este campo muestra la importancia de gestionar y analizar grandes volúmenes de datos de manera eficiente y efectiva para obtener información valiosa. El Data Engineering abarca conocimientos y técnicas especializadas en el diseño, implementación y mantenimiento de infraestructuras de datos, así como en el procesamiento y transformación de datos a gran escala. Con el auge de la inteligencia artificial, el aprendizaje automático y el análisis de datos, el Máster en Data Engineering se presenta como una oportunidad para formarse en una disciplina con gran demanda en el mercado laboral.
Universidades colaboradoras
Para qué te prepara
El Máster en Data Engineering te prepara para afrontar los retos y desafíos de la gestión y procesamiento de datos a gran escala. Al finalizar el programa, estarás preparado para afrontar desafiantes proyectos de Data Engineering en diversos sectores y serás un profesional altamente demandado en el mercado laboral. Desarrollarás las habilidades necesarias para diseñar, implementar y optimizar soluciones de Data Engineering.
Objetivos
- Repasar los principios de la computación.
- Abordar el Big Data desde la óptica de la ingeniería.
- Estudiar el Data Science en sus fundamentos de almacenamiento, análisis y procesamiento de Datos.
- Mejorar las habilidades relacionadas con el cálculo numérico en ingeniería
- Emplear las herramientas de Python y R para el procesamiento, análisis y estudio de los Datos.
- Ahondar en los campos del Machine Learning y el Deep Learning.
- Conocer los aspectos básicos sobre los computadores.
- Adquirir una introducción a la programación y herramientas de cálculo numérico.
- Conocer el sistema MATLAB.
- Adquirir lo referente sobre las ecuaciones algebraicas de una variable.
- Realizar una interpolación y aproximación.
A quién va dirigido
El Máster en Data Engineering está dirigido a profesionales del ámbito de la informática, ingeniería o disciplinas relacionadas que deseen especializarse en el manejo y procesamiento de grandes volúmenes de datos. También es adecuado para aquellos que trabajan en roles relacionados con el análisis de datos, la inteligencia artificial o la automatización.
Salidas Profesionales
El Máster en Data Engineering te proporciona una amplia gama de salidas laborales en un mercado en constante crecimiento. Podrás trabajar como Data Engineer en empresas de diferentes sectores, donde serás responsable de diseñar y construir infraestructuras de datos, desarrollar y mantener pipelines de datos eficientes, y garantizar la integridad y calidad de los datos.
Temario
MÓDULO 1. PENSAMIENTO COMPUTACIONAL
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN PENSAMIENTO COMPUTACIONAL
- Presentación al pensamiento computacional
- ¿Qué es y para qué se usa pensamiento computacional?
- ¿Quiénes deben de aprender el pensamiento computacional?
UNIDAD DIDÁCTICA 2. TIPOS DE PENSAMIENTO QUE CONOCEMOS
- Pensamiento analítico
- Razonamiento aproximado, conceptual, convergente, divergente, sistemático, synvergente
UNIDAD DIDÁCTICA 3. CONOCEMOS EL PENSAMIENTO COMPUTACIONAL
- Proceso, conceptos y actitudes del pensamiento computacional
- Proceso de simulación
- Concepto y procesos de paralelismo automatización
- Trabajo en equipo en el pensamiento computacional
UNIDAD DIDÁCTICA 4. PARTE AVANZADA DE FONDO EL PENSAMIENTO COMPUTACIONAL
- Abstracción en pensamiento computacional
- Descomprimir los elementos
- Proceso de evaluación de pensamiento computacional
UNIDAD DIDÁCTICA 5. APLICACIONES DEL PENSAMIENTO COMPUTACIONAL
- Posibles problemas
- Datos relacionados con de entrada y salida en el pensamiento
- Solución al problema
MÓDULO 2. BIG DATA PARA INGENIERÍAS
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN
- ¿Qué es Big Data?
- Paradigmas de procesamiento en Big Data
- Las 8 V de Big Data (Volumen, Volatilidad, Variedad, Valor, Velocidad, Variabilidad, Veracidad, Validez)
UNIDAD DIDÁCTICA 2. BATCH PROCESSING
- MapReduce
- Hadoop
- Apache Hadoop YARN
- Agregación de los logs de YARN
- Obtención de datos en HDFS
- Planificación de un cluster Hadoop
- Instalación y configuración de Hive, Pig e Impala
- Clientes Hadoop incluidos en Hue
- Configuración avanzada de un cluster
- Seguridad Hadoop
- Gestión de recursos
- Mantenimiento de un cluster
- Solución de problemas y monitorización de un cluster
UNIDAD DIDÁCTICA 3. CIENCIA DE DATOS
- Data Science
- Apache Spark
- Machine Learning
- Apache Spark MLlib
UNIDAD DIDÁCTICA 4. DESARROLLO PARA SPARK Y HADOOP
- Datasets y Dataframes
- Operaciones en Dataframe
- Trabajar con Dataframes y Schemas
- Crear Dataframes a partir de Data Sources
- Guardar DataFrames en Data Sources
- DataFrame Schemas
- Rapidez y lentitud de ejecución
- Análisis de datos con consultas de DataFrame
- RDD
- Transformación de datos con RDDs
- Agregación de datos con Pair RDDs
- Consulta y vistas de tablas con Spark SQL
- Creación, configuración y ejecución de aplicaciones Spark
- Procesamiento distribuido
- Persistencia de datos distribuidos
- Patrones comunes al procesar datos con Spark
- Spark Streaming: Introducción a DStreams
- Spark Streaming: procesamiento de múltiples lotes
- Apache Spark Streaming: Data Sources
UNIDAD DIDÁCTICA 5. ANÁLISIS DE DATOS
- Introducción a Pig
- Análisis de datos básico con Pig
- Procesado de datos complejos con Pig
- Operaciones con multiconjuntos de datos con Pig
- Troubleshooting y optimización de Pig
- Introducción a Hive e Impala
- Consultas con Hive e Impala
- Administración de datos
- Almacenamiento y datos de rendimiento
- Análisis de datos relacional con Hive e Impala
- Datos complejos con Hive e Impala
- Análisis de texto con Hive e Impala
- Optimización Hive
- Optimización de Impala
- Extendiendo Hive e Impala
MÓDULO 3. DATA SCIENCE: ALMACENAMIENTO, ANÁLISIS Y PROCESAMIENTO DE DATOS
UNIDAD DIDÁCTICA 1.INTRODUCCIÓN A LA CIENCIA DE DATOS
- ¿Qué es la ciencia de datos?
- Herramientas necesarias para el científico de datos
- Data Science & Cloud Computing
- Aspectos legales en Protección de Datos
UNIDAD DIDÁCTICA 2.BASES DE DATOS RELACIONALES
- Introducción
- El modelo relacional
- Lenguaje de consulta SQL
- MySQL Una base de datos relacional
UNIDAD DIDÁCTICA 3. BASES DE DATOS NOSQL Y EL ALMACENAMIENTO ESCALABLE
- ¿Qué es una base de datos NoSQL?
- Bases de datos Relaciones Vs Bases de datos NoSQL
- Tipo de Bases de datos NoSQL Teorema de CAP
- Sistemas de Bases de datos NoSQL
UNIDAD DIDÁCTICA 4. INTRODUCCIÓN A UN SISTEMA DE BASES DE DATOS NOSQL: MONGODB
- ¿Qué es MongoDB?
- Funcionamiento y uso de MongoDB
- Primeros pasos con MongoDB: Instalación y shell de comandos
- Creando nuestra primera Base de Datos NoSQL: Modelo e Inserción de Datos
- Actualización de datos en MongoDB: Sentencias set y update
- Trabajando con índices en MongoDB para optimización de datos
- Consulta de datos en MongoDB
UNIDAD DIDÁCTICA 5. WEKA Y DATA MINING
- ¿Qué es Weka?
- Técnicas de Data Mining en Weka
- Interfaces de Weka
- Selección de atributos
UNIDAD DIDÁCTICA 6. PENTAHO
- Una aproximación a PENTAHO
- Soluciones que ofrece PENTAHO
- MongoDB & PENTAHO
- Hadoop & PENTAHO
- Weka & PENTAHO
UNIDAD DIDÁCTICA 7. R COMO HERRAMIENTA PARA BIG DATA
- Introducción a R
- ¿Qué necesitas?
- Tipos de datos
- Estadística Descriptiva y Predictiva con R
- Integración de R en Hadoop
UNIDAD DIDÁCTICA 8. PRE-PROCESAMIENTO & PROCESAMIENTO DE DATOS
- Obtención y limpieza de los datos (ETL)
- Inferencia estadística
- Modelos de regresión
- Pruebas de hipótesis
UNIDAD DIDÁCTICA 9. ANÁLISIS DE LOS DATOS
- Inteligencia Analítica de negocios
- La teoría de grafos y el análisis de redes sociales
- Presentación de resultados
MÓDULO 4. CÁLCULO NUMÉRICO PARA COMPUTACIÓN EN CIENCIA E INGENIERÍA
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN A LOS COMPUTADORES
- Introducción
- Conceptos básicos sobre computadores
- Componentes de un computador
- Software de un computador
- Parámetros característicos del computador digital
- Clasificación de los computadores
- Breve historia de los computadores
- Estudio de los computadores
- Computación Científica en supercomputadores
UNIDAD DIDÁCTICA 2. INTRODUCCIÓN A LA PROGRAMACIÓN Y HERRAMIENTAS DE CÁLCULO NUMÉRICO
- Introducción
- Resolución de problemas
- Lenguajes de programación
- Herramientas de cálculo numérico
UNIDAD DIDÁCTICA 3. EL SISTEMA MATLAB
- Introducción
- Acceso a MATLAB
- Introducción de matrices
- Operaciones sobre matrices y componentes de matrices
- Expresiones y variables
- El espacio de trabajo
- Funciones para construir matrices
- Control de flujo programando en MATLAB
- Funciones escalares
- Funciones vectoriales
- Funciones matriciales
- Generación de submatrices
- Ficheros .M
- Entrada y salida de texto
- Medidas de eficiencia de algoritmos
- Formato de salida
- Gráficos en dos dimensiones
- Gráficos en tres dimensiones
- Elaboración de programas en MATLAB
UNIDAD DIDÁCTICA 4. ARITMÉTICA DEL COMPUTADOR
- Introducción
- Representación interna de números
- Errores debidos a la representación interna de los números
- Errores en la realización de operaciones
- Algoritmos estables e inestables. Condicionamiento de un problema
- Ejercicios complementarios
UNIDAD DIDÁCTICA 5. ECUACIONES ALGEBRAICAS DE UNA VARIABLE
- Introducción
- Método de bisección o bipartición
- Método de interpolación lineal o Regula Falsi
- Método de aproximaciones sucesivas o punto fijo
- Método de Newton-Raphson
- Método de la secante
- Criterios de convergencia para los métodos iterativos
- Dificultades a la hora de calcular las raíces de una función
- Cálculo de ceros de polinomios
- Ejercicios complementarios
UNIDAD DIDÁCTICA 6. SISTEMAS DE ECUACIONES ALGEBRAICAS
- Introducción
- Métodos directos
- Métodos iterativos
- Comparación entre métodos iterativos y directos
- Introducción a los sistemas de ecuaciones algebraicas no lineales
- Ejercicios complementarios
UNIDAD DIDÁCTICA 7. INTERPOLACIÓN Y APROXIMACIÓN
- Introducción
- Interpolación polinomial
- Aproximación por polinomios
- Introducción a la interpolación por funciones racionales
- Ejercicios complementarios
UNIDAD DIDÁCTICA 8. DIFERENCIACIÓN E INTEGRACIÓN
- Introducción
- Diferenciación numérica
- Integración numérica
- Ejercicios complementarios
MÓDULO 5. ANÁLISIS DE DATOS CON PYTHON
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN AL ANÁLISIS DE DATOS
- ¿Qué es el análisis de datos?
UNIDAD DIDÁCTICA 2. LIBRERÍAS PARA EL ANÁLISIS DE DATOS: NUMPY PANDAS Y MATPLOTLIB
- Análisis de datos con NumPy
- Pandas
- Matplotlib
UNIDAD DIDÁCTICA 3. FILTRADO Y EXTRACCIÓN DE DATOS
- Cómo usar loc en Pandas
- Cómo eliminar una columna en Pandas
UNIDAD DIDÁCTICA 4. PIVOT TABLES
- Pivot tables en pandas
UNIDAD DIDÁCTICA 5. GROUPBY Y FUNCIONES DE AGREGACIÓN
- El grupo de pandas
UNIDAD DIDÁCTICA 6. FUSIÓN DE DATAFRAMES
- Python Pandas fusionando marcos de datos
UNIDAD DIDÁCTICA 7. VISUALIZACIÓN DE DATOS CON MATPLOTLIB Y CON SEABORN
- Matplotlib
- Seaborn
UNIDAD DIDÁCTICA 8. INTRODUCCIÓN AL MACHINE LEARNING
- Aprendizaje automático
UNIDAD DIDÁCTICA 9. REGRESIÓN LINEAL Y REGRESIÓN LOGÍSTICA
- Regresión lineal
- Regresión logística
UNIDAD DIDÁCTICA 10. ÁRBOL DE DECISIONES
- Estructura de árbol
UNIDAD DIDÁCTICA 11. NAIVE BAYES
- Algoritmo de Naive bayes
- Tipos de Naive Bayes
UNIDAD DIDÁCTICA 12. SUPPORT VECTOR MACHINES (SVM)
- Máquinas de vectores soporte (Support Vector Machine-SVN
- 2.¿Cómo funciona SVM?
- Núcleos SVM
- Construcción de clasificador en Scikit-learn
UNIDAD DIDÁCTICA 13. KNN
- K-nearest Neighbors (KNN)
- Implementación de Python del algoritmo KNN
UNIDAD DIDÁCTICA 14. PRINCIPAL COMPONENT ANALYSIS (PCA)
- Análisis de componentes principales
UNIDAD DIDÁCTICA 15. RANDOM FOREST
- Algoritmo de random forest
MÓDULO 6. DATA SCIENCE Y PROGRAMACIÓN ESTADÍSTICA CON PYTHON Y R
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN A LA CIENCIA DE DATOS
- ¿Qué es la ciencia de datos?
- Herramientas necesarias para el científico de datos
- Data Science & Cloud Compunting
- Aspectos legales en Protección de Datos
UNIDAD DIDÁCTICA 2. BASES DE DATOS RELACIONALES
- Introducción
- El modelo relacional
- Lenguaje de consulta SQL
- MySQL. Una base de datos relacional
UNIDAD DIDÁCTICA 3. PYTHON Y EL ANÁLISIS DE DATOS
- Introducción a Python
- ¿Qué necesitas?
- Librerías para el análisis de datos en Python
- MongoDB, Hadoop y Python. Dream Team del Big Data
UNIDAD DIDÁCTICA 4. R COMO HERRAMIENTA PARA BIG DATA
- Introducción a R
- ¿Qué necesitas?
- Tipos de datos
- Estadística Descriptiva y Predictiva con R
- Integración de R en Hadoop
UNIDAD DIDÁCTICA 5. PRE-PROCESAMIENTO & PROCESAMIENTO DE DATOS
- Obtención y limpieza de los datos (ETL)
- Inferencia estadística
- Modelos de regresión
- Pruebas de hipótesis
UNIDAD DIDÁCTICA 6. ANÁLISIS DE LOS DATOS
- Inteligencia Analítica de negocios
- La teoría de grafos y el análisis de redes sociales
- Presentación de resultados
MÓDULO 7. INTRODUCCIÓN APRENDIZAJE AUTOMÁTICO (MACHINE LEARNING)
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN AL MACHINE LEARNING
- Introducción
- Clasificación de algoritmos de aprendizaje automático
- Ejemplos de aprendizaje automático
- Diferencias entre el aprendizaje automático y el aprendizaje profundo
- Tipos de algoritmos de aprendizaje automático
- El futuro del aprendizaje automático
UNIDAD DIDÁCTICA 2. EXTRACCIÓN DE ESTRUCTURA DE LOS DATOS: CLUSTERING
- Introducción
- Algoritmos
UNIDAD DIDÁCTICA 3. SISTEMAS DE RECOMENDACIÓN
- Introducción
- Filtrado colaborativo
- Clusterización
- Sistemas de recomendación híbridos
UNIDAD DIDÁCTICA 4. CLASIFICACIÓN
- Clasificadores
- Algoritmos
UNIDAD DIDÁCTICA 5. REDES NEURONALES Y DEEP LEARNING
- Componentes
- Aprendizaje
UNIDAD DIDÁCTICA 6. SISTEMAS DE ELECCIÓN
- Introducción
- El proceso de paso de DSS a IDSS
- Casos de aplicación
MÓDULO 8. DESARROLLO DE DEEP LEARNING
UNIDAD DIDÁCTICA 1. DEEP LEARNING CON PYTHON, KERAS Y TENSORFLOW
- Aprendizaje profundo
- Entorno de Deep Learning con Python
- Aprendizaje automático y profundo
UNIDAD DIDÁCTICA 2. SISTEMAS NEURONALES
- Redes neuronales
- Redes profundas y redes poco profundas
UNIDAD DIDÁCTICA 3. REDES DE UNA SOLA CAPA
- Perceptrón de una capa y multicapa
- Ejemplo de perceptrón
UNIDAD DIDÁCTICA 4. REDES MULTICAPA
- Tipos de redes profundas
- Trabajar con TensorFlow y Python
UNIDAD DIDÁCTICA 5. ESTRATEGIAS DE APRENDIZAJE
- Entrada y salida de datos
- Entrenar una red neuronal
- Gráficos computacionales
- Implementación de una red profunda
- El algoritmo de propagación directa
- Redes neuronales profundas multicapa
MÓDULO 9. PROYECTO FINAL DE MÁSTER
Titulación
Titulación Universitaria:
Solicitar información