¿Qué son las series temporales y para qué se usan en machine learning?
Una serie temporal es una secuencia de datos recabados en un período de tiempo. Así pues, en una serie temporal los datos se recaban cada cierto tiempo determinado de forma periódica, y no aleatoria. A su vez, la serie temporal puede ser regular, si los puntos están distribuidos de forma uniforme en su cronología, o irregular, si las fechas están distribuidas sin seguir un orden periódico concreto.
En vista de su posterior análisis, las series temporales deben contener la cantidad de datos suficientes prolongados en el tiempo para que sean realmente de utilidad. El análisis de series temporales sirve para observar cómo cualquier variable va mutando con el tiempo y es aplicable a infinidad de campos tan diversos como la estadística, la economía, la medicina, la climatología, la educación y las ciencias sociales.
Ejemplo de análisis de serie temporal
Supongamos que queremos analizar la temperatura diaria en una ciudad durante un mes específico. Aquí está un conjunto ficticio de datos de series temporales para este propósito:
Fecha Temperatura (°C)
2024-05-01 18
2024-05-02 20
2024-05-03 21
2024-05-04 22
2024-05-05 20
2024-05-06 19
2024-05-07 23
2024-05-08 24
2024-05-09 25
2024-05-10 26
2024-05-11 24
2024-05-12 23
2024-05-13 22
2024-05-14 21
2024-05-15 20
2024-05-16 19
2024-05-17 18
2024-05-18 17
2024-05-19 16
2024-05-20 17
2024-05-21 18
2024-05-22 19
2024-05-23 20
2024-05-24 21
2024-05-25 22
2024-05-26 23
2024-05-27 24
2024-05-28 25
2024-05-29 24
2024-05-30 23
2024-05-31 22
A continuación, a partir de los datos expuestos en la tabla anterior, generamos la siguiente gráfica:
A partir de esta serie temporal representada en la gráfica, podemos sacar algunas conclusiones. Debido a la sencillez del ejemplo que ponemos, los análisis que podemos hacer no son muy reveladores:
- La temperatura en mayo no es constante y muestra una serie de subidas y bajadas, algo típico de la primavera.
- Hay dos picos principales en el mes; uno alrededor del 11 de mayo y otro alrededor del 28 de mayo. Alguna condición climática especial hubo en estas fechas para favorecer este aumento puntual de temperaturas.
- Estas variaciones, tanto descendentes como ascendentes, pueden atribuirse a factores climáticos típicos de la estación, como frentes fríos, ondas de calor, o efectos locales específicos de la región.
¿Para qué se utilizan las series temporales en los modelos de machine learning?
Las series temporales son muy utilizadas en la predicción de tendencias y datos en machine learning que, a su vez, encuentra aplicaciones útiles en un amplio rango de campos.
Algunos de ellos son las finanzas y la economía, hasta la meteorología, la salud, la energía y la logística. Por ejemplo, en finanzas, estos modelos se utilizan para predecir precios de acciones, tipos de cambio y rendimientos de inversiones.
Modelos de machine learning para series temporales
Los modelos de machine learning utilizados para predecir tendencias y datos en series temporales suelen basarse en algoritmos como modelos autoregresivos (AR), modelos de promedios móviles (MA), modelos autoregresivos integrados de promedios móviles (ARIMA), modelos de suavizado exponencial, redes neuronales recurrentes (RNN) y modelos de atención, entre otros.
Estos modelos aprenden de los datos históricos para generar predicciones futuras. Durante el entrenamiento, se ajustan los parámetros del modelo para minimizar el margen de error entre las predicciones y los datos reales. Una vez entrenados, los modelos pueden utilizarse para predecir valores futuros basándose en nuevos datos que les introduzcamos.
Algunos modelos de machine learning de series temporales que hemos mencionado son:
- Autoregressive Integrated Moving Average (ARIMA): Es un modelo estadístico que utiliza valores pasados para predecir valores futuros de una serie temporal. Los modelos ARIMA se utilizan ampliamente en campos como finanzas, economía y meteorología.
- Seasonal Autoregressive Integrated Moving-Average (SARIMA): Es una extensión de ARIMA diseñada para manejar datos de series temporales con patrones estacionales. Se rige por el mismo mecanismo que ARIMA, pero tiene en cuenta factores estacionales que pueden afectar los datos. Es muy frecuente en campos como ventas minoristas y marketing para pronosticar ventas para temporadas específicas.
- Long Short-Term Memory (LSTM): Es un modelo de deep learning con el que se pueden manejar datos de series temporales con dependencias a largo plazo. Es capaz de identificar patrones complejos en datos de series temporales y se utiliza en campos como reconocimiento de voz, reconocimiento de imágenes y procesamiento del lenguaje natural. A diferencia de los modelos tradicionales como ARIMA, LSTM no requiere que los datos sean estacionarios.
Artículos relacionados
La Inteligencia Artificial al servicio de la desintegración radiactiva
La inteligencia artificial (IA) ha revolucionado numerosos campos, desde la medicina hasta las finanzas.
Guía técnica de cómo utilizar el algoritmo K-means y elegir el valor de “k”
El algoritmo k-means es uno de los métodos de clustering más utilizados en aprendizaje automático, especialmente debido a su simplicidad y eficiencia.
Voicebot: qué es, beneficios y ejemplos
La inteligencia artificial ha llegado para quedarse en nuestras vidas, puesto que las posibilidades que nos aportan son infinitas.