Función de verosimilitud

Ajuste de modelos predictivos en IA con la función de verosimilitud

rafael.marin
24/02/2025

La función de verosimilitud es un concepto muy utilizado y fundamental en la estadística y el aprendizaje automático ya que permite estimar los parámetros de un modelo a partir de los datos observados.  

En el contexto de la inteligencia artificial (IA), su aplicación es necesaria para lograr el ajuste de modelos predictivos, la inferencia bayesiana y la selección de hipótesis en problemas de clasificación y regresión. 

Qué es la función de verosimilitud y cómo se aplica en la IA 

La función de verosimilitud cuantifica la probabilidad de observar un conjunto de datos dado un conjunto de parámetros del modelo 

Matemáticamente, si un conjunto de datos X = {x1,x2,…,xn} sigue una distribución de probabilidad con parámetros θ, la función de verosimilitud se define como: 

función de verosimilitud 

En la IA y el aprendizaje automático, esta función se utiliza para encontrar los estimadores de máxima verosimilitud (MLE, Maximum Likelihood Estimation), que optimizan los parámetros para maximizar la probabilidad de los datos observados. 

Ejemplos prácticos en aprendizaje automático 

En aprendizaje automático, la función de verosimilitud se utiliza para la estimación de parámetros en diversos modelos. Algunos ejemplos podrían ser los siguientes: 

  • Regresión Logística: se emplea la verosimilitud para ajustar los coeficientes del modelo optimizando la función log-verosimilitud. 

  • Redes Neuronales: la función de pérdida en clasificación binaria suele ser la entropía cruzada, que es la forma negativa de la log-verosimilitud. 

  • Modelado de distribuciones: en problemas de modelado estadístico, como el uso de una distribución gamma para modelar tiempos de espera, la función de verosimilitud ayuda a encontrar los mejores parámetros de forma y escala. 

  • Modelos de Mezcla: algoritmos como el Modelo de Mezcla de Gaussianas (GMM) dependen de la verosimilitud para determinar la estructura subyacente de los datos. 

La función de verosimilitud en el contexto de la Inteligencia Artificial 

En IA, la función de verosimilitud es la base para los principales algoritmos utilizados en inferencia probabilística, desde modelos bayesianos hasta redes neuronales profundas.  

En modelos generativos, como los Modelos Ocultos de Markov (HMMs) o las Redes Bayesianas, la estimación de la verosimilitud de los datos ayuda a mejorar la inferencia y la predicción. 

Además, en algoritmos de optimización, la razón de verosimilitud permite comparar modelos alternativos para determinar cuál se ajusta mejor a los datos. Esto es útil en técnicas como el criterio de información de Akaike (AIC) y el criterio bayesiano de información (BIC). 

Para mejorar la precisión de los modelos de IA, se puede optimizar la función de verosimilitud mediante: 

  • Regularización: evita el sobreajuste agregando términos de penalización como L1 o L2 a la función de pérdida basada en la log-verosimilitud. 

  • Estimación Bayesiana: combina la verosimilitud con distribuciones previas para realizar inferencias más robustas. 

  • Muestreo por Monte Carlo (MCMC): permite aproximar la verosimilitud en modelos con alta dimensionalidad. 

  • Ajuste de hiperparámetros: técnicas como la validación cruzada ayudan a seleccionar los valores óptimos de los parámetros basados en la verosimilitud. 

Aplicación en el Machine Learning 

En machine learning, la función de verosimilitud es muy útil para la estimación de parámetros y la comparación de modelos.  

En problemas de clasificación se emplea en métodos como la Regresión Logística mientras que en modelos generativos como los Autoencoders Variacionales (VAEs), es fundamental para aprender distribuciones de datos. 

Por otro lado, en problemas de clustering, algoritmos como el Modelo de Mezcla de Gaussianas (GMM) dependen de la verosimilitud para determinar las distribuciones subyacentes de los datos. 

Importancia en el entrenamiento de modelos de IA 

En el entrenamiento de modelos de IA, la función de verosimilitud influye en la calidad del ajuste y la capacidad de generalización del modelo. Elegir la función de verosimilitud adecuada y optimizarla de manera efectiva impacta directamente en la capacidad predictiva del modelo.  

Modelos mal ajustados con baja verosimilitud pueden llevar a predicciones erróneas, mientras que un ajuste adecuado mejora la fiabilidad y precisión del sistema. 

Ejemplo práctico de uso con Python 

A continuación, se muestra un ejemplo de estimación de máxima verosimilitud en Python usando la distribución normal: 

Interfaz de usuario gráfica, Texto, Aplicación

El contenido generado por IA puede ser incorrecto. 

Este código genera datos a partir de una distribución normal y calcula los estimadores de máxima verosimilitud para la media y la desviación estándar, ilustrando el uso de la función de verosimilitud en el ajuste de modelos estadísticos. 

Un enfoque más avanzado consiste en maximizar directamente la función de verosimilitud utilizando técnicas de optimización, como se puede ver en el siguiente código: 

 código Python función verosimilitud 2

Este segundo ejemplo muestra cómo maximizar la función de verosimilitud de manera más precisa utilizando optimización numérica, lo que es útil en problemas complejos donde el cálculo analítico no es factible. 

Más allá de la verosimilitud 

La función de verosimilitud no solo es una herramienta estadística, sino que está en el núcleo del desarrollo de modelos de IA más robustos y eficientes.  

Comprender y aplicar correctamente la función de verosimilitud es indispensable para avanzar en el desarrollo de sistemas de inteligencia artificial cada vez más sofisticados y confiables. 

Si quieres descubrir cómo desarrollar modelos de IA y la influencia de la computación cuántica en este campo te recomiendo el Máster en Formación Permanente en Computación Cuantica e Inteligencia Artificial. 

Artículos relacionados

SearchGPT es un nuevo prototipo creado en el seno de OpenAI que pretende potenciar las búsquedas al uso con el poder de la inteligencia artificial.
pablo.blanco

SearchGPT: el nuevo buscador de inteligencia artificial de OpenAI

06/08/2024

SearchGPT es un nuevo prototipo creado en el seno de OpenAI que combina las características de la inteligencia artificial propia de los grandes modelos de lenguaje con información actuali

Se trata de una técnica muy común para entrenar modelos de machine learning. ¡Te contamos cómo funciona y más detalles!
pablo.blanco

¿Cómo funcionan los árboles de decisión en machine learning?

22/02/2024

Los árboles de decisión son un tipo de aprendizaje automático supervisado destinado a realizar predicciones en función de un conjunto de preguntas a las que el siste

El mundo del deporte está evolucionando a grandes pasos gracias a la IA. ¡Descubre cómo se está usando en el deporte!
pablo.blanco

Aplicaciones de la inteligencia artificial en los deportes

19/03/2024

Vemos como el mundo del deporte está evolucionando a pasos agigantados de la mano de la tecnología, aunque a simple vista no lo parezca para muchos aficionados.