Viernes, 22 mayo 2020

Análisis predictivo: ¿en qué consiste y para qué se usa?

El análisis predictivo se basa en estimar eventos futuros en función de datos históricos, a los que se les aplican diversas técnicas analíticas, estadísticas y de aprendizaje automático. ¿Quieres saber más sobre el análisis predictivo y el papel que juega en Big Data? En UNIR abordamos sus características y principales casos de uso.

Los modelos de análisis predictivo son modelos matemáticos que predicen el comportamiento de una variable en función de un conjunto de otras variables. Cuanto más relacionadas estén el conjunto de variables predictoras con la variable a predecir (correlación), más exactas serán las predicciones. Por ejemplo, la policía de New York (NYPD) dispone de una solución que, en función del mes, la hora del día, el barrio, la calle, etc. puede predecir si una llamada al número de emergencias tiene una alta probabilidad de ser por una acción constitutiva de un delito.

Para la construcción de estos modelos, una vez desarrollado el algoritmo predictivo, es necesario disponer de un conjunto de datos históricos. Para ello se dividen estos en dos conjuntos: uno de datos de entrenamiento y otro de prueba. Al modelo se le pasan como entrada los datos de entrenamiento para calibrar la predicción y, posteriormente, los datos de prueba. Después se compara el resultado de la predicción con los valores reales (históricos) para comprobar su exactitud.

 

 

Proceso de un análisis predictivo

1. Recopilar datos

El desarrollo de un modelo de análisis predictivo comienza con la obtención de los datos en función de los que se va a realizar las predicciones. Los datos podrán proceder de diferentes fuentes, tales como archivos, BBDD, sensores, etc. y se exploran para conocer su naturaleza, estructura, la calidad de los mismos…

2. Ordenar y adaptar los datos

El siguiente paso consiste en realizar un procesado inicial de los mismos para ordenarlos, transformarlos y adecuarlos a las necesidades del modelo. En este punto se suelen eliminar los valores extremos que distorsionan el funcionamiento del modelo y se crea una única estructura con los datos procesados de las distintas fuentes.

 

 

3. Analizar los datos

Una vez creada la estructura de datos se analizan los mismos para identificar sus características, detectar los patrones y tendencias en sus valores y obtener información relevante para el desarrollo del algoritmo predictivo, que es la base del modelo.

4. Elegir el modelo matemático

Para el desarrollo del algoritmo se utilizará la información obtenida del análisis de los datos y, en función de ella, se decidirán las técnicas matemáticas que permitirán procesar los datos de entrada al modelo y realizar las predicciones (salidas).

5. Optimizar los parámetros

Finalmente, se optimizarán los parámetros del algoritmo mediante un conjunto de datos de entrenamiento (datos reales de las variables de entrada y de salida del modelo) y se verificará su exactitud con un conjunto de datos de prueba (datos reales de las variables de entrada y predicciones del modelo que se comparan con los datos reales con los que deberían coincidir las predicciones).

 

 

Ejemplos de análisis predictivos

Algunas soluciones de analítica predictiva de fabricantes de referencia son:

  • 1. IBM: dispone de soluciones que, en función de la información que tiene de los clientes, permite predecir cuál es su nivel de satisfacción. Esto ayuda a las empresas a fidelizarlos y maximizar los ingresos al permitir realizar campañas de ofertas personalizadas o predecir cuáles van a cambiar de proveedores.
  • 2. Oracle Advanced Analytics: proporciona a las empresas análisis de datos en tiempo real para estimar o predecir la pérdida de clientes, la aceptación de los productos por parte de estos o las operaciones fraudulentas.

En nuestra vida cotidiana también podemos observar la existencia de la analítica predictiva en cosas tan cotidianas como las predicciones meteorológicas; las cuales se basan en modelos predictivos que analizan los históricos de datos y los valores actuales de ciertas variables para predecir, por ejemplo, cuál es la probabilidad de lluvia de los próximos días.