La Ciencia de Datos es el concepto que engloba a todas las disciplinas relacionadas con el estudio de los datos, desde su extracción y análisis hasta su modelaje y predicciones futuras. Se ha llegado a describir como la cuarta gran rama de la ciencia después de la empírica, teórica y computacional.
La Analítica Predictiva se centra en técnicas de aprendizaje de los datos pasados y presentes para hacer predicciones sobre el futuro. Esto permite anticiparse a situaciones de negocio futuras y que poder influir sobre ellas antes de que ocurran, con el beneficio que eso conlleva si lo comparamos con solamente analizar los hechos una vez que ya han ocurrido.
El proceso se divide en varios pasos.
- Comprensión y determinación del objetivo:
Un paso imprescindible es conocer cuál es el objetivo de negocio subyacente, alinear el objetivo de la analítica a realizar a ese objetivo de negocio y determinar cuáles son los requisitos. - Obtención y Exploración de los datos:
En este paso se pretende recopilar, describir y explicar los datos necesarios para la analítica mediante herramientas de análisis de datos y técnicas científicas, como por ejemplo la Estadística. - Preparación los datos:
La preparación de los datos consiste en organizar y depurar las diferentes fuentes de datos. Es necesario realizar una limpieza de los mismos para evitar tener datos redundantes que puedan perjudicar el rendimiento de los modelos de Machine Learning a considerar. - Creación de modelos de Machine Learning:
Mediante modelos de Machine Learning se puede «modelar» los datos disponibles para así poder utilizarlos en nuevas situaciones y realizar predicciones a futuro. - Evaluación del modelo:
Se revisa conjuntamente con el cliente que se han cumplido los objetivos y, si fuese necesario, se volvería a iterar sobre los pasos anteriores, con el fin de cumplir las expectativas. - Integración:
Se implementa la solución totalmente integrada con los sistemas del cliente.
Mediante la Analítica Predictiva podemos tomar decisiones de forma anticipada, antes de que ocurran los hechos, maximizando o minimizando su impacto según sea un impacto positivo o negativo.
Actualmente tanto la Ciencia de Datos, como la Analítica Predictiva se están usando en muchos sectores como, por ejempo, el sector financiero, retail, seguros, salud, telecomunicaciones, seguridad informática o el sector energético.