Jueves, 23 abril 2020

Científico de datos: las claves de esta profesión de futuro

Los científicos de datos son profesionales que se dedican a la analítica de datos, esto es, extraer información de grandes volúmenes de datos (Big Data), tanto estructurados como no estructurados, y convertirla en conocimiento para que las organizaciones puedan tomar mejores decisiones. La figura del científico de datos está cada vez más en alza. ¿Sabes bien en qué consiste y cuáles son sus funciones? En UNIR lo abordamos en detalle.

Una definición simple y cotidiana de lo que es un científico de datos podría ser la que acuñó Josh Wills: “Person who is better at statistics than any software engineer and better at software engineering than any statistician (Persona con conocimientos de estadística superiores a los de los programadores y con conocimientos de programación superiores a los de cualquier estadístico).

Los científicos de datos son profesionales que trabajan en sectores muy diversos e intentan dar respuesta a los problemas de cualquier índole que se puedan presentar en base a los datos disponibles. Es una profesión al alza debido a tecnologías disruptivas como el Big Data, la Inteligencia Artificial y el Machine Learning. Está muy bien remunerada debido a la escasez de estos perfiles y su gran demanda por parte de las organizaciones.

Las principales actividades que desarrollan estos perfiles son:

  • – Obtener grandes cantidades de datos en bruto, con distintos formatos y transformarlos de manera que su formato sea adecuado para analizarlos y procesarlos.
  • – Solucionar problemas de negocio haciendo uso del conocimiento obtenido de los datos.
  • – Comunicar resultados, soluciones, etc. y colaborar con las áreas de negocio.

Un científico de datos se diferencia de un analista de datos en que tiene una visión global del problema a solucionar y utiliza los datos de múltiples fuentes disponibles. En cambio, el analista se centra en aquellos datos provenientes de un único origen.

Conocimientos necesarios para el científico de datos

Los conocimientos y habilidades técnicas que deben tener las personas que se dediquen a la ciencia de datos, según José Antonio Guerrero, mejor científico de datos del mundo en 2013 —según la red social de científicos de datos Kaggle— son:

  • – matemáticas, estadística y métodos de optimización
  • – lenguajes de programación
  • – experiencia práctica en el análisis de datos reales y elaboración de modelos predictivos.

Además, las principales herramientas de Data Science que deben utilizar estos profesionales en su día a día son:

  • – Lenguajes de programación, como Python y R
  • – Conocimientos en estadística como, por ejemplo, distribuciones de probabilidad
  • – Técnicas de visualización de datos
  • – Algoritmos matemáticos para el desarrollo de modelos predictivos y automatización
  • – Desarrollo de modelos de abstracción complejos para la resolución de problemas
  • – Técnicas de preparación de los datos obtenidos en bruto
  • – Técnicas de análisis de texto para identificar datos importantes para el negocio como, por ejemplo, reputación de la organización, aceptación de productos, sentimiento de los consumidores, etc.

Formación de un científicos de datos

Actualmente, para formarse como científico de datos existen varias opciones: 

  • Grados: algunas universidades ofrecen grados dobles en Informática y Matemáticas o Informática y Estadística que son buenas opciones para conseguir una base formativa amplia en este campo. Otra posibilidad es el Grado en Matemática Computacional
  •  – Posgrados: existen múltiples itinerarios formativos de este tipo que profundizan en los conocimientos adquiridos en los grados y especializan a los futuros profesionales en la ciencia de datos. Uno de ellos es el máster en Visual Analytics & Big Data de UNIR. 
  •  – Otra formación no reglada como certificaciones/acreditaciones y cursos.

Sin duda, la profesión de científico de datos tiene futuro debido a la creciente demanda desde las empresas y organizaciones por la obtención y gestión adecuada de datos.