Select Page

El ‘Gobierno del Dato’ o cómo evitar que el ‘data lake’ se convierta en ‘data swamp’

Por Luis de la Fuente | Director del Máster en Big Data de UNIR 17-10-19

El proceso en el que se obtienen, gestionan y almacenan los datos de una compañía resulta clave para cualquier organización. Conoce los pasos correctos para evitar que la gran base de datos de una empresa no se convierta en una ‘ciénaga’.

En el mundo de la empresa se consolidan cada vez más las prácticas de la denominada Business Intelligence, o inteligencia de negocio. De hecho, utilizamos el término Data Driven Company para enfatizar que el hecho de que la estrategia de tomar decisiones reforzadas con datos afecta a una empresa de forma global y no sólo para acciones puntuales.

El ‘Gobierno del Dato’ es uno de los términos o conceptos que refieren a esta disciplina. Significa el proceso en el que se obtienen, gestionan y almacenan los datos de una compañía.

Todos los departamentos de cualquier empresa generan y consumen datos. Si estos se gestionan de manera interna y aislada, por áreas, en compartimentos estancos, el resto de unidades de la organización se quedará sin información muy valiosa.

Quienes implementan políticas de Big Data en las organizaciones saben que resulta muy beneficioso que esa información sea vertida a una gran base de datos central. Va a parar a lo que suele denominarse data lake’, o lago de datos.

Los mandos intermedios de las empresas deben evitar que el lago de datos se convierta en una ciénaga, o data swamp Clic para tuitear

Pero los mandos intermedios de las empresas deben tener un objetivo muy claro: que ese lago no se convierta en una ciénaga, o ‘data swamp’, como se conoce en inglés a este concepto. Es decir, los líderes y directivos empresariales tienen que luchar para que exista una política de ‘Gobierno de Datos’ eficaz.

¿Cómo conseguirlo? En principio, deben encomendar la crucial tarea a la persona idónea (y a su equipo) especializada en este campo. Cada vez son más las empresas que cuentan con la figura del Chief Data Officer (CDO). Es el responsable de los datos de una empresa al más alto nivel.

El Chief Data Officer es el responsable de los datos de una empresa al más alto nivel. Cada vez son más las empresas que cuentan con esta figura

Será el encargado de asegurar que la información generada y utilizada por los departamentos, que es vertida al ‘lago’, esté bien gestionada. Uno de los pilares para que el ‘Gobierno del Dato’ no convierta el ‘agua’ en ciénaga o barro, es antes que nada constatar que los flujos de datos enviados por las áreas de una empresa son los correctos.

Duplicidades y otros errores frecuentes

Es fundamental que se eviten errores frecuentes, como las duplicidades, por ejemplo. O que se cargue información de manera no homogénea y poco clara. Debemos tener en cuenta que los datos que llegan por diversas vías serán ‘leídos’ por robots y clasificados por algoritmos.

Las máquinas no comprenden que una misma palabra escrita con acento por un departamento, y sin tilde por otro, quiere decir lo mismo. En este caso, probablemente clasificarán de manera errónea o duplicarán la misma información. Es en esos casos cuando surgen los problemas. El dato no está limpio… o se ‘ensucia’.

Un proceso eficaz del 'Gobierno del Dato' es muy importante para las empresas.

Los análisis e informes derivados de un dato que no esté limpio pueden no ser confiables. Por tanto, no serán útiles. Por eso, los datos emitidos deben ser siempre confiables.  Tienen que llegar a tiempo. Además,  hay que procurar que estén categorizados donde tienen que estar. Es decir, tienen que emitirse a través de un procedimiento bien gobernado.

Para concretar un proceso eficaz del ‘Gobierno del Dato’, hace falta seguir estos pasos:

  • Debemos asegurar que todos los departamentos de la empresa ofrezcan los datos al área específica de Business Intelligence.
  • Debe existir una estrategia institucional integrada, de manera que un departamento ofrezca servicio a los demás, con el objetivo de que todos trabajen con la misma base de datos.
  • Institucionalmente hay que capacitar a los mandos intermedios del organigrama y convencer a la cúpula de la empresa de que esta es una estrategia esencial.
  • Una vez que se convenza y capacite a las personas, hay que montar la infraestructura. Tal vez haya que hacer determinados pilotos para persuadir a los líderes y responsables de equipos de que el proceso es útil y necesario.
  • Una vez que se consigue que todos los departamentos sean capaces de verter datos, resulta prioritario identificar los puntos que son susceptibles de enviar datos malos o erróneos, para prevenir fallos.
  • Obviamente, se requiere inversión en tecnología para que los datos se vuelquen limpios en el ‘lago’. Cuanto más ‘puros’ sean los datos, mejores serán los informes, y menos tiempo se tardará en

Es importante que, para que los diferentes departamentos adquieran conciencia de la relevancia de todo el proceso, puedan obtener beneficio del esfuerzo realizado. Para ello, desde los primeros pasos de la infraestructura es buena idea ofrecer análisis e informes. Estos deben aportar valor añadido que demuestren la bondad de la estrategia.

Calidad del dato

Aquí es importante incorporar el concepto de ‘calidad del dato’. Es la condición necesaria para que los datos estén limpios. Es decir, sin defectos, y que sean categorizados adecuadamente. Que aporten valores relevantes para la toma de decisiones.

Gracias a un ‘Gobierno del Dato’ certero o ‘data Governance’ –como también se le conoce en el mundillo especializado- la empresa saldrá beneficiada. Al final todos los departamentos trabajarán para un objetivo común. En consecuencia, todos los datos estarán entrelazados, igual que las tareas.

data lake

Entonces podremos hablar de la trazabilidad del dato. Es la posibilidad que permite verificar que los datos son correctos, y su historial. Es decir, ¿dónde y cuándo se generó un determinado dato? Este factor es muy importante. Por un lado, permite la detección rápida de errores. Más importante aún es que genera confianza y credibilidad en los datos. También ayuda en la adopción de estrategias.

Buena gestión del dato

El CDO debe ser el encargado de velar por esta labor. Se encargará siempre de la buena gestión del dato. Su responsabilidad es estratégica porque cuenta con una base de datos muy grande. Deberá ofrecer las aplicaciones necesarias para que todos los departamentos puedan acceder a la información que requieren.

El CDO de la empresa debe ser siempre el profesional encargado de la buena gestión del dato Clic para tuitear

En un entorno de trabajo en el que los datos estén bien gobernados, los consumidores de datos (departamentos) podrán acceder a un subconjunto del ‘data lake’ para generar sus propios informes, en cuyo caso será el CDO quien determine los permisos para el acceso a según qué datos.

Otra alternativa es que los departamentos deleguen la generación de informes al departamento de Bussines Intelligence, lo que generará análisis más avanzados y completos.

El departamento de Business intelligence debe ser capaz de brindar informes que sean útiles para las demás áreas

Respecto a los informes, son muy importantes porque muestran el valor añadido que arroja el ‘Gobierno del Dato’. El departamento de Business intelligence debe ser capaz de brindar informes que sean útiles para las demás áreas. Un mando intermedio o directivo de una compañía debe tener clara la forma correcta de afrontar el análisis de los datos. Esto no parte de “tengo estos datos, a ver qué puedo obtener de ellos”. La premisa correcta es “tengo estas preguntas, y mis datos deberían ser capaces de resolverlas”.

 

Potencia tu carrera profesional con una visión estratégica de negocio. ¿Estás preparado? 

 

¿Qué formación necesito para mejorar en mi carrera profesional?

Descúbrelo

Contacta con nosotros

Contacto