Pilares del Data Governance

En un post anterior escribí sobre la importancia de modelo de gobierno de datos o Data Governance. En esta oportunidad voy a presentar cuáles son los componentes o pilares más importantes del Data Governance, con un enfoque orientado al negocio. Advertencia Haters! Voy a mencionar solo 3 pilares, los que en mi experiencia son más importantes, en la literatura uno puede encontrar muchos pilares y depende de cada organización implementar lo que le genere mayor valor. En mi experiencia con la implementación de dos pilares casi se muere medio banco, implementarlo fue como estar en Infinity War , no viajaba al espacio pero ir de sala en sala era como de planeta en planeta, y cómo ya sabemos en todo planeta se libraba una batalla. Pero claro cada organización es distinta.


Volviendo al objetivo de este post los pilares que considero más importantes son Data Content, Data Quality y Data Lineage.


Data Content: Abarca el conocimiento del dato, es decir las definiciones del dato, el objetivo de tener implementado este pilar es que toda la organización tenga un mismo entendimiento sobre el dato. Es muy probable que quienes hayan trabajado con datos han tenido que reprocesar información por el hecho de no haber tomado la fuente correcta, o peor aún presentar un informe errado por no tener el entendimento del dato. Y si nos ponemos en el lugar de Data Scientist (Pobre de el) ¿cómo puede explotar información sobre un dato que no conoce?, parece de sentido común que una organización no debería tener este tipo de problemas, pero el sentido común no es una práctica común.De forma práctica podríamos decir que lo que se necesita es un buen diccionario de datos, a muchos no les gusta eso pero desde el punto de vista técnico y frío, eso es.


Data Quality: La calidad de los datos, el dolor de cabeza de muchos, uno de los retos más interesantes y complejos ¿como mejorar la calidad de los datos?, sin duda hay muchas formas, y una de ellas es a través de reglas de calidad, que aseguren la confiabilidad de los datos. De nada sirve saber qué datos debemos de tomar para nuestra explotación analítica si calidad de estos es mala, ya que los resultados que tengamos serán malos. Implementar reglas de calidad se vuelve más complejo miesntras más grande sea la organización, ya que por lo general tienden a tener muchos sistemas de información donde deben implantarse.


Data Lineage: El linaje de los datos también conocido como la trazabilidad, está relacionado con el ciclo de vida del dato, es decir tener mapeado desde que inputs se genera hasta la fuente o repositorio de información en donde se almace. La trazabilidad permite tener un entendimiento del impacto que tienen otros datos sobre el nuestro, mucha veces mejorar la calidad de nuestra información depende de otros, otro beneficio es que nos brinda es sensibilidad sobre el impacto en otros datos que depende del nuestro, sobre todo cuando implementamos cambios u ocurren incidencias.


Estos 3 pilares deben estar soportados por una plataforma que permita el almacenamiento y mantenimiento, hoy en días distintas soluciones en el mercado como Colibra, pero depende mucho de la organización elegir la herramienta que mejor se adapte a sus necesidad, también se puede optar por construir una herramienta propia.


Cómo lo comenté en un inicio existen muchos pilares, depende de la organización implementar aquellos que considere que le proporciona mayor valor.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *