Data Quality no solo es Reglas de Calidad

En una tranquila mañana, un poco fría pero agradable, estaba revisando las reglas de calidad de un conjunto de datos, cuando de pronto, recibo una llamada repentina de mi Jefa “Larry busca a Remenik, hay un problema de calidad que está impactando en las clínicas”.

Rápidamente agende una reunión con Remenik, para poder entender que era lo que estaba pasando. Al parecer ciertos datos de las clínicas se estaban actualizando con información errada, pero no se sabía ¿quien?, ¿cuando? o ¿donde?se había realizado, un clásico problema de Gobierno. Lo curioso es que la data actualizada era válida pero no estaba en el lugar correcto, me explicó, imagina el número de tu DNI, y que alguien ponga sobre el otro número (qué existe y le corresponde a otra persona) es un dato válido pero no es el correcto para ti, no está en el lugar correcto , por lo cual no era un problema clásico en donde con controles y reglas de calidad se podía solucionar.

Esto me hizo reflexionar a qué existen problemas de calidad en datos, más allá de data ingresada con errores por falta de controles, existen problemas de calidad que están relacionadas a los procesos , los procesos que impactan en datos, este problema no se podía solucionar con reglas o controles por qué de hecho, estos existían.

Lo que había pasado era que otras áreas habían estado actualizando los datos de las clínicas, para sus fines, sin darse cuenta que estaban impactando en otras áreas.

La solución:

Estaba claro que debíamos identificar al Data Owner, pero además había que diseñar un proceso que intercepte todas estas actualizaciones, ubicar a las áreas pertinentes y ponerlo en marcha.

Afortunadamente el Data Owner esperaba con ansias nuestra llegada, se había dado cuenta del problema, pero no sabía cómo solucionarlo, nosotros como un área trasversal que vela por la calidad de la data, Teníamos la estrategia para solucionar el problema.

Ejecutar el proceso no fue sencillo, siempre van a estar las áreas que opongan resistencia al cambio, pero no hay nada que asuste más que una multa del regulador y con argumentos claros y relevantes brindados por nuestro Data Owner, las áreas comenzaron a aceptar y a entender la importancia de la tener la aprobación del Data Owner para la actualización de determinados datos, afortunadamente estás incidencias se han visto controladas y reducidas, no fue fácil pero lo logramos.

Entonces puedo decir que cuando tratamos un problema de calidad de datos, debemos tener dos focos principales, por un lado están las reglas, que se convierten en controles , los cuales frenan la contaminación de la data, y por otro los procesos , claros y gobernados por el Data Owner, para asegurar que sus lineamientos se cumplan. Contemplando estas dos partes creo que tendremos una solución más integral al problema de la calidad de los datos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *