Data lakes (2)

Uno de los principales inconvenientes de un enterprise data warehouse (EDW) es el enorme tiempo y costo de preparación de los datos. Muchas organizaciones invierten en comités de estandarización que deliberan sobre lo que buscan con el EDW, los estándares para su alimentación y problemas a resolver con éste. Pueden tomar meses (o incluso años) para completar la tarea en cuestión.

Bajo este enfoque, los analistas de negocios y los científicos de datos no pueden hacer preguntas ad hoc de los datos: tienen que formar hipótesis antes de tiempo, y luego crear las estructuras de datos y análisis para probar esas hipótesis.  Desafortunadamente, los únicos resultados analíticos que se obtendrán son los que los datos permiten responder bajo las estructuras han sido diseñadas para su almacenamiento y representación. Este problema no importa mucho si las hipótesis originales son correctas, pero ¿y si no lo son? Se habrá creado un círculo vicioso que simplemente valida los supuestos. No es una buena práctica en un entorno empresarial que cambia constantemente y sorprende incluso a los más experimentados.

El lago de datos elimina todos estos problemas pues datos, estructurados o no, pueden ser fácilmente agregados sin ningún modelo o estandarización previa. Por ejemplo, los datos estructurados de bases de datos convencionales son colocados en las filas de la tabla del lago de datos y ser adecuadamente etiquetados junto con aquello que debe ser almacenado en una forma más cruda o menos convencional pero igualmente etiquetada para su posterior localización y uso.

Referencias

  1. Alice LaPlante & Ben Sharma, «Architecting Data Lakes«; O’Reilly Media, Inc., March 2016, ISBN 978-1-491-95257-3.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.