Data lakes (3)

Para ser clasificado como un verdadero lago de datos, un repositorio Big Data tiene que exhibir tres características

Debe ser un único repositorio compartido de datos, típicamente almacenado dentro de un sistema de archivos distribuidos de Hadoop (HDFS).
Incluir capacidades de orquestación y programación de trabajos (por ejemplo, a través de YARN).
Contener un conjunto de aplicaciones o flujos de trabajo para consumir, procesar o actuar sobre los datos.

El almacenamiento de datos en un enterprise data warehouse (EDW), funciona bien para ciertos tipos de analítica y muchos de los usuarios finales dependen del enriquecimiento que las áreas de IT hacen sobre el EDW. Pero, la complejidad, inflexibilidad de diseño e intolerancia al error humano los hacen poco prácticos para su explotación en la era del Big Data.

Alice LaPlante & Ben Sharma, «Architecting Data Lakes«; O’Reilly Media, Inc., March 2016, ISBN 978-1-491-95257-3.

D	L	M	X	J	V	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Dr. Edu

Sitio web de un informático y amante de la ciencia en general

Data lakes (3)

References

Deja un comentario Cancelar la respuesta

References

Tu voto:

Comparte esto:

Related

Deja un comentario Cancelar la respuesta