Hoy aprendí lo qué es un Data Lake

“A data lake is a storage repository that holds a vast amount of raw data in its native format, including structured, semi-structured, and unstructured data. The data structure and requirements are not defined until the data is needed. (fuente)”

“Un data lake es un repositorio de almacenamiento que contiene una enorme cantidad de datos sin procesar, en su forma nativa, incluyendo a aquellos estructurados, semi estructurados y no estructurados. La estructura de datos y requerimientos no son definidos hasta que los datos se necesiten”

Concepto importante en un contexto de integración actual de datos provenientes de distintas fuentes.