Hoy aprendí lo qué es un Data Lake
“A data lake is a storage repository that holds a vast amount of raw data in its native format, including structured, semi-structured, and unstructured data. The data structure and requirements are not defined until the data is needed.”
https://blog.nucleusanalytics.com/data-warehouse-vs.-data-lake-and-why-it-matters
“Un data lake es un repositorio de almacenamiento que contiene una enorme cantidad de datos sin procesar, en su forma nativa, incluyendo a aquellos estructurados, semi estructurados y no estructurados. La estructura de datos y requerimientos no son definidos hasta que los datos se necesiten”
Concepto importante en un contexto de integración actual de datos provenientes de distintas fuentes.