Data Engineering
2025. 3. 2.
데이터 레이크(Data Lake)
정형, 반정형, 비정형 데이터를 가리지 않고 모든 종류의 데이터를 원래 형식 그대로 저장하는 중앙 집중식 저장소전통적인 데이터 웨어하우스(Data Warehouse)가 정형화된 데이터만 구조화해서 저장하는 것과 달리, 데이터 레이크는 날 것의 데이터를 그대로 저장해서 나중에 필요할 때 원하는 방식으로 가공해서 사용할 수 있다는 점이 가장 큰 특징입니다.-> 즉, 데이터의 호수 (원하는 대로 활용할 수 있도록 일단 모든 데이터를 다 모아놓는 곳)! 데이터 레이크와 데이터 웨어하우스의 차이점둘 다 데이터를 저장하는 공간이지만, 목적과 방식에서 큰 차이가 있습니다. 1. 데이터 유형데이터 레이크: 정형, 반정형(로그 파일, XML), 비정형(텍스트, 이미지, 비디오) 등 모든 종류의 데이터를 원본 그대로 저장..