데이터 웨어하우스의 부분집합으로, 특정 부서나 사용자 그룹의 요구에 맞춰 특별히 설계된 소규모 데이터 저장소
- 전체 기업 데이터를 모두 담는 데이터 웨어하우스와 달리, 데이터 마트는 특정 주제나 목적에 필요한 데이터만 선별하여 담아놓은 작은 창고
- 즉, "특정 부서나 목적에 맞춰 필요한 데이터만 모아놓은 작은 데이터 웨어하우스"
데이터 마트의 필요성
전통적인 데이터 웨어하우스는 방대한 기업의 모든 데이터를 통합하고 저장하는 데 초점을 맞추고 있음
하지만 이러한 중앙 집중식 데이터 웨어하우스는 다음과 같은 한계점을 가짐
- 복잡성: 전체 기업 데이터가 너무 방대하고 복잡해서 특정 부서 사용자가 필요한 데이터를 찾고 분석하기 어려움
- 성능 문제: 모든 부서의 쿼리가 중앙 데이터 웨어하우스로 집중되면서 성능 저하가 발생
- 관리의 어려움: 특정 부서의 요구사항을 반영하기 위해 전체 데이터 웨어하우스 구조를 변경하는 것이 어렵고 시간이 오래 걸림
- 접근성: 비즈니스 사용자들이 쉽게 접근하여 데이터를 활용하기 어려움
데이터 마트는 이러한 문제들을 해결하여 데이터 접근성을 높이고, 특정 부서의 분석 요구사항을 신속하게 충족하며, 중앙 데이터 웨어하우스의 부담을 줄이는 데 기여
특정 목적에 최적화된 형태로 데이터를 제공하여 비즈니스 사용자가 더 빠르게 인사이트를 얻을 수 있도록 돕는 것이 주요 목적
데이터 마트의 주요 특징
- 주제 지향적: 특정 비즈니스 주제(예: 영업, 마케팅, 재무, 인사)에 초점을 맞춰 관련 데이터만 포함
- 부서/사용자 중심: 특정 부서나 사용자 그룹의 분석 요구사항에 맞춰 설계
- 작은 규모: 데이터 웨어하우스보다 훨씬 작은 규모의 데이터와 스키마
- 쉬운 접근성: 비즈니스 사용자가 익숙한 용어와 구조로 데이터를 제공하여 쉽게 이해하고 활용 가능
- 빠른 구축 및 배포: 데이터 웨어하우스보다 짧은 시간 안에 구축하고 배포 가능
데이터 마트의 유형
데이터 마트는 데이터를 가져오는 방식에 따라 크게 두 가지 유형으로 나뉨:
1. 종속형 데이터 마트 (Dependent Data Mart)
- 중앙 데이터 웨어하우스에서 데이터를 추출하여 구축되는 방식
- 데이터 웨어하우스가 먼저 구축된 후, 거기서 필요한 데이터만 가져와서 데이터 마트 생성
- 장점: 데이터의 일관성 및 정합성이 중앙 데이터 웨어하우스에 의해 보장됨. 데이터 웨어하우스의 통합된 데이터를 활용하므로 데이터 품질 관리가 용이
- 단점: 중앙 데이터 웨어하우스에 의존적이므로, 데이터 웨어하우스 구축이 선행되어야 함
2. 독립형 데이터 마트 (Independent Data Mart)
- 데이터 웨어하우스 없이, 운영 시스템이나 외부 데이터 소스에서 직접 데이터를 추출하여 구축되는 방식
- 각 부서의 필요에 따라 독립적으로 만들어짐
- 장점: 데이터 웨어하우스가 없어도 빠르게 구축 가능하며, 특정 부서의 요구에 유연하게 대응 가능
- 단점: 데이터 중복이 발생할 수 있고, 전체 기업 관점에서의 데이터 일관성 및 정합성 유지가 어려울 수 있음 + 장기적으로 '데이터 사일로(Data Silo)'를 초래할 위험이 있음
데이터 마트의 활용 예시
- 영업 부서 데이터 마트: 특정 지역 또는 제품별 판매 실적, 고객 구매 이력, 영업 사원별 성과 등 영업 활동에 필요한 데이터만 모아 분석
- 마케팅 부서 데이터 마트: 캠페인 성과 분석, 고객 세분화, 웹사이트 방문 기록 등 마케팅 전략 수립에 필요한 데이터 활용
- 재무 부서 데이터 마트: 예산 집행 현황, 손익 분석, 회계 데이터 등 재무 보고 및 분석에 필요한 데이터 제공
'Data Engineering' 카테고리의 다른 글
데이터 카탈로그(Data Catalog) (0) | 2025.06.03 |
---|---|
데이터 거버넌스(Data Governance) (0) | 2025.05.01 |
데이터 파이프라인(Data Pipeline) (0) | 2025.04.01 |
데이터 레이크(Data Lake) (0) | 2025.03.02 |
Apache Spark 로컬 환경 구성 (0) | 2024.03.26 |