본문 바로가기

Data Engineering

데이터 마트(Data Mart)

데이터 웨어하우스의 부분집합으로, 특정 부서나 사용자 그룹의 요구에 맞춰 특별히 설계된 소규모 데이터 저장소

  • 전체 기업 데이터를 모두 담는 데이터 웨어하우스와 달리, 데이터 마트는 특정 주제나 목적에 필요한 데이터만 선별하여 담아놓은 작은 창고
  • 즉, "특정 부서나 목적에 맞춰 필요한 데이터만 모아놓은 작은 데이터 웨어하우스"

데이터 마트의 필요성

전통적인 데이터 웨어하우스는 방대한 기업의 모든 데이터를 통합하고 저장하는 데 초점을 맞추고 있음

하지만 이러한 중앙 집중식 데이터 웨어하우스는 다음과 같은 한계점을 가짐

  • 복잡성: 전체 기업 데이터가 너무 방대하고 복잡해서 특정 부서 사용자가 필요한 데이터를 찾고 분석하기 어려움
  • 성능 문제: 모든 부서의 쿼리가 중앙 데이터 웨어하우스로 집중되면서 성능 저하가 발생
  • 관리의 어려움: 특정 부서의 요구사항을 반영하기 위해 전체 데이터 웨어하우스 구조를 변경하는 것이 어렵고 시간이 오래 걸림
  • 접근성: 비즈니스 사용자들이 쉽게 접근하여 데이터를 활용하기 어려움

데이터 마트는 이러한 문제들을 해결하여 데이터 접근성을 높이고, 특정 부서의 분석 요구사항을 신속하게 충족하며, 중앙 데이터 웨어하우스의 부담을 줄이는 데 기여

특정 목적에 최적화된 형태로 데이터를 제공하여 비즈니스 사용자가 더 빠르게 인사이트를 얻을 수 있도록 돕는 것이 주요 목적

데이터 마트의 주요 특징

  • 주제 지향적: 특정 비즈니스 주제(예: 영업, 마케팅, 재무, 인사)에 초점을 맞춰 관련 데이터만 포함
  • 부서/사용자 중심: 특정 부서나 사용자 그룹의 분석 요구사항에 맞춰 설계
  • 작은 규모: 데이터 웨어하우스보다 훨씬 작은 규모의 데이터와 스키마
  • 쉬운 접근성: 비즈니스 사용자가 익숙한 용어와 구조로 데이터를 제공하여 쉽게 이해하고 활용 가능
  • 빠른 구축 및 배포: 데이터 웨어하우스보다 짧은 시간 안에 구축하고 배포 가능

데이터 마트의 유형

데이터 마트는 데이터를 가져오는 방식에 따라 크게 두 가지 유형으로 나뉨:

1. 종속형 데이터 마트 (Dependent Data Mart)

  • 중앙 데이터 웨어하우스에서 데이터를 추출하여 구축되는 방식
  • 데이터 웨어하우스가 먼저 구축된 후, 거기서 필요한 데이터만 가져와서 데이터 마트 생성
  • 장점: 데이터의 일관성 및 정합성이 중앙 데이터 웨어하우스에 의해 보장됨. 데이터 웨어하우스의 통합된 데이터를 활용하므로 데이터 품질 관리가 용이
  • 단점: 중앙 데이터 웨어하우스에 의존적이므로, 데이터 웨어하우스 구축이 선행되어야 함

2. 독립형 데이터 마트 (Independent Data Mart)

  • 데이터 웨어하우스 없이, 운영 시스템이나 외부 데이터 소스에서 직접 데이터를 추출하여 구축되는 방식
  • 각 부서의 필요에 따라 독립적으로 만들어짐
  • 장점: 데이터 웨어하우스가 없어도 빠르게 구축 가능하며, 특정 부서의 요구에 유연하게 대응 가능
  • 단점: 데이터 중복이 발생할 수 있고, 전체 기업 관점에서의 데이터 일관성 및 정합성 유지가 어려울 수 있음 + 장기적으로 '데이터 사일로(Data Silo)'를 초래할 위험이 있음

데이터 마트의 활용 예시

  • 영업 부서 데이터 마트: 특정 지역 또는 제품별 판매 실적, 고객 구매 이력, 영업 사원별 성과 등 영업 활동에 필요한 데이터만 모아 분석
  • 마케팅 부서 데이터 마트: 캠페인 성과 분석, 고객 세분화, 웹사이트 방문 기록 등 마케팅 전략 수립에 필요한 데이터 활용
  • 재무 부서 데이터 마트: 예산 집행 현황, 손익 분석, 회계 데이터 등 재무 보고 및 분석에 필요한 데이터 제공