데이터 마트 소개

비즈니스 사용자는 IT 부서에서 빌드한 중앙 집중식으로 관리되는 데이터 원본에 크게 의존하지만 IT 부서에서 지정된 데이터 원본을 변경하려면 몇 달이 걸릴 수 있습니다. 이에 대한 대응으로 사용자는 Access 데이터베이스, 로컬 파일, SharePoint 사이트 및 스프레드시트를 사용하여 자체 데이터마트를 빌드하는 경우가 많습니다. 그런데 그 결과로 이러한 데이터 원본이 잘 지원되고 합리적인 성능을 갖추도록 하는 거버넌스와 적절한 감독이 부족해집니다.

데이터마트는 비즈니스 사용자와 IT 부서 간의 격차를 해소하는 데 도움이 됩니다. 데이터마트는 사용자가 완전 관리형 데이터베이스에 로드된 데이터를 저장하고 탐색할 수 있도록 하는 셀프 서비스 분석 솔루션입니다. 데이터마트는 간단하고 코드 없는(선택 사항) 환경을 제공하여 다양한 데이터 원본에서 데이터를 수집하고, Power Query 사용하여 데이터를 ETL(추출, 변형 및 로드)한 다음, 완전 관리형 튜닝 또는 최적화가 필요하지 않은 Azure SQL 데이터베이스에 로드하도록 해줍니다.

데이터가 데이터마트에 로드되면 비즈니스 인텔리전스 및 분석을 위한 관계 및 정책을 추가로 정의할 수 있습니다. 데이터마트는 Power BI 보고서 및 대시보드를 만드는 데 사용할 수 있는 의미 체계 모델 또는 의미 체계 모델을 자동으로 생성합니다. T-SQL 엔드포인트를 사용하거나 시각적 환경을 사용하여 데이터마트를 쿼리할 수도 있습니다.

데이터 마트와 Power BI 관계를 보여주는 다이어그램.

데이터마트는 다음과 같은 이점을 제공합니다.

  • 셀프 서비스 사용자가 데이터베이스 관리자 없이도 관계형 데이터베이스 분석을 쉽게 수행할 수 있음
  • 데이터마트는 코드 없는 환경을 비롯해 SQL을 사용한 엔드투엔드 데이터 수집, 준비 및 탐색 제공
  • 하나의 전체적인 환경 내에서 의미 체계 모델 및 보고서 빌드 사용

데이터마트 기능:

  • 100% 웹 기반으로 다른 소프트웨어 불필요
  • 코드 없는 환경으로 완전 관리형 데이터마트 생성
  • 자동화된 성능 튜닝
  • 임시 분석을 위한 기본 제공 시각적 개체 및 SQL 쿼리 편집기
  • SQL 및 기타 인기 있는 클라이언트 도구에 대한 지원
  • Power BI, Microsoft Office 및 기타 Microsoft 분석 제품과 네이티브 통합
  • Power BI Premium 용량 및 사용자 단위 Premium에 포함됨

데이터마트를 사용하는 경우

데이터마트는 셀프 서비스 시나리오를 위한 대화형 데이터 워크로드를 대상으로 합니다. 예를 들어 회계 또는 재무 분야에서 일할 경우 사용자 고유의 데이터 모델 및 컬렉션을 빌드한 후, T-SQL 및 시각적 쿼리 환경을 통해 비즈니스 질문과 답변을 셀프 서비스하는 데 사용할 수 있습니다. 또한 이러한 데이터 컬렉션을 더 전통적인 Power BI 보고 환경에 계속 사용할 수도 있습니다. 데이터마트는 제품으로서의 데이터 또는 셀프 서비스 데이터 플랫폼이 필요한 사용자와 같이 도메인 지향적이고 분산된 데이터 소유권 및 아키텍처가 필요한 고객에게 권장됩니다.

데이터마트는 다음 시나리오를 지원하도록 디자인되었습니다.

  • 부서별 셀프 서비스 데이터: 셀프 서비스 완전 관리형 SQL 데이터베이스에 소규모에서 중간 규모의 데이터 볼륨(약 100GB)을 중앙 집중화합니다. 데이터마트를 사용하면 셀프 서비스 부서별 다운스트림 보고 요구 사항(예: Excel, Power BI 보고서 등)에 대한 단일 저장소를 지정하여 셀프 서비스 솔루션의 인프라를 줄일 수 있습니다.

  • Power BI를 사용한 관계형 데이터베이스 분석: 외부 SQL 클라이언트를 사용하여 데이터마트의 데이터에 액세스합니다. Azure Synapse 및 T-SQL을 사용하는 기타 서비스/도구는 Power BI에서 데이터마트를 사용할 수도 있습니다.

  • 엔드투엔드 의미 체계 모델: Power BI 작성자가 다른 도구 또는 IT 팀에 의존하지 않고 엔드투엔드 솔루션을 빌드할 수 있도록 합니다. 데이터마트는 자동 생성된 의미 체계 모델을 통해 데이터 흐름과 의미 체계 모델 간의 오케스트레이션을 관리하는 동시에 Azure SQL DB에서 지원되는 데이터 및 임시 분석을 쿼리하기 위한 시각적 환경을 제공합니다.

다음 표에서는 데이터마트가 있는 역할을 비롯하여 이러한 제공과 각각에 가장 적합한 용도를 설명합니다.

Item 권장 사용 사례 데이터마트를 사용한 역할 보완
데이터마트 사용자 기반 데이터 웨어하우징 및 데이터에 대한 SQL 액세스 데이터마트는 SQL 엔드포인트를 사용하여 다른 데이터마트 또는 항목의 원본으로 사용할 수 있습니다.
  • 외부 공유
  • 보안을 사용하도록 설정된 부서 또는 조직의 경계를 넘어선 공유
데이터 흐름 의미 체계 모델 또는 마트에 대한 ETL(재사용 가능한 데이터 준비) 데이터마트는 ETL에 대한 단일 기본 제공 데이터 흐름을 사용합니다. 데이터 흐름은 이를 강조하여 다음을 지원합니다.
  • 여러 새로 고침 일정으로 데이터마트에 데이터 로드
  • 의미 체계 모델에 다시 사용할 수 있도록 스토리지에서 ETL 및 데이터 준비 단계 분리
의미 체계 모델 BI 보고를 위한 메트릭 및 의미 체계 계층 데이터마트는 보고에 대해 자동으로 생성된 의미 체계 모델을 제공하여 다음을 지원합니다.
  • 여러 원본의 데이터 결합
  • 세분화된 보고를 위한 데이터마트 테이블의 선택적 공유
  • 복합 모델 - 데이터마트 및 데이터마트 외부의 다른 데이터 원본에서 온 데이터가 포함된 의미 체계 모델
  • 프록시 모델 - 단일 원본을 사용하여 자동 생성된 모델에 DirectQuery를 사용하는 의미 체계 모델

데이터마트 및 데이터 흐름 통합

경우에 따라 데이터 흐름과 데이터마트를 모두 동일한 솔루션에 통합하는 것이 유용할 수 있습니다. 다음 상황에서는 데이터 흐름과 데이터마트를 모두 통합하는 것이 유리할 수 있습니다.

  • 기존 데이터 흐름이 있는 솔루션의 경우:

    • 데이터마트로 데이터를 쉽게 사용하여 추가 변환을 적용하거나 SQL 쿼리를 사용하여 임시 분석 및 쿼리를 사용하도록 설정
    • 의미 체계 모델 관리 없이 코드 없는 데이터 웨어하우징 솔루션을 쉽게 통합
  • 기존 데이터마트가 있는 솔루션의 경우:

    • 대규모 데이터 볼륨에 대해 재사용 가능한 ETL(추출, 변환 및 로드) 수행
    • 사용자 고유의 데이터 레이크를 가져오고 데이터 흐름을 데이터마트의 파이프라인으로 사용

데이터 마트 및 데이터 흐름을 보여 주는 다이어그램

데이터 흐름과 데이터마트 비교

이 섹션에서는 데이터 흐름과 데이터마트의 차이점을 설명합니다.

데이터 흐름은 재사용 가능한 ETL(추출, 변환 및 로드)을 제공합니다. 테이블은 의미 체계 모델 없이 검색, 쿼리 또는 탐색할 수 없지만, 다시 사용하도록 정의할 수는 있습니다. 사용자 고유의 데이터 레이크를 가져오는 경우 데이터는 Power BI 또는 CDM 형식으로 노출됩니다. 데이터 흐름은 Power BI에서 데이터마트에 데이터를 수집하기 위해 사용됩니다. ETL 논리를 다시 사용하려는 경우 데이터 흐름을 사용해야 합니다.

다음을 수행해야 하는 경우 데이터 흐름을 사용합니다.

  • Power BI의 항목에 대해 재사용 가능하고 공유할 수 있는 데이터 준비를 빌드합니다.

데이터마트는 관계형 및 완전 관리형 Azure SQL DB에서 데이터를 저장하고 탐색할 수 있는 완전 관리형 데이터베이스입니다. 데이터마트는 SQL 지원, 코드 없는 시각적 쿼리 디자이너, RLS(행 수준 보안) 및 각 데이터마트에 대한 의미 체계 모델 자동 생성을 제공합니다. 임시 분석 수행 및 보고서 만들기를 모두 웹에서 할 수 있습니다.

데이터마트를 사용하는 경우:

  • 시각적으로 또는 SQL에 정의된 식을 통해 정렬, 필터링 및 단순 집계 수행
  • 데이터의 결과, 집합, 테이블 및 필터링된 테이블인 출력의 경우
  • SQL 엔드포인트를 통해 액세스 가능한 데이터 제공
  • Power BI Desktop에 대한 액세스 권한이 없는 사용자 활성화

이 문서는 데이터마트와 다양한 사용 방법에 대한 개요를 제공했습니다.

다음 문서에서는 데이터마트 및 Power BI에 관한 자세한 정보를 제공합니다.

데이터 흐름 및 데이터 변환에 대한 자세한 내용은 다음 문서를 참조하세요.