다음을 통해 공유


데이터 웨어하우스 자습서 소개

적용 대상: Microsoft Fabric의 SQL 분석 엔드포인트 및 웨어하우스

Microsoft Fabric 은 모든 엔터프라이즈의 모든 분석 요구 사항에 대한 원스톱 상점을 제공합니다. 데이터 이동, 데이터 레이크, 데이터 엔지니어링, 데이터 통합 및 데이터 과학, 실시간 분석 및 비즈니스 인텔리전스를 포함한 전체 서비스 스펙트럼을 다룹니다. Microsoft Fabric을 사용하면 여러 공급업체의 서로 다른 서비스를 함께 연결할 필요가 없습니다. 대신, 고객은 쉽게 이해하고, 온보딩하고, 만들고, 운영할 수 있는 종단 간, 고도로 통합된 단일 포괄적인 제품을 즐깁니다. Microsoft Fabric에서 제공하는 폭, 깊이 및 수준의 통합을 제공하는 다른 제품은 없습니다. 또한 Microsoft Purview는 규정 준수 및 거버넌스 요구 사항을 충족하기 위해 기본적으로 모든 테넌트에 포함됩니다.

이 자습서의 목적

Microsoft Fabric의 많은 개념은 데이터 및 분석 전문가에게 익숙할 수 있지만 새 환경에서 이러한 개념을 적용하는 것은 어려울 수 있습니다. 이 자습서는 Microsoft Fabric 사용자 환경, 다양한 환경 및 통합 지점, Microsoft Fabric 전문가 및 시민 개발자 환경에 대한 기본적인 이해를 구축하기 위해 데이터 취득에서 데이터 소비에 이르는 엔드 투 엔드 시나리오를 단계별로 안내하도록 설계되었습니다.

자습서는 참조 아키텍처, 기능 및 기능의 전체 목록 또는 특정 모범 사례의 권장 사항이 아닙니다.

데이터 웨어하우스 엔드 투 엔드 시나리오

이 자습서의 필수 구성 요소로 다음 단계를 완료합니다.

  1. Power BI 온라인 계정에 로그인하거나 계정이 아직 없는 경우 평가판에 등록합니다.
  2. 테넌트에서 Microsoft Fabric 을 사용하도록 설정합니다.

이 자습서에서는 가상 의 Wide World Importers 회사에서 웨어하우스 개발자의 역할을 수행하고 Microsoft Fabric 포털에서 다음 단계를 완료하여 엔드 투 엔드 데이터 웨어하우스 솔루션을 빌드하고 구현합니다.

  1. Microsoft Fabric 작업 영역을 만듭니다.
  2. 웨어하우스를 만듭니다.
  3. 데이터 파이프라인을 사용하여 원본에서 데이터 웨어하우스 차원 모델로 데이터를 수집합니다.
  4. 웨어하우스에서 테이블을 만듭니다.
  5. SQL 쿼리 편집기를 사용하여 T-SQL 을 사용하여 데이터를 로드합니다.
  6. T-SQL을 사용하여 집계된 데이터 세트를 만들도록 데이터를 변환합니다.
  7. 시각적 쿼리 편집 기를 사용하여 데이터 웨어하우스를 쿼리합니다.
  8. Notebook을 사용하여 데이터를 분석합니다.
  9. SQL 쿼리 편집기를 사용하여 웨어하우스 간 쿼리를 만들고 실행합니다 .
  10. DirectLake 모드를 사용하여 Power BI 보고서를 만들어 데이터를 분석합니다.
  11. 데이터 허브에서 보고서를 작성합니다.
  12. 작업 영역 및 기타 항목을 삭제하여 리소스 를 정리합니다.

데이터 웨어하우스 엔드 투 엔드 아키텍처

데이터 웨어하우스 종단 간 아키텍처를 보여 주는 다이어그램.

데이터 원본 - Microsoft Fabric을 사용하면 Azure Data Services, 기타 클라우드 플랫폼 및 온-프레미스 데이터 원본에 쉽고 빠르게 연결하여 데이터를 수집할 수 있습니다.

수집 - Microsoft Fabric 파이프라인의 일부로 200개 이상의 네이티브 커넥터를 사용하고 데이터 흐름을 사용하여 데이터 변환을 끌어서 놓으면 조직에 대한 인사이트를 신속하게 작성할 수 있습니다. 바로 가기는 복사하거나 이동하지 않고도 기존 데이터에 연결하는 방법을 제공하는 Microsoft Fabric의 새로운 기능입니다. 이 자습서의 뒷부분에서 바로 가기 기능에 대한 자세한 내용을 확인할 수 있습니다.

변환 및 저장 - Microsoft Fabric은 Delta Lake 형식을 표준화합니다. 즉, Microsoft Fabric의 모든 엔진이 OneLake에 저장된 동일한 데이터를 읽고 작업할 수 있으므로 데이터 중복성이 필요하지 않습니다. 이 스토리지를 사용하면 조직의 필요에 따라 데이터 웨어하우스 또는 데이터 메시를 빌드할 수 있습니다. 변환의 경우 파이프라인/데이터 흐름을 사용하는 코드 부족 또는 코드 없음 환경을 선택하거나 코드 첫 번째 환경에 T-SQL을 사용할 수 있습니다.

소비 - 보고 및 시각화를 위해 업계 최고의 비즈니스 인텔리전스 도구인 Power BI에서 웨어하우스의 데이터를 사용할 수 있습니다. 각 웨어하우스에는 필요한 경우 다른 보고 도구에서 데이터를 쉽게 연결하고 쿼리할 수 있는 기본 제공 TDS 엔드포인트가 제공됩니다. 웨어하우스를 만들면 기본 의미 체계 모델이라고 하는 보조 항목이 동일한 이름으로 동시에 생성됩니다. 기본 의미 체계 모델을 사용하여 몇 가지 단계로 데이터 시각화를 시작할 수 있습니다.

샘플 데이터

샘플 데이터의 경우 WWI(Wide World Importers) 샘플 데이터베이스를 사용합니다. 데이터 웨어하우스 엔드 투 엔드 시나리오의 경우 Microsoft Fabric 플랫폼의 규모 및 성능 기능을 자세히 살펴보기에 충분한 데이터를 생성했습니다.

와이드 월드 수입국 (차 세계 대전)은 샌프란시스코 베이 지역에서 운영하는 도매 참신 상품 수입 및 유통 업체입니다. 도매업자로서, WWI의 고객은 주로 개인에게 재판매하는 회사입니다. WWI는 전문 상점, 슈퍼마켓, 컴퓨팅 상점, 관광 명소 상점, 일부 개인을 포함하여 미국 전역의 소매 고객에게 판매합니다. WWI는 WWI를 대신하여 제품을 홍보하는 에이전트 네트워크를 통해 다른 도매업자에게도 판매합니다. 회사 프로필 및 운영에 대한 자세한 내용은 Microsoft SQL용 Wide World Importers 샘플 데이터베이스를 참조하세요.

일반적으로 트랜잭션 시스템(또는 기간 업무 애플리케이션)의 데이터를 데이터 레이크 또는 데이터 웨어하우스 준비 영역으로 가져옵니다. 그러나 이 자습서에서는 WWI에서 제공하는 차원 모델을 초기 데이터 원본으로 사용합니다. 데이터를 데이터 웨어하우스로 수집하고 T-SQL을 통해 변환하는 원본으로 사용합니다.

데이터 모델

WWI 차원 모델에는 여러 팩트 테이블이 포함되어 있지만 이 자습서에서는 다음과 같이 테이블 및 관련 차원에만 집중 fact_sale 하여 이 엔드 투 엔드 데이터 웨어하우스 시나리오를 보여 줍니다.

fact_sale 테이블 및 관련 차원이 포함된 이 자습서에서 사용하는 데이터 모델을 보여 주는 다이어그램

다음 단계