Azure Synapse Analytics의 전용 SQL 풀(이전의 SQL DW)용 DWU(데이터 웨어하우스 단위)

이 문서에는 가격과 성능을 최적화하기 위해 전용 SQL 풀(이전의 SQL DW)에 이상적인 DWU(데이터 웨어하우스 단위) 수를 선택하는 방법과 단위 수를 변경하는 방법에 대한 권장 사항이 포함되어 있습니다.

데이터 웨어하우스 단위란?

전용 SQL 풀(이전의 SQL DW)은 프로비저닝되는 분석 리소스의 컬렉션을 나타냅니다. 분석 리소스는 CPU, 메모리 및 IO의 조합으로 정의됩니다.

이러한 세 가지 리소스는 DWU(데이터 웨어하우스 단위)라는 컴퓨팅 규모 단위의 번들로 제공됩니다. DWU는 컴퓨팅 리소스 및 성능의 추상적이고 정규화된 측정값을 나타냅니다.

서비스 수준을 변경하면 시스템에서 사용 가능한 DWU 수를 변경하여 시스템의 성능과 비용이 조정됩니다.

성능을 높이려면 데이터 웨어하우스 단위 수를 늘리면 됩니다. 성능을 낮추려면 데이터 웨어하우스 단위 수를 줄입니다. 스토리지 및 컴퓨팅 비용은 별도로 청구되므로 데이터 웨어하우스 단위를 변경해도 스토리지 비용에 영향을 미치지 않습니다.

데이터 웨어하우스 단위의 성능은 다음과 같은 데이터 웨어하우스 워크로드 메트릭을 기반으로 합니다.

  • 표준 전용 SQL 풀(이전 SQL DW)이 대량의 행을 검색한 후 복잡한 집계를 수행하는 속도. 이 작업은 I/O 및 CPU를 많이 사용합니다.
  • 전용 SQL 풀(이전의 SQL DW)이 Azure Storage Blob 또는 Azure Data Lake에서 데이터를 수집하는 속도. 이 작업은 네트워크 및 CPU를 많이 사용합니다.
  • CREATE TABLE AS SELECT T-SQL 명령이 테이블을 복사하는 속도. 이 작업에는 데이터를 스토리지에서 읽어오기, 어플라이언스의 노드 전체에 배포하기, 스토리지에 다시 쓰기가 포함됩니다. 이 작업은 CPU, IO 및 네트워크를 많이 사용합니다.

DWU 늘리기:

  • 검색, 집계 및 CTAS 문에 대한 시스템 성능을 선형적으로 변경합니다.
  • PolyBase 로드 작업용 판독기 및 작성기 수를 늘립니다.
  • 동시 쿼리 및 동시성 슬롯의 최대 수를 늘립니다.

서비스 수준 목표

SLO(서비스 수준 목표)는 전용 SQL 풀(이전의 SQL DW)의 비용 및 성능 수준을 결정하는 스케일링 성능 설정입니다. Gen2 전용 SQL 풀(이전의 SQL DW)의 서비스 수준은 DWU(데이터 웨어하우스 단위)로 측정됩니다(예: DW2000c).

참고 항목

전용 SQL 풀(이전의 SQL DW) Gen2는 최근에 DW100c만큼 낮은 컴퓨팅 계층을 지원하기 위해 스케일링 기능을 추가했습니다. 현재 Gen1에 있는 기존 데이터 웨어하우스는 하위 컴퓨팅 계층이 필요한 경우 이제 추가 비용 없이 현재 사용 가능한 지역에서 Gen2로 업그레이드할 수 있습니다. 해당 지역이 아직 지원되지 않는 경우에도 지원되는 지역으로 업그레이드할 수 있습니다. 자세한 내용은 Gen2로 업그레이드를 참조하세요.

T-SQL에서 SERVICE_OBJECTIVE 설정은 전용 SQL 풀(이전의 SQL DW)의 서비스 수준 및 성능 계층을 결정합니다.

CREATE DATABASE mySQLDW
(Edition = 'Datawarehouse'
 ,SERVICE_OBJECTIVE = 'DW1000c'
)
;

성능 계층 및 데이터 웨어하우스 단위

각 성능 계층은 약간 다른 데이터 웨어하우스의 측정 단위를 사용합니다. 이러한 차이는 크기 단위를 직접 요금 청구로 변환하므로 송장에 반영됩니다.

  • Gen1 데이터 웨어하우스는 DWU(데이터 웨어하우스 단위)로 측정됩니다.
  • Gen2 데이터 웨어하우스는 cDWU(컴퓨팅 데이터 웨어하우스 단위)로 측정됩니다.

DWU 및 cDWU 모두 컴퓨팅을 확장 또는 축소할 수 있고 데이터 웨어하우스를 사용할 필요가 없는 경우 컴퓨팅을 일시 중지할 수 있습니다. 이러한 작업은 모두 주문형 작업입니다. Gen2는 컴퓨팅 노드에서 로컬 디스크 기반 캐시를 사용하여 성능을 향상시킵니다. 시스템의 크기를 조정하거나 시스템을 일시 중지할 경우 캐시가 무효화되므로 최적의 성능을 얻으려면 캐시 준비 시간이 필요합니다.

용량 한도

각 SQL Server(예: myserver.database.windows.net)에는 특정 데이터 웨어하우스 단위 수를 허용하는 DTU(데이터베이스 트랜잭션 단위) 할당량이 지정되어 있습니다. 자세한 내용은 워크로드 관리 용량 제한을 참조하세요.

필요한 데이터 웨어하우스 단위

이상적인 데이터 웨어하우스 단위 수는 워크로드 및 시스템에 로드한 데이터 양에 따라 매우 다릅니다.

워크로드에 가장 적합한 DWU를 찾는 방법에 대한 단계:

  1. 더 작은 DWU를 선택하여 시작합니다.
  2. 시스템으로 로드하는 데이터를 테스트할 때 애플리케이션 성능을 모니터링하여 선택한 DWU 수와 관찰한 성능을 비교합니다.
  3. 정기적으로 작업량이 많은 기간에 필요한 추가 요구 사항을 식별합니다. 작업에서 고점과 저점이 나타나는 워크로드는 크기를 자주 조정해야 할 수도 있습니다.

전용 SQL 풀(이전의 SQL DW)은 데이터 양 조정이 가능한 대량의 컴퓨팅 및 쿼리를 프로비저닝할 수 있는 스케일 아웃 시스템입니다.

특히 큰 DWU에서 진정한 크기 조정 기능을 확인하려면 데이터에 충분한 CPU가 할당되도록 데이터 집합의 크기를 조정하는 것이 좋습니다. 크기 조정 테스트의 경우 1TB 이상을 사용하는 것이 좋습니다.

참고 항목

컴퓨팅 노드 간에 작업을 분할할 수 있는 경우 더 많은 병렬 처리를 통해 쿼리 성능만 증가합니다. 크기를 조정해도 성능이 변경되지 않는 경우 테이블 디자인 및/또는 쿼리를 튜닝해야 할 수 있습니다. 쿼리 튜닝 지침에 대해서는 사용자 쿼리 관리를 참조하세요.

사용 권한

데이터 웨어하우스 단위를 변경하려면 ALTER DATABASE에 설명된 권한이 필요합니다.

SQL DB 기여자 및 SQL Server 기여자와 같은 Azure 기본 제공 역할은 DWU 설정을 변경할 수 있습니다.

현재 DWU 설정 보기

현재 DWU 설정을 보려면:

  1. Visual Studio에서 SQL Server 개체 탐색기를 엽니다.
  2. 논리 SQL 서버와 연결된 마스터 데이터베이스에 연결합니다.
  3. sys.database_service_objectives 동적 관리 뷰에서 선택합니다. 예를 들어 다음과 같습니다.
SELECT  db.name [Database]
,        ds.edition [Edition]
,        ds.service_objective [Service Objective]
FROM    sys.database_service_objectives   AS ds
JOIN    sys.databases                     AS db ON ds.database_id = db.database_id
;

데이터 웨어하우스 단위 변경

Azure Portal

DWU를 변경하는 방법은 다음과 같습니다.

  1. Azure Portal을 열고 데이터베이스를 연 다음 크기 조정을 클릭합니다.

  2. 크기 조정에서 슬라이더를 왼쪽 또는 오른쪽으로 이동해 DWU 설정을 변경합니다.

  3. 저장을 클릭합니다. 확인 메시지가 표시됩니다. 를 클릭하여 확인하거나 아니요를 클릭하여 취소합니다.

PowerShell

참고 항목

Azure Az PowerShell 모듈을 사용하여 Azure와 상호 작용하는 것이 좋습니다. 시작하려면 Azure PowerShell 설치를 참조하세요. Az PowerShell 모듈로 마이그레이션하는 방법에 대한 자세한 내용은 Azure PowerShell을 AzureRM에서 Azure로 마이그레이션을 참조하세요.

DWU를 변경하려면 Set-AzSqlDatabase PowerShell cmdlet을 사용합니다. 다음 예제에서는 MyServer에서 호스트되는 MySQLDW 데이터베이스에 대한 서비스 수준 목표를 DW1000으로 설정합니다.

Set-AzSqlDatabase -DatabaseName "MySQLDW" -ServerName "MyServer" -RequestedServiceObjectiveName "DW1000c"

자세한 내용은 전용 SQL 풀(이전의 SQL DW)용 PowerShell cmdlet을 참조하세요.

T-SQL

T-SQL을 사용하여 현재 DWU 설정을 보고, 설정을 변경하고, 진행 상황을 확인할 수 있습니다.

DWU를 변경하려면

  1. 서버와 연결된 마스터 데이터베이스에 연결합니다.
  2. ALTER DATABASE TSQL 문을 사용합니다. 다음 예제에서는 MySQLDW 데이터베이스에 대한 서비스 수준 목표를 DW1000c로 설정합니다.
ALTER DATABASE MySQLDW
MODIFY (SERVICE_OBJECTIVE = 'DW1000c')
;

REST API

DWU를 변경하려면 데이터베이스 생성 또는 업데이트 REST API를 사용합니다. 다음 예에서는 MyServer에서 호스트되는 MySQLDW 데이터베이스에 대한 서비스 수준 목표를 DW1000c로 설정합니다. 서버는 이름이 ResourceGroup1인 Azure 리소스 그룹 내에 있습니다.

PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group-name}/providers/Microsoft.Sql/servers/{server-name}/databases/{database-name}?api-version=2014-04-01-preview HTTP/1.1
Content-Type: application/json; charset=UTF-8

{
    "properties": {
        "requestedServiceObjectiveName": "DW1000c"
    }
}

자세한 REST API 예제는 전용 SQL 풀(이전의 SQL DW)용 REST API를 참조하세요.

DWU 변경 상태 확인

DWU 변경을 완료하는 데는 몇 분 정도 걸릴 수 있습니다. 자동으로 크기를 조정하는 경우 다른 작업을 진행하기 전에 특정 작업이 완료되었는지 확인하는 논리를 구현하는 것이 좋습니다.

다양한 엔드포인트를 통해 데이터베이스 상태를 확인하면 자동화를 올바르게 구현할 수 있습니다. 포털에서는 작업 완료 시의 알림과 데이터베이스 현재 상태를 제공하지만 프로그래밍 방식으로 상태를 확인할 수는 없습니다.

Azure Portal에서 스케일 아웃 작업에 대한 데이터베이스 상태를 확인할 수 없습니다.

DWU 변경 상태를 확인하려면:

  1. 서버와 연결된 마스터 데이터베이스에 연결합니다.

  2. 다음 쿼리를 제출하여 데이터베이스 상태를 확인합니다.

    SELECT    *
    FROM      sys.dm_operation_status
    WHERE     resource_type_desc = 'Database'
    AND       major_resource_id = 'MySQLDW'
    ;
    

이 DMV는 전용 SQL 풀(이전의 SQL DW)에서 수행되는 작업 및 작업 상태(IN_PROGRESS 또는 COMPLETED)와 같은 다양한 관리 작업에 대한 정보를 반환합니다.

크기 조정 워크플로

크기 조정 작업을 시작할 때 시스템은 먼저 열려 있는 모든 세션을 종료하고 일관된 상태를 유지하도록 열려 있는 모든 트랜잭션을 롤백합니다. 크기 조정 작업의 경우 이 트랜잭션 롤백을 완료한 후에만 크기 조정이 수행됩니다.

  • 확장 작업의 경우 시스템에서는 모든 컴퓨팅 노드를 분리하고 추가 컴퓨팅 노드를 프로비저닝한 다음, 스토리지 계층에 다시 연결합니다.
  • 축소 작업의 경우 시스템에서는 모든 컴퓨팅 노드를 분리한 다음, 필요한 노드만 스토리지 계층에 다시 연결합니다.

다음 단계

성능 관리에 대한 자세한 내용은 워크로드 관리에 대한 리소스 클래스메모리와 동시성 제한을 참조하세요.