변경 데이터 캡처 리소스를 사용하여 Azure Data Lake Storage Gen2에서 Azure SQL Database로 변경된 데이터 캡처

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

이 문서에서는 Azure Data Factory 사용자 인터페이스를 사용하여 CDC(변경 데이터 캡처) 리소스를 만듭니다. 리소스는 Azure Data Lake Storage Gen2 원본에서 변경된 데이터를 선택하고 실시간으로 Azure SQL Database에 추가합니다.

이 문서에서는 다음 방법을 설명합니다.

  • CDC 리소스를 만듭니다.
  • CDC 활동을 모니터링합니다.

이 문서에서 구성 패턴을 수정하고 확장할 수 있습니다.

필수 조건

이 문서의 절차를 시작하기 전에 다음 리소스가 있는지 확인합니다.

  • Azure 구독. Azure 구독이 없는 경우 무료 Azure 계정을 만듭니다.
  • SQL 데이터베이스. Azure SQL Database를 원본 데이터 저장소로 사용합니다. SQL 데이터베이스가 없는 경우 Azure Portal에서 만듭니다.
  • 스토리지 계정. Azure Data Lake Storage Gen2에 저장된 Delta Lake를 대상 데이터 저장소로 사용합니다. 스토리지 계정이 없는 경우 스토리지 계정을 만드는 단계는 스토리지 계정 만들기를 참조하세요.

CDC 아티팩트 만들기

  1. 데이터 팩터리의 작성 자 창으로 이동합니다. 파이프라인 아래에는 변경 데이터 캡처(미리 보기)라는 새로운 최상위 아티팩트가 나타납니다.

    Screenshot of a new top-level artifact for change data capture on the Factory Resources pane.

  2. 세 개의 점이 나타날 때까지 변경 데이터 캡처(미리 보기)를 마우스로 가리킵니다. 그런 다음, 데이터 캡처 변경(미리 보기) 작업을 선택합니다.

    Screenshot of the button for change data capture actions appearing over the new top-level artifact.

  3. 새 CDC(미리 보기)를 선택합니다. 이 단계에서는 플라이아웃을 열어 단계별 프로세스를 시작합니다.

    Screenshot of a list of change data capture actions.

  4. CDC 리소스의 이름을 지정하라는 메시지가 표시됩니다. 기본적으로 이름은 "adfcdc"이며 숫자는 1씩 증가합니다. 이 기본 이름을 선택한 이름으로 바꿀 수 있습니다.

    Screenshot of the text box to update the name of a resource.

  5. 드롭다운 목록을 사용하여 데이터 원본을 선택합니다. 이 문서에서는 DelimitedText를 선택합니다.

    Screenshot of the guided process flyout with source options in a dropdown list.

  6. 연결된 서비스를 선택하라는 메시지가 표시됩니다. 새 연결된 서비스를 만들거나 기존 서비스를 선택합니다.

    Screenshot of the box to choose or create a linked service.

  7. 원본 설정 영역을 사용하여 선택적으로 열 및 행 구분 기호를 포함한 고급 원본 구성을 설정합니다.

    Screenshot of advanced source settings to set delimiters.

    이러한 원본 설정을 수동으로 편집하지 않으면 기본값으로 설정됩니다.

  8. 찾아보기 단추를 사용하여 원본 데이터 폴더를 선택합니다.

    Screenshot of a folder icon to browse for a folder path.

  9. 폴더 경로를 선택한 후 [계속]을 선택하여 데이터 대상을 설정합니다.

    Screenshot of the Continue button in the guided process to select data targets.

    더하기(+) 단추를 사용하여 여러 원본 폴더를 추가하도록 선택할 수 있습니다. 다른 원본도 이미 선택한 것과 동일한 연결된 서비스를 사용해야 합니다.

  10. 드롭다운 목록을 사용하여 대상 형식 값을 선택합니다. 이 문서에서는 Azure SQL Database를 선택합니다.

    Screenshot of a dropdown menu of all data target types.

  11. 연결된 서비스를 선택하라는 메시지가 표시됩니다. 새 연결된 서비스를 만들거나 기존 서비스를 선택합니다.

    Screenshot of the box to choose or create a linked service to your data target.

  12. 대상 테이블의 경우 새 대상 테이블을 만들거나 기존 대상 테이블을 선택할 수 있습니다.

    • 대상 테이블을 만들려면 새 엔터티 탭을 선택한 다음 새 테이블 편집을 선택합니다.

      Screenshot of the tab to create new tables for your target.

    • 기존 테이블을 선택하려면 기존 엔터티 탭을 선택한 다음 검사 상자를 사용하여 테이블을 선택합니다. 미리 보기 단추를 사용하여 테이블 데이터를 봅니다.

      Screenshot of the tab to choose tables for your target.

    대상의 기존 테이블에 이름이 일치하는 경우 기존 엔터티에서 기본적으로 선택됩니다. 그렇지 않은 경우 이름이 일치하는 새 테이블이 새 엔터티 아래에 만들어집니다. 또한 새 테이블 편집 단추를 사용하여 새 테이블을 편집할 수 있습니다.

  13. 검사box를 사용하여 SQL 데이터베이스에서 여러 대상 테이블을 선택할 수 있습니다. 대상 테이블 선택을 마친 후 [계속]을 선택합니다.

    Screenshot of the Continue button in the guided process to proceed to the next step.

  14. 변경 데이터를 캡처하기 위한 새 탭이 나타납니다. 이 탭은 새 리소스를 구성할 수 있는 CDC Studio입니다.

    Screenshot of the change data capture studio.

    새 매핑이 자동으로 만들어집니다. 드롭다운 목록을 사용하여 매핑에 대한 원본 테이블대상 테이블 선택을 업데이트할 수 있습니다.

    Screenshot of the source-to-target mapping in the change data capture studio.

  15. 테이블을 선택하면 해당 열이 기본적으로 자동 맵 토글이 켜져 매핑됩니다. 자동 매핑 은 싱크에서 이름으로 열을 자동으로 매핑하고, 원본 스키마가 진화할 때 새 열 변경 내용을 선택하고, 이 정보를 지원되는 싱크 형식으로 흐릅니다.

    자동 맵을 사용하고 열 매핑을 변경하지 않으려면 18단계로 직접 이동합니다.

    Screenshot of the toggle for automatic mapping turned on.

    열 매핑을 사용하도록 설정하려면 매핑을 선택하고 자동 맵 토글을 해제합니다. 그런 다음 열 매핑 단추를 선택하여 매핑을 봅니다.

    Screenshot of mapping selection, the toggle for automatic mapping turned off, and the button for column mappings.

    자동 맵 토글을 켜면 언제든지 자동 매핑으로 다시 전환할 수 있습니다.

  16. 열 매핑을 봅니다. 드롭다운 목록을 사용하여 매핑 메서드, 원본 열 및 대상 열에 대한 매핑을 편집합니다.

    Screenshot of the page for editing column mappings.

    이 페이지에서 다음을 수행할 수 있습니다.

    • 새 매핑 단추를 사용하여 열 매핑더 추가합니다. 드롭다운 목록을 사용하여 매핑 메서드, 원본 열 및 대상 열을 선택합니다.
    • 지원되는 싱크 형식에 대한 삭제 작업을 추적하려면 키 열을 선택합니다.
    • 데이터 미리 보기에서 새로 고침 단추를 선택하여 데이터가 대상을 보는 방식을 시각화합니다.

    Screenshot of the button for adding column mappings, the dropdown list for mapping methods, the Keys column, and the Refresh button.

  17. 매핑이 완료되면 화살표 단추를 선택하여 기본 CDC 캔버스로 돌아갑니다.

    Screenshot of the button to go back to the table mapping page.

  18. 하나의 CDC 아티팩트에서 원본-대상 매핑을 더 추가할 수 있습니다. 편집 단추를 사용하여 데이터 원본 및 대상을 더 추가합니다. 그런 다음 새 매핑을 선택하고 드롭다운 목록을 사용하여 새 원본 및 대상을 설정합니다. 이러한 각 매핑에 대해 독립적으로 자동 맵을 켜거나 끌 수 있습니다.

    Screenshot of the button to add new sources and the button to set a new source-to-target mapping.

  19. 매핑이 완료되면 대기 시간 설정 단추를 사용하여 CDC 대기 시간을 설정합니다.

    Screenshot of the Set Latency button at the top of the canvas.

  20. CDC의 대기 시간을 선택한 다음 적용을 선택하여 변경합니다.

    기본적으로 대기 시간은 15분으로 설정됩니다. 이 문서의 예제에서는 대기 시간에 대한 실시간 옵션을 사용합니다. 실시간 대기 시간은 1분 미만의 간격으로 원본 데이터의 변경 내용을 지속적으로 선택합니다.

    다른 대기 시간(예: 15분을 선택하는 경우)의 경우 변경 데이터 캡처는 원본 데이터를 처리하고 마지막으로 처리된 시간 이후 변경된 데이터를 선택합니다.

    Screenshot of the options for setting latency.

    참고 항목

    지원이 스트리밍 데이터 통합(Azure Event Hubs 및 Kafka 데이터 원본)으로 확장되는 경우 대기 시간은 기본적으로 실시간으로 설정됩니다.

  21. CDC 구성을 완료한 후 모두 게시를 선택하여 변경 내용을 게시합니다.

    Screenshot of the publish button at the top of the canvas.

    참고 항목

    변경 내용을 게시하지 않으면 CDC 리소스를 시작할 수 없습니다. 다음 단계의 시작 단추를 사용할 수 없습니다.

  22. 시작을 선택하여 변경 데이터 캡처 실행을 시작합니다.

    Screenshot of the Start button at the top of the canvas.

변경 데이터 캡처 모니터링

  1. 다음 방법 중 하나를 사용하여 모니터 창을 엽니다.

    • Azure Portal에서 모니터를 선택합니다.

      Screenshot of the Monitor button in the Azure portal.

    • CDC 디자이너에서 모니터링 아이콘을 선택합니다.

      Screenshot of the monitoring icon at the top of the CDC canvas.

  2. 변경 데이터 캡처(미리 보기)를 선택하여 CDC 리소스를 봅니다.

    Screenshot of the Change Data Capture button.

    변경 데이터 캡처 창에는 변경 데이터 캡처에 대한 원본, 대상, 상태마지막으로 처리된 정보가 표시됩니다.

    Screenshot of an overview of the change data capture monitoring page.

  3. CDC의 이름을 선택하여 자세한 내용을 확인합니다. 다른 진단 정보와 함께 읽고 쓴 변경 내용(삽입, 업데이트 또는 삭제)을 확인할 수 있습니다.

    Screenshot of the detailed monitoring of a selected change data capture.

    변경 데이터 캡처에서 여러 매핑을 설정하는 경우 각 매핑은 다른 색으로 표시됩니다. 막대를 선택하여 각 매핑에 대한 특정 세부 정보를 확인하거나 창 아래쪽의 진단 정보를 사용합니다.

    Screenshot of the detailed monitoring information for a change data capture with multiple source-to-target mappings.

    Screenshot of a detailed breakdown of each mapping in a change data capture artifact.