Bitbucket Cloud 버전 제어

참고

Databricks에서는 Git 통합용 리포지토리를 사용하여 Azure Databricks의 작업을 원격 Git 리포지토리와 동기화할 것을 권장합니다.

이 가이드에서는 UI를 통해 Bitbucket Cloud를 사용하여 Notebooks의 버전 제어를 설정하는 방법을 설명합니다. 이 문서에서는 UI를 통해 Bitbucket Cloud 통합을 설정하는 방법을 설명하지만 Databricks CLI 또는 작업 영역 API 2.0을 사용하여 Notebook을 가져오고 내보내고 Bitbucket 도구를 사용하여 Notebook 버전을 관리할 수도 있습니다.

Git 버전 관리 사용 및 사용 안 함

기본적으로 버전 제어가 사용하도록 설정되어 있습니다. 이 설정을 전환하려면 Git에서 메모장 버전 관리 기능 관리를 참조하세요. Git 버전 관리가 사용하지 않도록 설정된 경우 Git 통합 탭이 사용자 설정 화면에 표시되지 않습니다.

버전 제어 구성

버전 제어 구성에는 버전 제어 공급자에서 액세스 자격 증명을 만들고 해당 자격 증명을 Azure Databricks에 추가하는 작업이 포함됩니다.

앱 암호 가져오기

  1. Bitbucket Cloud로 이동하여 리포지토리에 액세스할 수 있는 앱 암호를 만듭니다. Bitbucket Cloud 설명서를 참조하세요.
  2. 암호를 기록합니다. 다음 단계에서 Azure Databricks에 이 암호를 입력합니다.

Azure Databricks에 앱 암호 및 사용자 이름 저장

  1. 화면 왼쪽 하단에서 User Settings Icon설정을 클릭하고 사용자 설정을 선택합니다.
  2. Git 통합 탭을 클릭합니다.
  3. 이전에 자격 증명을 입력한 경우 설정 변경 단추를 클릭합니다.
  4. Git 공급자 드롭다운에서 Bitbucket Cloud를 선택합니다.
  5. 앱 암호 필드에 앱 암호를 붙여넣습니다.
  6. Git 공급자 사용자 이름 필드에 사용자 이름을 입력하고 저장을 클릭합니다.

Notebook 수정 버전 사용

기록 패널에서 Notebook 수정 버전을 사용합니다. Notebook의 오른쪽 위에 있는 수정 기록을 클릭하여 기록 패널을 엽니다.

Revision history

참고

기록 패널이 열려 있는 동안에는 전자 Notebook을 수정할 수 없습니다.

  1. 기록 패널을 엽니다. Git 상태 표시줄에 Git: 연결되지 않음이 표시됩니다.

    History panel - git not linked

  2. Git: 연결되지 않음을 클릭합니다.

    Git 기본 설정 대화가 나타납니다. Notebook을 처음 열면 Notebook이 Bitbucket Cloud에 없으므로 상태가 연결 해제됩니다.

    Git preferences - link new notebook

  3. 상태 필드에서 링크를 클릭합니다.

  4. 링크 필드에 Bitbucket Cloud 리포지토리의 URL을 붙여넣습니다.

  5. 분기 드롭다운을 클릭하고 분기를 선택합니다.

  6. Git 리포지토리의 경로 필드에서 파일을 저장할 리포지토리의 위치를 지정합니다.

    Python Notebook에는 제안된 기본 파일 확장명 .py가 있습니다. .ipynb를 사용하는 경우 Notebook은 iPython Notebook 형식으로 저장됩니다. 파일이 Bitbucket Cloud에 이미 있는 경우 파일의 URL을 직접 복사하여 붙여넣을 수 있습니다.

  7. 저장을 클릭하여 Notebook의 연결을 완료합니다. 이 파일이 이전에 존재하지 않는 경우 Bitbucket Cloud 리포지토리에 이 파일 저장 옵션이 포함된 프롬프트가 표시됩니다.

  8. 메시지를 입력하고 저장을 클릭합니다.

Bitbucket Cloud에 Notebook 저장

Notebook에 대한 변경 내용은 Azure Databricks 수정 기록에 자동으로 저장되지만 변경 내용은 Bitbucket Cloud에 자동으로 유지되지 않습니다.

  1. 기록 패널을 엽니다.

    History panel - save now

  2. 지금 저장을 클릭하여 Notebook을 Bitbucket Cloud에 저장합니다. Notebook 수정 버전 저장 대화 상자가 나타납니다.

  3. 필요에 따라 변경 내용을 설명하는 메시지를 입력합니다.

  4. 또한 Git에 커밋이 선택되어 있는지 확인합니다.

    Save revision

  5. 저장을 클릭합니다.

Bitbucket Cloud에서 Notebook을 버전으로 되돌리거나 업데이트합니다.

Notebook을 연결하면 기록 패널을 다시 열 때마다 Azure Databricks가 기록을 Git과 동기화합니다. Git에 동기화되는 버전에는 항목의 일부로 커밋 해시가 있습니다.

  1. 기록 패널을 엽니다.

    History panel

  2. 기록 패널에서 항목을 선택합니다. Azure Databricks는 해당 버전을 표시합니다.

  3. 이 버전 복원을 클릭합니다.

  4. 확인을 클릭하여 해당 버전을 복원할 것인지 확인합니다.

  1. 기록 패널을 엽니다.

  2. Git 상태 표시줄에 Git: Synced가 표시됩니다.

    Git status

  3. Git: Synced를 클릭합니다.

    Git preferences - unlink notebook

  4. Git 기본 설정 대화 상자에서 연결 해제를 클릭합니다.

  5. 저장을 클릭합니다.

  6. 확인을 클릭하여 버전 제어에서 Notebook 연결을 해제할 것인지 확인합니다.

끌어오기 요청 만들기

  1. 기록 패널을 엽니다.

  2. Git 상태 표시줄을 클릭하여 Git 기본 설정 대화 상자를 엽니다.

    Git preferences - create pull request

  3. PR 만들기를 클릭합니다. Bitbucket Cloud가 분기에 대한 끌어오기 요청 페이지로 열립니다.

코드 검토에 대한 모범 사례

Azure Databricks는 Git 분기를 지원합니다.

  • Notebook을 고유한 포크에 연결하고 분기를 선택할 수 있습니다.
  • 각 Notebook마다 별도의 분기를 사용하는 것이 좋습니다.
  • 변경 내용에 만족하면 Git 기본 설정 대화 상자에서 PR 만들기 링크를 사용하여 Bitbucket Cloud의 끌어오기 요청 페이지로 이동할 수 있습니다.
  • PR 만들기 링크는 부모 리포지토리의 기본 분기에서 작업하지 않는 경우에만 표시됩니다.

Bitbucket Server

중요

Bitbucket 서버 통합은 지원되지 않습니다. 그러나 작업 영역 API 2.0을 사용하여 프로그래밍 방식으로 Notebook을 만들고 Bitbucket 서버에서 코드 베이스를 관리할 수 있습니다.

문제 해결

Bitbucket Cloud 기록 동기화와 관련된 오류가 발생하면 다음을 확인합니다.

  1. Bitbucket Cloud에서 리포지토리를 초기화했으며 비어 있지 않습니다. 입력한 URL을 시도하고 Bitbucket Cloud 리포지토리로 전달되는지 확인합니다.
  2. 앱 암호가 활성화되어 있고 사용자 이름이 정확합니다.
  3. 리포지토리가 프라이빗인 경우 리포지토리에 대한 읽기 및 쓰기 액세스(Bitbucket Cloud를 통해)가 있어야 합니다.