Databricks Git 폴더와 Git 통합

Databricks Git 폴더는 Azure Databricks의 시각적 Git 클라이언트 및 API입니다. 리포지토리 복제, 커밋 및 푸시, 끌어오기, 분기 관리 및 커밋 시 차이의 시각적 비교와 같은 일반적인 Git 작업을 지원합니다.

Git 폴더 내에서 Notebook 또는 다른 파일에서 코드를 개발하고 버전 제어, 공동 작업 및 CI/CD에 Git을 사용하여 데이터 과학 및 엔지니어링 코드 개발 모범 사례를 따를 수 있습니다.

Important

Databricks는 "Repos" 기능을 Databricks 작업 영역 내의 통합 Git 폴더 기능으로 대체했습니다. 이 변경 내용에 대한 자세한 내용은 Databricks Repos의 변경 내용을 참조 하세요.

이 기능은 모든 지역의 공개 미리 보기 에 있습니다.

참고 항목

Git 폴더(Repos)는 주로 작성 및 공동 작업 워크플로를 위해 설계되었습니다.

레거시 Git 통합에서 마이그레이션하는 방법에 대한 자세한 내용은 레거시 Git에서 Git 폴더(이전의 Repos)로 마이그레이션을 참조하세요.

Databricks Git 폴더로 무엇을 할 수 있나요?

Databricks Git 폴더는 Git 공급자와 통합하여 데이터 및 AI 프로젝트에 대한 소스 제어를 제공합니다.

Databricks Git 폴더에서 Git 기능을 사용하여 다음을 수행할 수 있습니다.

  • 원격 Git 리포지토리를 복제하고, 원격 Git 리포지토리로 푸시하고, 원격 Git 리포지토리에서 끌어옵니다.
  • 병합, 재지정 및 충돌 해결을 포함하여 개발 작업을 위한 분기를 만들고 관리합니다.
  • 전자 필기장(IPYNB Notebook 포함)을 만들고 전자 필기장 및 기타 파일을 편집합니다.
  • 커밋 시 차이점을 시각적으로 비교하고 병합 충돌 해결합니다.

단계별 지침은 Databricks Git 폴더(Repos)에서 Git 작업 실행을 참조하세요.

참고 항목

Databricks Git 폴더에는 CI/CD 파이프라인과 통합할 수 있는 API 도 있습니다. 예를 들어 Databricks 리포지토리를 프로그래밍 방식으로 업데이트하여 항상 최신 코드 버전을 사용하도록 할 수 있습니다. Databricks Git 폴더를 사용한 코드 개발 모범 사례에 대한 자세한 내용은 Git 및 Databricks Git 폴더(Repos)를 사용하는 CI/CD 기술을 참조하세요.

Azure Databricks에서 지원되는 Notebook의 종류에 대한 자세한 내용은 Databricks Notebook 내보내기 및 가져오기를 참조 하세요.

지원되는 Git 공급자

Databricks Git 폴더는 통합 Git 리포지토리에서 지원됩니다. 리포지토리는 다음 섹션에 나열된 클라우드 및 엔터프라이즈 Git 공급자에서 호스트할 수 있습니다.

참고 항목

"Git 공급자"란?

"Git 공급자"는 Git을 기반으로 소스 제어 모델을 호스트하는 특정(명명된) 서비스입니다. Git 기반 소스 제어 플랫폼은 개발 회사에서 호스트하는 클라우드 서비스 또는 자체 하드웨어에서 자체 회사에서 설치 및 관리하는 온-프레미스 서비스로 두 가지 방법으로 호스트됩니다. GitHub, Microsoft, GitLab 및 Atlassian과 같은 많은 Git 공급자는 클라우드 기반 SaaS와 온-프레미스("자체 관리"라고도 함) Git 서비스를 모두 제공합니다.

구성 중에 Git 공급자를 선택할 때는 클라우드(SaaS)와 온-프레미스 Git 공급자 간의 차이점을 알고 있어야 합니다. 온-프레미스 솔루션은 일반적으로 회사 VPN 뒤에서 호스트되며 인터넷에서 액세스할 수 없습니다. 일반적으로 온-프레미스 Git 공급자의 이름은 "서버" 또는 "자체 관리"로 끝나지만 확실하지 않은 경우 회사 관리자에게 문의하거나 Git 공급자의 설명서를 검토하세요.

Git 공급자가 클라우드 기반이고 지원되는 공급자로 나열되지 않은 경우 공급자로 "GitHub"를 선택하면 작동할 수 있지만 보장되지는 않습니다.

참고 항목

"GitHub"를 공급자로 사용하고 있으며 클라우드 또는 온-프레미스 버전을 사용하는지 아직 확실하지 않은 경우 GitHub 문서의 GitHub Enterprise Server 정보(About GitHub Enterprise Server)를 참조하세요.

Databricks에서 지원하는 클라우드 Git 공급자

  • GitHub, GitHub AE 및 GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab 및 GitLab EE
  • Microsoft Azure DevOps(Azure Repos)

Databricks에서 지원하는 온-프레미스 Git 공급자

  • GitHub Enterprise 서버
  • Atlassian BitBucket 서버 및 데이터 센터
  • GitLab 자체 관리형
  • Microsoft Azure DevOps Server: 작업 영역 관리자는 URL이 일치하지 dev.azure.com/*visualstudio.com/*않거나 일치하지 않는 경우 MICROSOFT Azure DevOps Server에 대한 접두사로 URL을 명시적으로 허용 목록에 추가해야 합니다기본. 자세한 내용은 허용 목록에서 URL로 사용 제한을 참조 하세요.

인터넷에서 액세스할 수 없는 온-프레미스 Git 리포지토리를 통합하는 경우 Git 인증 요청에 대한 프록시도 회사의 VPN 내에 설치해야 합니다. 자세한 내용은 Databricks Git 폴더(Repos)에 대한 프라이빗 Git 연결 설정을 참조하세요.

Git 공급자와 함께 액세스 토큰을 사용하는 방법을 알아보려면 Git 자격 증명 구성 및 Azure Databricks에 원격 리포지토리 연결을 참조 하세요.

Git 통합을 위한 리소스

Azure Databricks와 Git 통합을 위해 Databricks CLI 2.0을 사용합니다.

다음 참조 문서를 읽습니다.

다음 단계