Git-integrering med Databricks Git-mappar

Databricks Git-mappar är en visuell Git-klient och ETT API i Azure Databricks. Den stöder vanliga Git-åtgärder, till exempel kloning av en lagringsplats, incheckning och push-överföring, dragning, grenhantering och visuell jämförelse av diff vid incheckning.

I Git-mappar kan du utveckla kod i notebook-filer eller andra filer och följa metodtips för datavetenskap och teknisk kodutveckling med git för versionskontroll, samarbete och CI/CD.

Viktigt!

Databricks har ersatt funktionen "Repos" med integrerade Git-mappfunktioner i Databricks-arbetsytor. Mer information om den här ändringen finns i Vad hände med Databricks Repos?

Den här funktionen finns i offentlig förhandsversion i alla regioner.

Kommentar

Git-mappar (Repos) är främst utformade för redigering och samarbetsarbetsflöden.

Information om hur du migrerar från en äldre Git-integrering finns i Migrera till Git-mappar (tidigare Repos) från äldre Git.

Vad kan du göra med Databricks Git-mappar?

Databricks Git-mappar ger källkontroll för data- och AI-projekt genom integrering med Git-leverantörer.

I Databricks Git-mappar kan du använda Git-funktioner för att:

  • Klona, skicka till och hämta från en fjärransluten Git-lagringsplats.
  • Skapa och hantera grenar för utvecklingsarbete, inklusive sammanslagning, ombasering och konfliktlösning.
  • Skapa notebook-filer (inklusive IPYNB-notebook-filer) och redigera dem och andra filer.
  • Jämför skillnader visuellt vid incheckning och lösa sammanslagningskonflikter.

Stegvisa instruktioner finns i Köra Git-åtgärder på Databricks Git-mappar (Repos).

Kommentar

Databricks Git-mappar har också ett API som du kan integrera med din CI/CD-pipeline. Du kan till exempel programmatiskt uppdatera en Databricks-lagringsplats så att den alltid har den senaste versionen av koden. Information om metodtips för kodutveckling med Hjälp av Databricks Git-mappar finns i CI/CD-tekniker med Git- och Databricks Git-mappar (Repos).

Information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Exportera och importera Databricks-notebook-filer.

Git-providers som stöds

Databricks Git-mappar backas upp av en integrerad Git-lagringsplats. Lagringsplatsen kan hanteras av någon av moln- och företags-Git-leverantörerna som anges i följande avsnitt.

Kommentar

Vad är en "Git-provider"?

En "Git-provider" är den specifika (namngivna) tjänsten som är värd för en källkontrollmodell baserat på Git. Git-baserade källkontrollplattformar finns på två sätt: som en molntjänst som hanteras av det utvecklande företaget eller som en lokal tjänst installerad och hanterad av ditt eget företag på egen maskinvara. Många Git-leverantörer som GitHub, Microsoft, GitLab och Atlassian tillhandahåller både molnbaserade SaaS- och lokala (kallas ibland "självhanterade") Git-tjänster.

När du väljer din Git-provider under konfigurationen måste du vara medveten om skillnaderna mellan molnleverantörer (SaaS) och lokala Git-leverantörer. Lokala lösningar finns vanligtvis bakom ett företags VPN och kanske inte är tillgängliga från Internet. Vanligtvis har de lokala Git-leverantörerna ett namn som slutar med "Server" eller "Självhanterad", men om du är osäker kontaktar du företagets administratörer eller läser dokumentationen för Git-providern.

Om git-providern är molnbaserad och inte visas som en leverantör som stöds kan det fungera att välja "GitHub" som leverantör, men det är inte garanterat.

Kommentar

Om du använder "GitHub" som leverantör och fortfarande är osäker på om du använder molnet eller den lokala versionen läser du Om GitHub Enterprise Server i GitHub-dokumenten.

Git-molnleverantörer som stöds av Databricks

  • GitHub, GitHub AE och GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab och GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Lokala Git-leverantörer som stöds av Databricks

  • GitHub Enterprise Server
  • Atlassian BitBucket Server och Data Center
  • Självhanterad GitLab
  • Microsoft Azure DevOps Server: En arbetsyteadministratör måste uttryckligen tillåta att URL-domänprefixen för Din Microsoft Azure DevOps Server anges om URL:en inte matchar dev.azure.com/* eller visualstudio.com/*. Mer information finns i Begränsa användningen till URL:er i en lista över tillåtna

Om du integrerar en lokal Git-lagringsplats som inte är tillgänglig från Internet måste även en proxy för Git-autentiseringsbegäranden installeras i företagets VPN. Mer information finns i Konfigurera privat Git-anslutning för Databricks Git-mappar (Repos).

Information om hur du använder åtkomsttoken med din Git-provider finns i Konfigurera Git-autentiseringsuppgifter och ansluta en fjärrdatabas till Azure Databricks.

Resurser för Git-integrering

Använd Databricks CLI 2.0 för Git-integrering med Azure Databricks:

Läs följande referensdokument:

Nästa steg