Git-versiebeheer voor notebooks (verouderd)

Belangrijk

Ondersteuning voor Git-integratie van verouderde notebooks is verwijderd op 31 januari 2024. Databricks raadt u aan om Databricks Git-mappen te gebruiken om uw werk in Databricks te synchroniseren met een externe Git-opslagplaats.

In dit artikel wordt beschreven hoe u Git-versiebeheer instelt voor notebooks (verouderde functie). U kunt ook de Databricks CLI of Werkruimte-API gebruiken om notebooks te importeren en exporteren en Git-bewerkingen uit te voeren in uw lokale ontwikkelomgeving.

Git-versiebeheer in- en uitschakelen

Standaard is versiebeheer ingeschakeld. U kunt deze instelling als volgt in- of uitschakelen:

  1. Ga naar Instellingen> Werkruimte-instellingen.
  2. Schakel in de sectie Geavanceerd de schakeloptie Git-versiebeheer voor notebook uit.

Versiebeheer configureren

Als u versiebeheer wilt configureren, maakt u toegangsreferenties in uw Git-provider en voegt u deze referenties toe aan Azure Databricks.

Werken met notebookversies

U werkt met notebookversies in het geschiedenisvenster. Open het geschiedenisvenster door in de rechterzijbalk te pictogram versiegeschiedenis klikken.

Versiegeschiedenis

Notitie

U kunt een notitieblok niet wijzigen terwijl het geschiedenisvenster is geopend.

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk. Op de Git-statusbalk wordt Git: Niet gekoppeld weergegeven.

    Git-statusbalk

  2. Klik op Git: niet gekoppeld.

    Het dialoogvenster Git-voorkeuren wordt weergegeven. De eerste keer dat u uw notitieblok opent, is de status Ontkoppelen, omdat het notitieblok zich niet in GitHub bevindt.

    Git-voorkeuren - nieuw notitieblok koppelen

  3. Klik in het veld Status op Koppeling.

  4. Plak in het veld Koppeling de URL van de GitHub-opslagplaats.

  5. Klik op de vervolgkeuzelijst Branch en selecteer een vertakking of typ de naam van een nieuwe vertakking.

  6. Geef in het veld Pad in git-map op waar in de opslagplaats het bestand moet worden opgeslagen.

    Python-notebooks hebben de voorgestelde standaardbestandsextensie .py. Als u dit gebruikt .ipynb, wordt uw notebook opgeslagen in de iPython-notebookindeling. Als het bestand al bestaat op GitHub, kunt u de URL van het bestand rechtstreeks kopiëren en plakken.

  7. Klik op Opslaan om het koppelen van uw notitieblok te voltooien. Als dit bestand nog niet eerder bestond, wordt er een prompt weergegeven met de optie Dit bestand opslaan in uw GitHub-opslagplaats .

  8. Typ een bericht en klik op Opslaan.

Een notitieblok opslaan in GitHub

Hoewel de wijzigingen die u in uw notebook aanbrengt, automatisch worden opgeslagen in de versiegeschiedenis van Azure Databricks, blijven wijzigingen niet automatisch behouden in GitHub.

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk om het geschiedenisvenster te openen.

    Geschiedenisvenster - nu opslaan

  2. Klik op Nu opslaan om uw notitieblok op te slaan in GitHub. Het dialoogvenster Notitieblokversie opslaan wordt weergegeven.

  3. Voer desgewenst een bericht in om uw wijziging te beschrijven.

  4. Zorg ervoor dat ook doorvoeren naar Git is geselecteerd.

    Versie opslaan

  5. Klik op Opslaan.

Een notebook herstellen of bijwerken naar een versie vanuit GitHub

Zodra u een notebook hebt gekoppeld, synchroniseert Azure Databricks uw geschiedenis met Git telkens wanneer u het geschiedenisvenster opnieuw opent. Versies die met Git worden gesynchroniseerd, hebben doorvoer-hashes als onderdeel van de vermelding.

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk om het geschiedenisvenster te openen.

    Deelvenster Geschiedenis

  2. Kies een vermelding in het geschiedenisvenster. Azure Databricks geeft die versie weer.

  3. Klik op Deze versie herstellen.

  4. Klik op Bevestigen om te bevestigen dat u die versie wilt herstellen.

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk om het geschiedenisvenster te openen.

  2. Op de Git-statusbalk wordt Git: Gesynchroniseerd weergegeven.

    Geschiedenisvenster - afbeelding nu opslaan

  3. Klik op Git: gesynchroniseerd.

    Git-voorkeuren - notebook ontkoppelen

  4. Klik in het dialoogvenster Git-voorkeuren op Ontkoppelen.

  5. Klik op Opslaan.

  6. Klik op Bevestigen om te bevestigen dat u het notitieblok wilt ontkoppelen van versiebeheer.

Vertakkingen gebruiken

U kunt aan elke vertakking van uw opslagplaats werken en nieuwe vertakkingen maken in Azure Databricks.

Een vertakking maken

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk om het geschiedenisvenster te openen.

  2. Klik op de Git-statusbalk om het GitHub-deelvenster te openen.

  3. Klik op de vervolgkeuzelijst Vertakking .

  4. Voer een vertakkingsnaam in.

    Vertakking maken

  5. Selecteer de optie Vertakking maken onderaan de vervolgkeuzelijst. De bovenliggende vertakking wordt aangegeven. U vertakt altijd van de huidige geselecteerde vertakking.

Een pull-aanvraag maken

  1. Klik pictogram versiegeschiedenis in de rechterzijbalk om het geschiedenisvenster te openen.

  2. Klik op de Git-statusbalk om het GitHub-deelvenster te openen.

    Git-voorkeuren - pull-aanvraag maken

  3. Klik op Pull-aanvraag maken. GitHub wordt geopend op een pagina met pull-aanvragen voor de vertakking.

Een vertakking opnieuwbaseen

U kunt uw vertakking ook opnieuw baseeren in Azure Databricks. De Koppeling Rebase wordt weergegeven als er nieuwe doorvoeringen beschikbaar zijn in de bovenliggende vertakking. Alleen herstellen boven op de standaardvertakking van de bovenliggende opslagplaats wordt ondersteund.

Rebase

Stel dat u aan databricks/reference-appswerkt. U vertakt het in uw eigen account (bijvoorbeeld brkyvz) en begint te werken aan een vertakking met de naam my-branch. Als er een nieuwe update naar wordt gepusht databricks:master, wordt de Rebase knop weergegeven en kunt u de wijzigingen in uw vertakking brkyvz:my-branchophalen.

Rebasing werkt iets anders in Azure Databricks. Ga ervan uit dat de volgende vertakkingsstructuur:

Voordat de vertakkingsstructuur opnieuw wordt gebaseerd

Na een nieuwe basis ziet de vertakkingsstructuur er als volgt uit:

Na de herbase-vertakkingsstructuur

Wat hier anders is, is dat Doorvoeringen C5 en C6 niet van toepassing zijn op C4. Ze worden weergegeven als lokale wijzigingen in uw notitieblok. Samenvoegingsconflicten worden als volgt weergegeven:

Samenvoegingsconflict

U kunt vervolgens opnieuw doorvoeren naar GitHub met behulp van de knop Nu opslaan.

Wat gebeurt er als iemand vertakt van mijn vertakking die ik zojuist heb herbased?

Als uw vertakking (bijvoorbeeld branch-a) de basis was voor een andere vertakking (branch-b) en u zich opnieuw baseert, hoeft u zich geen zorgen te maken. Zodra een gebruiker ook opnieuw wordt gebaseerd branch-b, werkt alles goed. De aanbevolen procedure in deze situatie is het gebruik van afzonderlijke vertakkingen voor afzonderlijke notebooks.

Best practices voor codebeoordelingen

Azure Databricks biedt ondersteuning voor Git-vertakkingen.

  • U kunt een notebook koppelen aan elke vertakking in een opslagplaats. Azure Databricks raadt aan om voor elk notebook een afzonderlijke vertakking te gebruiken.
  • Tijdens de ontwikkeling kunt u een notebook koppelen aan een fork van een opslagplaats of aan een niet-standaardvertakking in de hoofdopslagplaats. Als u uw wijzigingen upstream wilt integreren, kunt u de koppeling Pull-aanvraag maken gebruiken in het dialoogvenster Git-voorkeuren in Azure Databricks om een GitHub-pull-aanvraag te maken. De koppeling Pull-aanvraag maken wordt alleen weergegeven als u niet werkt aan de standaardvertakking van de bovenliggende opslagplaats.

Probleemoplossing

Als u fouten ontvangt met betrekking tot de synchronisatie van de GitHub-geschiedenis, controleert u het volgende:

  • U kunt een notebook alleen koppelen aan een geïnitialiseerde Git-opslagplaats die niet leeg is. Test de URL in een webbrowser.
  • Het persoonlijk toegangstoken van GitHub moet actief zijn.
  • Als u een privé GitHub opslagplaats wilt gebruiken, moet u zijn gemachtigd om de opslagplaats te lezen.
  • Als een notebook is gekoppeld aan een GitHub-vertakking met de naam, wordt de wijziging niet automatisch doorgevoerd in Azure Databricks. U moet het notebook handmatig opnieuw koppelen aan de vertakking.

Migreren naar Git-mappen van Databricks

Gebruikers die vanuit het verouderde Git-versiebeheer naar Databricks Git-mappen moeten migreren, kunnen de volgende handleiding gebruiken: