Gegevens uit Azure Data Lake Storage Gen1 registreren in Azure Data Catalog

In dit artikel leert u hoe u Azure Data Lake Storage Gen1 integreert met Azure Data Catalog om uw gegevens vindbaar te maken binnen een organisatie door deze te integreren met Data Catalog. Zie Azure Data Catalog voor meer informatie over het catalogiseren van gegevens. Zie Algemene scenario's van Azure Data Catalog voor meer informatie over scenario's waarin u Data Catalog kunt gebruiken.

Vereisten

Voordat u met deze zelfstudie begint, moet u het volgende hebben of hebben gedaan:

Data Lake Storage Gen1 registreren als bron voor Data Catalog

  1. Ga naar https://azure.microsoft.com/services/data-catalogen klik op Aan de slag.

  2. Meld u aan bij de portal van Azure Data Catalog en klik op Gegevens publiceren.

    Een gegevensbron registreren

  3. Klik op de volgende pagina op Toepassing starten. Hiermee wordt het manifestbestand van de toepassing op uw computer gedownload. Dubbelklik op het manifestbestand om de toepassing te starten.

  4. Klik op de welkomstpagina op Aanmelden en voer uw referenties in.

    Welkomstscherm

  5. Selecteer op de pagina Een gegevensbron selecteren de optie Azure Data Lake Store en klik vervolgens op Volgende.

    Gegevensbron selecteren

  6. Geef op de volgende pagina de Data Lake Storage Gen1 accountnaam op die u wilt registreren in Data Catalog. Laat de andere opties op de standaardinstelling staan en klik vervolgens op Verbinding maken.

    Verbinding maken met gegevensbron

  7. De volgende pagina kan worden onderverdeeld in de volgende segmenten.

    a. Het vak Serverhiërarchie vertegenwoordigt de Data Lake Storage Gen1 accountmapstructuur. $Root vertegenwoordigt de hoofdmap van het Data Lake Storage Gen1 account en AmbulanceData staat voor de map die is gemaakt in de hoofdmap van het Data Lake Storage Gen1-account.

    b. Het vak Beschikbare objecten bevat de bestanden en mappen onder de map AmbulanceData .

    c. Het vak Objecten die moeten worden geregistreerd, bevat de bestanden en mappen die u wilt registreren in Azure Data Catalog.

    Schermopname van het dialoogvenster Microsoft Azure Data Catalog - Store-account.

  8. Voor deze zelfstudie moet u alle bestanden in de map registreren. Klik hiervoor op de knop (objecten verplaatsen verplaatsen) om alle bestanden te verplaatsen naar Objecten die moeten worden geregistreerd.

    Omdat de gegevens worden geregistreerd in een gegevenscatalogus voor de hele organisatie, is het een aanbevolen methode om enkele metagegevens toe te voegen die u later kunt gebruiken om de gegevens snel te vinden. U kunt bijvoorbeeld een e-mailadres toevoegen voor de gegevenseigenaar (bijvoorbeeld degene die de gegevens uploadt) of een tag toevoegen om de gegevens te identificeren. In de onderstaande schermopname ziet u een tag die u aan de gegevens toevoegt.

    Schermopname van het dialoogvenster Microsoft Azure Data Catalog - Store-account met de tag die is toegevoegd aan de gemarkeerde gegevens.

    Klik op Registreren.

  9. De volgende schermopname geeft aan dat de gegevens zijn geregistreerd in de Data Catalog.

    Registratie voltooid

  10. Klik op Portal weergeven om terug te gaan naar de Data Catalog portal en te controleren of u nu toegang hebt tot de geregistreerde gegevens vanuit de portal. Als u de gegevens wilt doorzoeken, kunt u de tag gebruiken die u hebt gebruikt bij het registreren van de gegevens.

    Gegevens zoeken in catalogus

  11. U kunt nu bewerkingen uitvoeren, zoals het toevoegen van aantekeningen en documentatie aan de gegevens. Zie de volgende koppelingen voor meer informatie.

Zie ook