Gebruikershandleiding Data Catalog Azure Purview Data Catalog gegevens

In dit artikel vindt u een overzicht van de gegevensragefuncties in Azure Purview Data Catalog.

Achtergrond

Een van de platformfuncties van Azure Purview is de mogelijkheid om de gegevenslijn weer te geven tussen gegevenssets die zijn gemaakt door gegevensprocessen. Systemen zoals Data Factory, Data Share en Power BI de gegevensrage vastleggen terwijl deze zich verplaatst. Aangepaste rapportage van de regel wordt ook ondersteund via Atlas-hooks en REST API.

Gegevensverzameling

Metagegevens die in Azure Purview worden verzameld vanuit bedrijfsgegevenssystemen, worden over elkaar gepingd om een end-to-end gegevenslijn weer te geven. Gegevenssystemen die gegevens in Purview verzamelen, worden breed gecategoriseerd in de volgende drie typen.

Gegevensverwerkingssysteem

Gegevensintegratie en ETL-hulpprogramma's kunnen gegevensgegevens tijdens de uitvoering naar Azure Purview pushen. Hulpprogramma's zoals Data Factory, Data Share, Synapse, Azure Databricks, en dergelijke, behoren tot deze categorie gegevenssystemen. De gegevensverwerkingssystemen verwijzen naar gegevenssets als bron uit verschillende databases en opslagoplossingen om doelgegevenssets te maken. De lijst met systemen voor gegevensverwerking die momenteel zijn geïntegreerd met Purview voor gegevensvereeding, vindt u in de onderstaande tabel.

Gegevensverwerkingssysteem Ondersteund bereik
Azure Data Factory Copy-activiteit
Gegevensstroomactiviteit
Activiteit van SSIS-pakket uitvoeren
Azure Synapse Analytics Copy-activiteit
Gegevensstroomactiviteit
Azure Data Share Momentopname delen

Systemen voor gegevensopslag

Databases & opslagoplossingen zoals SQL Server, Teradata en SAP hebben query-engines om gegevens te transformeren met behulp van scripttaal. Gegevensrage van opgeslagen procedures wordt verzameld in Purview en samengeborduurd met gegevens van andere systemen.

Gegevensopslagsysteem Ondersteund bereik
Teradata Opgeslagen procedures

Gegevensanalyse & rapportagesystemen

Gegevenssystemen zoals Azure ML en Power BI in Azure Purview. Deze systemen gebruiken de gegevenssets van opslagsystemen en verwerken deze via hun metamodel om bidashboards en ML experimenten te maken, en meer.

Gegevensanalyse & rapportagesysteem Ondersteund bereik
Power BI Gegevenssets, gegevensstromen, rapporten & Dashboards

Aan de slag met de vereending

Gegevenssets en processen zijn gegevenssets en processen. Gegevenssets worden ook wel knooppunten genoemd, terwijl processen ook randen kunnen worden genoemd:

  • Gegevensset (Node): een gegevensset (gestructureerd of ongestructureerd) die wordt geleverd als invoer voor een proces. Zo worden een SQL Table, Azure Blob en bestanden (zoals .csv en .xml) allemaal beschouwd als gegevenssets. In de sectie Gegevenssets in de sectie Gegevenssets op basis van gegevenssets worden rechthoekige vakken weergegeven.

  • Proces (Edge): een activiteit of transformatie die wordt uitgevoerd op een gegevensset wordt een proces genoemd. ADF kan bijvoorbeeld Copy-activiteit, Data Share momentopname maken, en meer. In de sectie gegevensverzending van Purview worden processen vertegenwoordigd door vakken aan de rand.

Volg de stappen voor toegang tot gegevens over de gegevens van de gegevens van de gegevens in Purview:

  1. Ga in Azure Portal naar de pagina Azure Purview-accounts.

  2. Selecteer uw Azure Purview-account in de lijst en selecteer vervolgens Launch purview account op de pagina Overzicht.

  3. Zoek op de startpagina van Azure Purview naar de naam van een gegevensset of de procesnaam, zoals ADF Copy of Data Flow activiteit. Druk vervolgens op Enter.

  4. Selecteer in de zoekresultaten de asset en selecteer het tabblad Gegevenseedage.

    Schermopname die laat zien hoe u het tabblad Gegevenseedage selecteert.

Afspiegeling op assetniveau

Azure Purview biedt ondersteuning voor gegevenssets en processen op assetniveau. Als u de gegevenslijn op assetniveau wilt zien, gaat u naar het tabblad Gegevenseedage van de huidige asset in de catalogus. Selecteer het asset-knooppunt van de huidige gegevensset. Standaard wordt de lijst met kolommen die tot de gegevens behoren, weergegeven in het linkerdeelvenster.

Schermopname die laat zien hoe u Kolommen weergeven selecteert op de pagina voor de regel

Gegevenssetkolomlijn

Als u de gegevenslijn op kolomniveau van een gegevensset wilt zien, gaat u naar het tabblad Gegevensvereeding van de huidige asset in de catalogus en volgt u de onderstaande stappen:

  1. Zodra u zich op het tabblad Gegevensgegevens hebt weergegeven, selecteert u in het linkerdeelvenster het selectievakje naast elke kolom die u wilt weergeven in de gegevenslijn.

    Schermopname die laat zien hoe u kolommen selecteert die moeten worden weergegeven op de pagina voor de regel.

  2. Beweeg de muisaanwijzer over een geselecteerde kolom in het linkerdeelvenster of in de gegevensset van het gegevens canvas voor de kolomtoewijzing. Alle kolom-exemplaren zijn gemarkeerd.

    Schermopname die laat zien hoe u de muisaanwijzer over een kolomnaam beweegt om de kolomstroom in een gegevenslijnpad te markeren.

  3. Als het aantal kolommen groter is dan wat kan worden weergegeven in het linkerdeelvenster, gebruikt u de filteroptie om een specifieke kolom op naam te selecteren. U kunt ook de muis gebruiken om door de lijst te schuiven.

    Schermopname die laat zien hoe u kolommen filtert op kolomnaam op de gegevenslijnpagina.

  4. Als het gegevenslijnvas meer knooppunten en randen bevat, gebruikt u het filter om gegevensactiva of procesknooppunten op naam te selecteren. U kunt ook uw muis gebruiken om rond het venster voor de gegevenseedage te pannen.

    Schermopname van gegevensactivumknooppunten op naam op de gegevenslijnpagina.

  5. Gebruik de schakelknop in het linkerdeelvenster om de lijst met gegevenssets in het gegevenslijnvas te markeren. Als u de schakelknop uit schakelt, wordt een asset weergegeven die ten minste één van de geselecteerde kolommen bevat. Als u de schakelknop in schakelen, worden alleen gegevenssets die alle kolommen bevatten weergegeven.

    Schermopname die laat zien hoe u de schakelknop gebruikt om de lijst met knooppunten op de gegevenslijnpagina te filteren.

Kolomrage verwerken

Het gegevensproces kan een of meer invoergegevenssets gebruiken om een of meer uitvoer te produceren. In Purview is de regel op kolomniveau beschikbaar voor procesknooppunten.

  1. Schakel tussen invoer- en uitvoersets vanuit een vervolgkeuzevenster in het deelvenster Kolommen.

  2. Selecteer kolommen uit een of meer tabellen om de gegevensset met de gegevensset voor de gegevensset met uitvoer te zien stromen.

    Schermopname van de kolomvereeding van een proces-knooppunt.

Bladeren door assets in de regel

  1. Selecteer Overschakelen naar asset op een asset om de bijbehorende metagegevens te bekijken vanuit de weergave voor de uitval. Dit is een effectieve manier om vanuit de weergave voor de weelijn naar een andere asset in de catalogus te bladeren.

    Schermopname van het selecteren van Overschakelen naar asset in een gegevensactivum voor gegevens in de gegevens van de gegevens.

  2. Het gegevenslijnvas kan complex worden voor populaire gegevenssets. Om onoverzichtelijk te voorkomen, worden in de standaardweergave slechts vijf niveaus van de veredeling weergegeven voor de asset in focus. De rest van de lijn kan worden uitgebreid door de bellen in het canvas voor de lijnlijn te selecteren. Gegevensverbruikers kunnen de assets ook verbergen op het canvas die niet van belang zijn. Als u de onoverzichtelijker wilt maken, schakelt u de schakelknop Meer lijnlijn boven aan het canvas voor de lijn uit. Met deze actie worden alle bellen in het canvas voor de lijnlijn verborgen.

    Schermopname die laat zien hoe u Meer lineage kunt in- of uitschakelen.

  3. Gebruik de slimme knoppen in het gegevens canvas om een optimale weergave van de gegevenslijn te krijgen. Automatische lay-out, In-/uitzoomen, Volledig scherm en navigatiekaart zijn beschikbaar voor een in immersieve gegevensweergave in de catalogus.

    Schermopname die laat zien hoe u de slimme knoppen voor de lijn selecteert.

Volgende stappen