Gebruikershandleiding Data Catalog Azure Purview Data Catalog gegevens
In dit artikel vindt u een overzicht van de gegevensragefuncties in Azure Purview Data Catalog.
Achtergrond
Een van de platformfuncties van Azure Purview is de mogelijkheid om de gegevenslijn weer te geven tussen gegevenssets die zijn gemaakt door gegevensprocessen. Systemen zoals Data Factory, Data Share en Power BI de gegevensrage vastleggen terwijl deze zich verplaatst. Aangepaste rapportage van de regel wordt ook ondersteund via Atlas-hooks en REST API.
Gegevensverzameling
Metagegevens die in Azure Purview worden verzameld vanuit bedrijfsgegevenssystemen, worden over elkaar gepingd om een end-to-end gegevenslijn weer te geven. Gegevenssystemen die gegevens in Purview verzamelen, worden breed gecategoriseerd in de volgende drie typen.
Gegevensverwerkingssysteem
Gegevensintegratie en ETL-hulpprogramma's kunnen gegevensgegevens tijdens de uitvoering naar Azure Purview pushen. Hulpprogramma's zoals Data Factory, Data Share, Synapse, Azure Databricks, en dergelijke, behoren tot deze categorie gegevenssystemen. De gegevensverwerkingssystemen verwijzen naar gegevenssets als bron uit verschillende databases en opslagoplossingen om doelgegevenssets te maken. De lijst met systemen voor gegevensverwerking die momenteel zijn geïntegreerd met Purview voor gegevensvereeding, vindt u in de onderstaande tabel.
| Gegevensverwerkingssysteem | Ondersteund bereik |
|---|---|
| Azure Data Factory | Copy-activiteit Gegevensstroomactiviteit Activiteit van SSIS-pakket uitvoeren |
| Azure Synapse Analytics | Copy-activiteit Gegevensstroomactiviteit |
| Azure Data Share | Momentopname delen |
Systemen voor gegevensopslag
Databases & opslagoplossingen zoals SQL Server, Teradata en SAP hebben query-engines om gegevens te transformeren met behulp van scripttaal. Gegevensrage van opgeslagen procedures wordt verzameld in Purview en samengeborduurd met gegevens van andere systemen.
| Gegevensopslagsysteem | Ondersteund bereik |
|---|---|
| Teradata | Opgeslagen procedures |
Gegevensanalyse & rapportagesystemen
Gegevenssystemen zoals Azure ML en Power BI in Azure Purview. Deze systemen gebruiken de gegevenssets van opslagsystemen en verwerken deze via hun metamodel om bidashboards en ML experimenten te maken, en meer.
| Gegevensanalyse & rapportagesysteem | Ondersteund bereik |
|---|---|
| Power BI | Gegevenssets, gegevensstromen, rapporten & Dashboards |
Aan de slag met de vereending
Gegevenssets en processen zijn gegevenssets en processen. Gegevenssets worden ook wel knooppunten genoemd, terwijl processen ook randen kunnen worden genoemd:
Gegevensset (Node): een gegevensset (gestructureerd of ongestructureerd) die wordt geleverd als invoer voor een proces. Zo worden een SQL Table, Azure Blob en bestanden (zoals .csv en .xml) allemaal beschouwd als gegevenssets. In de sectie Gegevenssets in de sectie Gegevenssets op basis van gegevenssets worden rechthoekige vakken weergegeven.
Proces (Edge): een activiteit of transformatie die wordt uitgevoerd op een gegevensset wordt een proces genoemd. ADF kan bijvoorbeeld Copy-activiteit, Data Share momentopname maken, en meer. In de sectie gegevensverzending van Purview worden processen vertegenwoordigd door vakken aan de rand.
Volg de stappen voor toegang tot gegevens over de gegevens van de gegevens van de gegevens in Purview:
Ga in Azure Portal naar de pagina Azure Purview-accounts.
Selecteer uw Azure Purview-account in de lijst en selecteer vervolgens Launch purview account op de pagina Overzicht.
Zoek op de startpagina van Azure Purview naar de naam van een gegevensset of de procesnaam, zoals ADF Copy of Data Flow activiteit. Druk vervolgens op Enter.
Selecteer in de zoekresultaten de asset en selecteer het tabblad Gegevenseedage.
Afspiegeling op assetniveau
Azure Purview biedt ondersteuning voor gegevenssets en processen op assetniveau. Als u de gegevenslijn op assetniveau wilt zien, gaat u naar het tabblad Gegevenseedage van de huidige asset in de catalogus. Selecteer het asset-knooppunt van de huidige gegevensset. Standaard wordt de lijst met kolommen die tot de gegevens behoren, weergegeven in het linkerdeelvenster.
Gegevenssetkolomlijn
Als u de gegevenslijn op kolomniveau van een gegevensset wilt zien, gaat u naar het tabblad Gegevensvereeding van de huidige asset in de catalogus en volgt u de onderstaande stappen:
Zodra u zich op het tabblad Gegevensgegevens hebt weergegeven, selecteert u in het linkerdeelvenster het selectievakje naast elke kolom die u wilt weergeven in de gegevenslijn.
Beweeg de muisaanwijzer over een geselecteerde kolom in het linkerdeelvenster of in de gegevensset van het gegevens canvas voor de kolomtoewijzing. Alle kolom-exemplaren zijn gemarkeerd.
Als het aantal kolommen groter is dan wat kan worden weergegeven in het linkerdeelvenster, gebruikt u de filteroptie om een specifieke kolom op naam te selecteren. U kunt ook de muis gebruiken om door de lijst te schuiven.
Als het gegevenslijnvas meer knooppunten en randen bevat, gebruikt u het filter om gegevensactiva of procesknooppunten op naam te selecteren. U kunt ook uw muis gebruiken om rond het venster voor de gegevenseedage te pannen.
Gebruik de schakelknop in het linkerdeelvenster om de lijst met gegevenssets in het gegevenslijnvas te markeren. Als u de schakelknop uit schakelt, wordt een asset weergegeven die ten minste één van de geselecteerde kolommen bevat. Als u de schakelknop in schakelen, worden alleen gegevenssets die alle kolommen bevatten weergegeven.
Kolomrage verwerken
Het gegevensproces kan een of meer invoergegevenssets gebruiken om een of meer uitvoer te produceren. In Purview is de regel op kolomniveau beschikbaar voor procesknooppunten.
Schakel tussen invoer- en uitvoersets vanuit een vervolgkeuzevenster in het deelvenster Kolommen.
Selecteer kolommen uit een of meer tabellen om de gegevensset met de gegevensset voor de gegevensset met uitvoer te zien stromen.
Bladeren door assets in de regel
Selecteer Overschakelen naar asset op een asset om de bijbehorende metagegevens te bekijken vanuit de weergave voor de uitval. Dit is een effectieve manier om vanuit de weergave voor de weelijn naar een andere asset in de catalogus te bladeren.
Het gegevenslijnvas kan complex worden voor populaire gegevenssets. Om onoverzichtelijk te voorkomen, worden in de standaardweergave slechts vijf niveaus van de veredeling weergegeven voor de asset in focus. De rest van de lijn kan worden uitgebreid door de bellen in het canvas voor de lijnlijn te selecteren. Gegevensverbruikers kunnen de assets ook verbergen op het canvas die niet van belang zijn. Als u de onoverzichtelijker wilt maken, schakelt u de schakelknop Meer lijnlijn boven aan het canvas voor de lijn uit. Met deze actie worden alle bellen in het canvas voor de lijnlijn verborgen.
Gebruik de slimme knoppen in het gegevens canvas om een optimale weergave van de gegevenslijn te krijgen. Automatische lay-out, In-/uitzoomen, Volledig scherm en navigatiekaart zijn beschikbaar voor een in immersieve gegevensweergave in de catalogus.