Azure Data Catalog-terminologie

Belangrijk

Azure Data Catalog wordt op 15 mei 2024 buiten gebruik gesteld.

Er kunnen geen nieuwe Azure Data Catalog-accounts meer worden gemaakt.

Voor functies van de gegevenscatalogus gebruikt u de Microsoft Purview-service , die geïntegreerde gegevensbeheer biedt voor uw hele gegevensdomein.

Als u Azure Data Catalog al gebruikt, moet u een migratieplan maken voor uw organisatie om uiterlijk 15 mei 2024 over te stappen naar Microsoft Purview .

Dit artikel bevat een inleiding tot concepten en termen die worden gebruikt in de Documentatie van Azure Data Catalog.

Catalogus

Azure Data Catalog is een opslagplaats voor metagegevens in de cloud waarin gegevensbronnen en gegevensassets kunnen worden geregistreerd. De catalogus fungeert als een centrale opslaglocatie voor structurele metagegevens die zijn geëxtraheerd uit gegevensbronnen en voor beschrijvende metagegevens die door gebruikers zijn toegevoegd.

Gegevensbron

Een gegevensbron is een systeem of container die gegevensassets beheert. Voorbeelden hiervan zijn SQL Server-databases, Oracle-databases, SQL Server Analysis Services-databases (tabellair of multidimensionaal) en SQL Server Reporting Services-servers.

Gegevensasset

Gegevensassets zijn objecten in gegevensbronnen die kunnen worden geregistreerd bij de catalogus. Voorbeelden hiervan zijn SQL Server-tabellen en -weergaven, Oracle-tabellen en -weergaven, metingen, dimensies en KPI's van SQL Server en RAPPORTEN van SQL Server Reporting Services.

Locatie van gegevensasset

In de catalogus wordt de locatie van een gegevensbron of gegevensasset opgeslagen, die kan worden gebruikt om verbinding te maken met de bron met behulp van een clienttoepassing. De indeling en details van de locatie variëren op basis van het gegevensbrontype. Een SQL Server-tabel kan bijvoorbeeld worden geïdentificeerd met de naam van de vier onderdelen: servernaam, databasenaam, schemanaam, objectnaam, terwijl een SQL Server Reporting Services-rapport kan worden geïdentificeerd door de URL.

Structurele metagegevens

Structurele metagegevens zijn de metagegevens die zijn geëxtraheerd uit een gegevensbron die de structuur van een gegevensasset beschrijft. Structurele metagegevens omvatten de locatie van de asset, de objectnaam en het type en andere typespecifieke kenmerken. De structurele metagegevens voor tabellen en weergaven bevatten bijvoorbeeld de namen en gegevenstypen voor de kolommen van het object.

Beschrijvende metagegevens

Beschrijvende metagegevens zijn metagegevens die het doel of de intentie van een gegevensasset beschrijven. Meestal worden beschrijvende metagegevens toegevoegd door catalogusgebruikers met behulp van de Azure Data Catalog-portal, maar kunnen ze ook worden geëxtraheerd uit de gegevensbron tijdens de registratie. Met het hulpprogramma voor registratie van Azure Data Catalog worden bijvoorbeeld beschrijvingen geëxtraheerd uit de eigenschap Description in SQL Server Analysis Services en SQL Server Reporting Services, en uit de uitgebreide eigenschap ms_description in SQL Server-databases, als deze eigenschappen zijn gevuld met waarden.

Toegang aanvragen

De beschrijvende metagegevens van een gegevensasset kunnen informatie bevatten over het aanvragen van toegang tot de gegevensasset of gegevensbron. Deze informatie wordt weergegeven met de locatie van de gegevensasset en kan een of meer van de volgende opties bevatten:

  • Het e-mailadres van de gebruiker of het team dat verantwoordelijk is voor het verlenen van toegang tot de gegevensbron.
  • De URL van het gedocumenteerde proces dat gebruikers moeten volgen om toegang te krijgen tot de gegevensbron.
  • De URL van een hulpprogramma voor identiteits- en toegangsbeheer (zoals Microsoft Identity Manager) dat kan worden gebruikt om toegang te krijgen tot de gegevensbron.
  • Een invoer in vrije tekst waarin wordt beschreven hoe gebruikers toegang kunnen krijgen tot de gegevensbron.

Preview uitvoeren

Een preview in Azure Data Catalog is een momentopname van maximaal 20 records die tijdens de registratie kunnen worden geëxtraheerd uit de gegevensbron en kunnen worden opgeslagen in de catalogus met de metagegevens van de gegevensasset. De preview kan gebruikers helpen om een gegevensasset beter te begrijpen wat de functie en het doel ervan zijn. Met andere woorden, het weergeven van voorbeeldgegevens kan waardevoller zijn dan alleen de kolomnamen en gegevenstypen te zien. Previews worden alleen ondersteund voor tabellen en weergaven en moeten expliciet door de gebruiker worden geselecteerd tijdens de registratie.

Gegevensprofiel

Een gegevensprofiel in Azure Data Catalog is een momentopname van metagegevens op tabel- en kolomniveau over een geregistreerde gegevensasset. Deze informatie kan tijdens de registratie worden geëxtraheerd uit de gegevensbron en worden opgeslagen in de catalogus met de metagegevens van de gegevensasset. Met het gegevensprofiel kunnen gebruikers die een gegevensasset ontdekken, beter inzicht krijgen in de functie en het doel ervan. Net als bij previews moeten gegevensprofielen expliciet door de gebruiker worden geselecteerd tijdens de registratie.

Notitie

Het extraheren van een gegevensprofiel kan een kostbare bewerking zijn voor grote tabellen en weergaven, en kan de tijd die nodig is om een gegevensbron te registreren aanzienlijk verhogen.

Gebruikersperspectief

In Azure Data Catalog kan elke gebruiker beschrijvende metagegevens opgeven voor een geregistreerde gegevensasset. Elke gebruiker heeft een duidelijk perspectief op de gegevens en het gebruik ervan. De beheerder die verantwoordelijk is voor een server kan bijvoorbeeld de details van de SLA (Service Level Agreement) of back-upvensters opgeven. Een gegevenssteward kan koppelingen naar documentatie bieden voor de bedrijfsprocessen die door de gegevens worden ondersteund. Een analist kan een beschrijving geven in de termen die het meest relevant zijn voor andere analisten en die het waardevolst kunnen zijn voor gebruikers die de gegevens moeten detecteren en begrijpen.

Elk van deze perspectieven is inherent waardevol en met Azure Data Catalog kan elke gebruiker de informatie verstrekken die voor hen zinvol is, terwijl alle gebruikers die informatie kunnen gebruiken om de gegevens en het doel ervan te begrijpen.

Expert

Een expert is een gebruiker die is geïdentificeerd als een geïnformeerd 'expert' perspectief voor een gegevensasset. Elke gebruiker kan zichzelf of een andere gebruiker toevoegen als expert voor een asset. Als expert wordt vermeld, worden geen andere bevoegdheden in Azure Data Catalog overgebracht; hiermee kunnen gebruikers eenvoudig die perspectieven vinden die waarschijnlijk nuttig zijn bij het controleren van de beschrijvende metagegevens van een asset.

Eigenaar

Een eigenaar is een gebruiker die meer bevoegdheden heeft voor het beheren van een gegevensasset in Azure Data Catalog. Gebruikers kunnen eigenaar worden van geregistreerde gegevensassets en eigenaren kunnen andere gebruikers toevoegen als mede-eigenaren. Zie het artikel over het beheren van gegevensassets voor meer informatie.

Notitie

Eigendom en beheer zijn alleen beschikbaar in de Standard Edition van Azure Data Catalog.

Registratie

Registratie is het extraheren van metagegevens van gegevensassets uit een gegevensbron en het kopiëren ervan naar de Azure Data Catalog-service. Gegevensassets die zijn geregistreerd, kunnen vervolgens worden geannoteerd en gedetecteerd.

Volgende stappen

Quickstart: Een Azure Data Catalog maken