Share via


Gegevensbronnen voor gegevensprofielen in Azure Data Catalog

Belangrijk

Azure Data Catalog wordt op 15 mei 2024 buiten gebruik gesteld.

Er kunnen geen nieuwe Azure Data Catalog-accounts meer worden gemaakt.

Voor functies van de gegevenscatalogus gebruikt u de Microsoft Purview-service , die geïntegreerde gegevensbeheer biedt voor uw hele gegevensdomein.

Als u Azure Data Catalog al gebruikt, moet u een migratieplan maken voor uw organisatie om uiterlijk 15 mei 2024 over te stappen naar Microsoft Purview .

Inleiding

Microsoft Azure Data Catalog is een volledig beheerde cloudservice die fungeert als een systeem voor registratie en detectie voor zakelijke gegevensbronnen. Met andere woorden, Azure Data Catalog gaat over het helpen van mensen bij het detecteren, begrijpen en gebruiken van gegevensbronnen en het helpen van organisaties om meer waarde te krijgen van hun bestaande gegevens. Wanneer een gegevensbron is geregistreerd bij Azure Data Catalog, worden de metagegevens gekopieerd en geïndexeerd door de service, maar eindigt het verhaal daar niet.

De functie Gegevensprofilering van Azure Data Catalog onderzoekt de gegevens uit ondersteunde gegevensbronnen in uw catalogus en verzamelt statistieken en informatie over die gegevens. U kunt eenvoudig een profiel van uw gegevensassets opnemen. Wanneer u een gegevensasset registreert, kiest u Gegevensprofiel opnemen in het hulpprogramma voor gegevensbronregistratie.

Wat is gegevensprofilering?

Gegevensprofilering onderzoekt de gegevens in de gegevensbron die worden geregistreerd en verzamelt statistieken en informatie over die gegevens. Tijdens de detectie van gegevensbronnen kunnen deze statistieken u helpen bij het bepalen van de geschiktheid van de gegevens om hun bedrijfsprobleem op te lossen.

De volgende gegevensbronnen ondersteunen gegevensprofilering:

  • SQL Server-tabellen en -weergaven (inclusief Azure SQL DB en Azure Synapse Analytics)
  • Oracle-tabellen en -weergaven
  • Teradata-tabellen en -weergaven
  • Hive-tabellen

Als u gegevensprofielen opgeeft bij het registreren van gegevensassets, kunnen gebruikers vragen over gegevensbronnen beantwoorden, waaronder:

  • Kan het worden gebruikt om mijn bedrijfsprobleem op te lossen?
  • Voldoen de gegevens aan bepaalde standaarden of patronen?
  • Wat zijn enkele afwijkingen van de gegevensbron?
  • Wat zijn mogelijke uitdagingen bij het integreren van deze gegevens in mijn toepassing?

Notitie

U kunt ook documentatie toevoegen aan een asset om te beschrijven hoe gegevens kunnen worden geïntegreerd in een toepassing. Zie Gegevensbronnen documenteren.

Een gegevensprofiel opnemen bij het registreren van een gegevensbron

U kunt eenvoudig een profiel van uw gegevensbron opnemen. Wanneer u een gegevensbron registreert, kiest u in het deelvenster Objecten dat moet worden geregistreerd van het hulpprogramma voor gegevensbronregistratie de optie Gegevensprofiel opnemen.

Het vak Gegevensprofiel opnemen is ingeschakeld onder aan het venster Objecten dat moet worden geregistreerd.

Zie Gegevensbronnen registreren en aan de slag met Azure Data Catalog voor meer informatie over het registreren van gegevensbronnen.

Filteren op gegevensassets die gegevensprofielen bevatten

Als u gegevensassets wilt detecteren die een gegevensprofiel bevatten, kunt u deze opnemen has:tableDataProfiles of has:columnsDataProfiles als een van uw zoektermen.

Notitie

Het selecteren van Het gegevensprofiel opnemen in het hulpprogramma voor gegevensbronregistratie bevat profielgegevens op tabel- en kolomniveau. Met de Data Catalog-API kunnen gegevensassets echter worden geregistreerd met slechts één set profielgegevens.

Gegevensprofielgegevens weergeven

Zodra u een geschikte gegevensbron met een profiel hebt gevonden, kunt u de details van het gegevensprofiel bekijken. Als u het gegevensprofiel wilt weergeven, selecteert u een gegevensasset en kiest u Gegevensprofiel in het portalvenster van Data Catalog.

Het tabblad Gegevensprofiel wordt boven aan de pagina geselecteerd, tussen kolommen en documentatie.

In een gegevensprofiel in Azure Data Catalog worden tabel- en kolomprofielgegevens weergegeven, waaronder:

Objectgegevensprofiel

  • Aantal rijen
  • Tabelgrootte
  • Wanneer het object voor het laatst is bijgewerkt

Kolomgegevensprofiel

  • Kolomgegevenstype
  • Aantal afzonderlijke waarden
  • Aantal rijen met NULL-waarden
  • Minimum-, maximum-, gemiddelde- en standaarddeviatie voor kolomwaarden

Samenvatting

Gegevensprofilering biedt statistieken en informatie over geregistreerde gegevensassets, zodat u de geschiktheid van de gegevens kunt bepalen om zakelijke problemen op te lossen. Samen met aantekeningen maken en gegevensbronnen documenteren, kunnen gegevensprofielen gebruikers meer inzicht geven in uw gegevens.

Zie ook