Gegevensbeheer in Azure Data Lake met Microsoft Purview

Azure Data Factory
Microsoft Purview
Azure Data Lake Storage
Azure Synapse Analytics
Power BI

Oplossingsideeën

Dit artikel is een oplossingsidee. Als u wilt dat we de inhoud uitbreiden met meer informatie, zoals mogelijke use cases, alternatieve services, implementatieoverwegingen of prijsrichtlijnen, laat het ons dan weten door GitHub-feedback te geven.

In dit artikel wordt een oplossing beschreven die gebruikmaakt van Azure Purview om een basis te bouwen voor gegevensbeheer en -beheer waarmee hoogwaardige, vertrouwde gegevens kunnen worden geproduceerd en geleverd.

Architectuur

Architecture diagram that shows how Azure Purview scans and classifies data.

Diagram waarin wordt getoond hoe Azure Purview gegevens scant en classificeert. Data Lake Storage maakt verbinding met Azure Purview via een modern gegevensplatform. Azure Purview maakt ook verbinding met Power BI. In het diagram ziet u ook integratie tussen deze services en Microsoft Entra ID, Azure Monitor en Azure Key Vault.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

Azure Purview biedt één geïntegreerde service voor gegevensbeheer voor de gegevens uit alle bronnen, in de data lake en eindrapportagehulpprogramma's.

Scenario's voor het verbinden van Azure Purview met Data Lake-services:

  1. Azure Purview biedt een verbeterde beveiligingsverbinding met uw Data Lake-opname-, opslag- en analysepijplijnen om automatisch gegevensassets te catalogiseren. Het biedt ook herkomst van deze services. Specifieke Azure-services omvatten Data Factory, Data Lake Storage en Azure Synapse Analytics.

  2. Azure Purview maakt systeemeigen verbinding met Power BI en andere hulpprogramma's voor rapportage en visualisatie. Hier ziet u de herkomst van gegevens die worden gebruikt in eindrapporten. Het deelt ook vertrouwelijkheidsinformatie van de Power BI-assets om onjuist gegevensgebruik te voorkomen.

Belangrijk

De informatie die van de bronnen naar Azure Purview wordt overgebracht, is metagegevens die de gegevens binnen de gescande bronnen beschrijven. Er worden geen werkelijke gegevens overgebracht van de bronnen naar Azure Purview.

Functies

  • Catalogus. De Azure Purview-gegevenscatalogus kan automatisch kernkenmerken van gegevens in de bron vastleggen en beschrijven, waaronder schema, technische eigenschappen en locatie. Met de Azure Purview-woordenlijst kan een bedrijfsvriendelijke definitie van gegevens bovenaan worden geplaatst om de zoek- en detectiemogelijkheden te verbeteren.

  • Classificatie. Azure Purview classificeert automatisch gegevenssets en gegevenselementen met 100 vooraf gedefinieerde classificaties van gevoelige gegevens. Hiermee kunt u ook uw eigen aangepaste classificatieschema's definiëren die u handmatig en automatisch kunt toepassen.

  • Herkomst. Azure Purview visualiseert gegevensherkomst in Data Factory, Azure Synapse Analytics en Power BI-pijplijnen. Deze visualisaties tonen de end-to-end-stroom van gegevens op een gedetailleerd niveau.

  • Toegangsbeheer. Met azure Purview-toegangsbeheerbeleid kunt u gegevensassets vanuit de catalogus definiëren en toegang verlenen, rechtstreeks op de onderliggende bronnen.

  • Eigendom. Met Azure Purview kunt u het eigendom en de stewardship van gegevens toepassen op gegevensassets en woordenlijstitems in de catalogus.

  • Inzicht. Inzichten in Azure Purview bieden meerdere vooraf gedefinieerde rapporten om CDO's, gegevensprofessionals en datagovernanceprofessionals te helpen een gedetailleerd inzicht te krijgen in het gegevenslandschap.

Onderdelen

  • Azure Purview is een geïntegreerde gegevenscatalogus die on-premises, multicloud- en SaaS-gegevens (Software as a Service) beheert. Deze gegevensbeheerservice onderhoudt gegevenslandschapstoewijzingen. Functies zijn geautomatiseerde gegevensdetectie, classificatie van gevoelige gegevens en gegevensherkomst.

  • Data Factory is een volledig beheerde, serverloze gegevensintegratieservice waarmee u ETL- en ELT-processen kunt maken.

  • Data Lake Storage biedt zeer schaalbare, rendabele cloudopslag met hoge beveiliging voor hoogwaardige analyseworkloads.

  • Azure Synapse Analytics is een onbeperkte analyseservice die gegevensintegratie, zakelijke datawarehousing en big data-analyses combineert.

  • Power BI is een verzameling softwareservices en apps. Deze services maken en delen rapporten waarmee meerdere gegevensbronnen worden verbonden en gevisualiseerd. Wanneer u Power BI gebruikt met Azure Purview, kunt u uw gegevens catalogiseren en classificeren en gedetailleerde herkomst bieden die van end-to-end wordt geïllustreerd.

  • Azure Private Link biedt privéconnectiviteit van een virtueel netwerk naar Azure PaaS-services (Platform as a Service), services die u bezit of Microsoft-partnerservices.

  • Azure Key Vault slaat de toegang tot geheimen, zoals tokens, wachtwoorden en API-sleutels, op en beheert deze. Key Vault maakt en beheert ook versleutelingssleutels en beheert beveiligingscertificaten.

  • Microsoft Entra ID biedt cloudservices voor identiteits- en toegangsbeheer. Deze functies bieden gebruikers een manier om zich aan te melden en toegang te krijgen tot resources.

  • Azure Monitor verzamelt en analyseert gegevens over omgevingen en Azure-resources. Deze gegevens omvatten app-telemetrie, zoals metrische prestatiegegevens en activiteitenlogboeken.

Scenariodetails

Naarmate u meer gegevens in Azure laadt, neemt de noodzaak om die gegevens goed te beheren en te beheren in al uw gegevensbronnen en gegevensgebruikers ook toenemen.

Als u geen hoogwaardige gegevens in uw Azure-gegevensomgeving hebt, wordt de bedrijfswaarde van Azure verminderd. De oplossing is het bouwen van een basis voor gegevensbeheer en -beheer die hoogwaardige, vertrouwde gegevens kunnen produceren en leveren.

Gegevens moeten op schaal worden beheerd in on-premises, cloud- en multicloudopslag om ervoor te zorgen dat deze voldoet aan de nalevingsvereisten voor beveiliging, privacy en gebruik. Goed beheerde gegevens kunnen ook zelfdetectie, gegevensdeling en gegevenskwaliteit verbeteren, waardoor het gebruik van gegevens in toepassingen en analyses wordt verbeterd.

Azure Purview biedt governance voor het vinden, classificeren, definiëren en afdwingen van beleidsregels en standaarden voor gegevens. U kunt deze gebruiken om definities, classificaties en governanceprocessen uniform toe te passen op gegevens. Het catalogiseert alle gegevensbronnen, identificeert gevoelige informatie en definieert gegevensherkomst. Het biedt een centraal platform waar u definities en eigendom kunt toepassen op gegevens. Met één weergave van rapporten en inzichten kunt u hiermee gegevensstandaarden genereren die op uw gegevens moeten worden toegepast.

Als u met andere Azure-services werkt, kan Azure Purview automatisch gegevens detecteren, catalogiseren, classificeren en beheren in Azure Data Lake-aanbiedingen en partnerservices.

Potentiële gebruikscases

De vereisten voor gegevensbeheer verschillen in verschillende branches. Voor alle branches is de noodzaak om gegevens op schaal te beheren toegenomen naarmate de omvang en complexiteit van gegevens- en gegevensarchitecturen toenemen. Dit is geschikt voor organisaties die profiteren van de volgende resultaten van goed beheerde gegevens:

  • Automatische detectie van gegevens om de overstap naar de cloud te versnellen.
  • Verbeterde beveiliging van gegevens voor naleving van wet- en regelgeving op het gebied van gegevens.
  • Verbeterde toegang, detectie en kwaliteit van beheerde gegevens om analyses te verbeteren.

Inzenders

Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.

Hoofdauteur:

Volgende stappen