Wat is de opslagstructuur voor analytische gegevensstromen?

Analytische gegevensstromen slaan zowel gegevens als metagegevens op in Azure Data Lake Storage. Gegevensstromen maken gebruik van een standaardstructuur voor het opslaan en beschrijven van gegevens die in het lake zijn gemaakt. Dit wordt Common Data Model genoemd. In dit artikel vindt u meer informatie over de opslagstandaard die gegevensstromen achter de schermen gebruiken.

Storage heeft een structuur nodig voor een analytische gegevensstroom

Als de gegevensstroom standaard is,worden de gegevens opgeslagen in Dataverse. Dataverse is als een databasesysteem; Het heeft het concept van tabellen, weergaven, en meer. Dataverse is een gestructureerde gegevensopslagoptie die wordt gebruikt door standaardgegevensstromen.

Wanneer de gegevensstroom echter analytischegegevens is, worden de gegevens opgeslagen in Azure Data Lake Storage. De gegevens en metagegevens van een gegevensstroom worden opgeslagen in een Common Data Model map. Omdat in een opslagaccount mogelijk meerdere gegevensstromen zijn opgeslagen, is er een hiërarchie van mappen en submappen geïntroduceerd om de gegevens te organiseren. Afhankelijk van het product waarin de gegevensstroom is gemaakt, kunnen de mappen en submappen werkruimten (of omgevingen) vertegenwoordigen, waarna de Common Data Model map van de gegevensstroom. In de Common Data Model worden zowel het schema als de gegevens van de gegevensstroomentiteiten opgeslagen. Deze structuur volgt de standaarden die zijn gedefinieerd voor Common Data Model.

Analytische gegevensstroom slaat de gegevens op in Common Data Model structuur.

Wat is de Common Data Model opslagstructuur?

Common Data Model is een metagegevensstructuur die is gedefinieerd om consistentie en consistentie te bieden voor het gebruik van gegevens op meerdere platforms. Common Data Model geen gegevensopslag is, is het de manier waarop gegevens worden opgeslagen en gedefinieerd.

Common Data Model mappen definiëren hoe het schema en de gegevens van een entiteit moeten worden opgeslagen. In Azure Data Lake Storage worden gegevens geordend in mappen. Mappen kunnen een werkruimte of omgeving vertegenwoordigen. Onder deze mappen worden submappen voor elke gegevensstroom gemaakt.

Mapstructuur van werkruimte.

Wat staat er in een gegevensstroommap?

Elke gegevensstroommap bevat een submap voor elke entiteit en een metagegevensbestand met de naam model.json .

Wat staat er in een gegevensstroommap?

Het metagegevensbestand: model.json

Het model.json bestand is de metagegevensdefinitie van de gegevensstroom. Dit is het ene bestand dat alle metagegevens van de gegevensstroom bevat. Het bevat een lijst met entiteiten, de kolommen en hun gegevenstypen in elke entiteit, de relatie tussen entiteiten, en meer. U kunt dit bestand eenvoudig uit een gegevensstroom exporteren, zelfs als u geen toegang hebt tot de Common Data Model mapstructuur.

Exporteert het bestand model.json uit een gegevensstroom.

U kunt dit JSON-bestand gebruiken om uw gegevensstroom te migreren (of te importeren) naar een andere werkruimte of omgeving.

Een gegevensstroom migreren naar een andere werkruimte of omgeving.

Als u precies wilt weten wat het metagegevensbestand model.json bevat, gaat u naar Het metagegevensbestand (model.json) voor Common Data Model.

Gegevensbestanden

Naast het metagegevensbestand bevat de map gegevensstroom andere submappen. Een gegevensstroom slaat de gegevens voor elke entiteit op in een submap met de naam van de entiteit. Gegevens voor een entiteit kunnen worden gesplitst in meerdere gegevenspartities, opgeslagen in CSV-indeling.

Meer informatie over het weergeven of openen Common Data Model mappen

Als u gegevensstromen gebruikt die gebruikmaken van opslag die wordt geleverd door het product waarin ze zijn gemaakt, hebt u niet rechtstreeks toegang tot deze mappen. In dergelijke gevallen moet u voor het verkrijgen van gegevens uit de gegevensstromen gebruikmaken van de Microsoft Power Platform-gegevensstroomconnector die beschikbaar is in de ervaring Gegevens verkrijgen in de Power BI-service, Power Apps en Dynamics 35 Customer Insights-producten of in Power BI Desktop.

Verbinding maken aan gegevens voor een analytische gegevensstroom.

Als u wilt weten hoe gegevensstromen en de interne Data Lake Storage-integratie werken, gaat u naar Gegevensstromen en Azure Data Lake-integratie (preview).

Als uw organisatie gegevensstromen heeft ingeschakeld om te profiteren van het Data Lake Storage-account en is geselecteerd als een laaddoel voor gegevensstromen, kunt u nog steeds gegevens uit de gegevensstroom halen met behulp van de Power Platform-gegevensstroomconnector zoals hierboven is vermeld. Maar u hebt ook rechtstreeks toegang tot de Common Data Model van de gegevensstroom via de lake, zelfs buiten Power Platform hulpprogramma's en services. Toegang tot de lake is mogelijk via de Azure Portal, Microsoft Azure Storage Explorer of een andere service of ervaring die ondersteuning biedt voor Azure Data Lake Storage. Meer informatie: Verbinding maken Azure Data Lake Storage Gen2 voor gegevensstroomopslag

Verbinding maken naar externe Data Lake Storage.

Volgende stappen