Hoe Microsoft Power Platform gegevensstromen en Azure Data Factory wrangling-gegevensstromen met elkaar in verband komen

Microsoft Power Platform gegevensstromen en Azure Data Factory worden vaak beschouwd om hetzelfde te doen: gegevens extraheren uit bronsystemen, de gegevens transformeren en de getransformeerde gegevens laden in een bestemming. Er zijn echter verschillen in deze twee typen gegevensstromen en u kunt een oplossing implementeren die werkt met een combinatie van deze technologieën. In dit artikel wordt deze relatie in meer detail beschreven.

Power Platform-gegevensstromen

Power Platform zijn gegevenstransformatieservices die worden mogelijk gemaakt door de Power Query-engine en worden gehost in de cloud. Deze gegevensstromen halen gegevens op uit verschillende gegevensbronnen en slaan deze na het toepassen van transformaties op in Dataverse of in Azure Data Lake Storage.

Power Platform gegevensstromendiagram.

Data Factory wrangling van gegevensstromen

Data Factory is een ETL-service (extraheren, transformeren, laden) in de cloud die ondersteuning biedt voor veel verschillende bronnen en bestemmingen. Er zijn twee soorten gegevensstromen onder deze technologie: toewijzing van gegevensstromen en wrangling-gegevensstromen. Wrangling-gegevensstromen worden mogelijk gemaakt door de Power Query engine voor gegevenstransformatie.

Gegevensstroom wrangling.

Wat hebben ze gemeenschappelijk?

Power Platform gegevensstromen en Data Factory wrangling-gegevensstromen zijn beide nuttig voor het verkrijgen van gegevens uit een of meer bronnen, het toepassen van transformaties op de gegevens met behulp van Power Query en het laden van de getransformeerde gegevens in bestemmingen. Daarnaast:

  • Beide mogelijkheden worden mogelijk gemaakt door gebruik te Power Query gegevenstransformatie.
  • Beide zijn cloudtechnologieën.

Wat is het verschil?

Het belangrijkste is dat u de verschillen kent, omdat u dan kunt nadenken over scenario's waarin u het ene of het andere wilt gebruiken.

Functies Power Platform-gegevensstromen Data Factory wrangling van gegevensstromen
Bestemmingen Dataverse of Azure Data Lake Storage Veel bestemmingen (zie de lijst hier)
Power Query transformatie Alle Power Query worden ondersteund Een beperkte set functies wordt ondersteund (zie de lijst hier)
Bronnen Veel bronnen worden ondersteund Slechts enkele bronnen (zie de lijst hier)
Schaalbaarheid Is afhankelijk van de Premium capaciteit en het gebruik van de verbeterde berekeningsen engine Zeer schaalbaar

Welke gebruikers-persona is geschikt voor welk type gegevensstroom?

Als u een burgertoepassingsontwikkelaar of burgergegevensanalist bent met kleinschalige tot middelgrote gegevens die moeten worden geïntegreerd en getransformeerd, vindt u de Power Platform gegevensstromen handiger. Het grote aantal beschikbare transformaties, de mogelijkheid om erop te werken zonder kennis van ontwikkelaars en het feit dat gegevensstromen kunnen worden gemaakt, bewaakt en bewerkt in Power BI of Power Platform, zijn allemaal redenen waarom Power Platform-gegevensstromen een uitstekende oplossing voor gegevensintegratie zijn voor dit — type ontwikkelaar.

Als u een gegevensontwikkelaar bent die te maken heeft met big data en enorme gegevenssets, met een groot aantal rijen dat elke keer moet worden opgenomen, vindt u de Data Factory-wrangling-gegevensstromen een beter hulpmiddel voor de taak. Wrangling-gegevensstroom zet M die is gegenereerd door de Power Query Online Mashup Editor om in Spark-code voor de uitvoering van cloudschaal. Voor het werken Azure Portal het schrijven, bewaken en bewerken van wrangling-gegevensstromen is een hogere leercurve voor ontwikkelaars vereist dan de ervaring in Power Platform gegevensstromen. Wrangling-gegevensstromen zijn het meest geschikt voor dit type doelgroep.