Gegevens verzenden en ontvangen met behulp van Azure Data Share en gegevens transformeren met behulp van Azure Data Factory

Voltooid

Een veelvoorkomend gebruik van Azure Data Share is het nemen van gedeelde gegevens en het verbinden met Azure Data Factory-pijplijnen voor gebruik met uw eigen interne gegevens.

Laten we leren hoe u gegevens ontvangt met Azure Data Share en deze gegevens transformeert met Azure Data Factory.

Het is belangrijk om inzicht te hebben in zowel Azure Data Share als Azure Data Factory voor het transformeren van gegevens, omdat het een nuttig onderdeel kan zijn van een modern datawarehouse- en analyseproject. Een veelvoorkomende vereiste is toegang tot externe gegevens om inzicht te krijgen in en extra zichtbaarheid van de gegevens in uw hele gegevenslandschap. U kunt gegevensintegratie en -beheer in Azure verbeteren en uitvoeren wanneer u Azure Data Factory en Azure Data Share gebruikt.

Azure Data Factory biedt u de mogelijkheid om met code gratis ETL (Extract Transform Load) en Extract Load Transform (ELT) uit te voeren, wat resulteert in een uitgebreid overzicht van uw gegevenspijplijnen. Als data engineer geeft dit u het vertrouwen om met meer gegevens te werken.

Wanneer u een gegevensprovider bent, kunt u gegevenssets delen met derden of tussen afdelingen binnen uw organisatie. U kunt gegevens uit meerdere resources delen, zoals een Azure SQL Database. U kunt ook een schema voor momentopnamen configureren, zodat uw gegevensgebruikers (de partij met wie u de gegevens wilt delen) een optie hebben om automatisch vernieuwde gegevens op te halen.

Als u een gegevensgebruiker bent, ontvangt u een gegevensset. Wanneer u een gegevensset ontvangt, moet u een uitnodiging accepteren die wordt verzonden door de gegevensprovider. Als u de gegevens wilt ontvangen, kunt u het opslagaccount configureren waar u de gegevens wilt landen die met u worden gedeeld. U kunt de gegevenssets toewijzen aan bijvoorbeeld een Azure Data Lake Store Gen2-account (ADLS Gen 2). Het is ook mogelijk om een momentopname te activeren om een kopie te krijgen van de meest recente vernieuwing van de gegevens die met u zijn gedeeld in de configuratie van het ADLS Gen 2-account.

Als u de volgende oefeningen wilt uitvoeren, moet u de gegevensset NYC Taxi Data importeren in een SQL Database. Download hier het bacpac-bestand met taxigegevens: https://github.com/djpmsft/ADF_Labs/blob/master/sample-data/taxi-data.bacpac.

Download bacpac file

Er verschijnt een pop-upvenster en klikt u op Opslaan als en slaat het bestand op in een map op uw computer.