Quickstart: Het hulpprogramma Copy Data gebruiken om gegevens te kopiëren
VAN TOEPASSING OP:
Azure Data Factory
Azure Synapse Analytics
In deze snelstart gebruikt u Azure Portal voor het maken van een data factory. Gebruik vervolgens het hulpprogramma Copy Data om een pijplijn te maken waarmee gegevens uit een map in Azure Blob Storage worden gekopieerd naar een andere map.
Notitie
Als u niet bekend bent met Azure Data Factory, raadpleegt u eerst de Inleiding voor Azure Data Factory voordat u deze quickstart uitvoert.
Vereisten
Azure-abonnement
Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.
Azure-rollen
Als u Data Factory-exemplaren wilt maken, moet het gebruikersaccount waarmee u zich bij Azure aanmeldt, lid zijn van de rol Inzender of Eigenaar, of moet dit een beheerder van het Azure-abonnement zijn. Als u de machtigingen wilt bekijken die u binnen het abonnement hebt, gaat u naar Azure Portal, selecteert u uw gebruikersnaam rechtsboven in de hoek, selecteert u het pictogram " ... " voor meer opties en selecteert u Mijn machtigingen. Als u toegang tot meerdere abonnementen hebt, moet u het juiste abonnement selecteren.
Als u onderliggende resources wilt maken en beheren voor Data Factory, waaronder gegevenssets, gekoppelde services, pijplijnen, triggers en integratieruntimes, zijn de volgende vereisten van toepassing:
- Als u onderliggende resources in Azure Portal wilt maken en beheren, moet u de rol Data Factory-inzender op minimaal het niveau van de resourcegroep hebben.
- Voor het maken en beheren van onderliggende resources met PowerShell of de SDK is de rol Inzender op minimaal het resourceniveau voldoende.
Zie het artikel Rollen toevoegen voor voorbeelden van instructies voor het toevoegen van een gebruiker aan een rol.
Raadpleeg voor meer informatie de volgende artikelen:
Azure Storage-account
In deze Snelstart gaat u een algemeen Azure Storage-account (en dan met name voor Blob Storage) gebruiken als zowel bron- als doel gegevensarchieven. Raadpleeg het artikel Een opslagaccount maken als u geen Azure Storage-account hebt voor algemene doeleinden en er een wilt maken.
De naam van het opslagaccount ophalen
In deze quickstart hebt u de naam van uw Azure Storage-account nodig. De volgende procedure bevat stappen waarmee u de naam van uw opslagaccount kunt ophalen:
- Ga in een webbrowser naar de Azure Portal en meld u aan met uw Azure-gebruikersnaam en-wachtwoord.
- Selecteer in het menu Azure Portal Alle services en selecteer Storage > Storage-accounts. U kunt vanaf elke pagina ook Storage-accounts zoeken en selecteren.
- Filter op de pagina Storage-accounts op uw opslagaccount (indien nodig) en selecteer vervolgens uw opslagaccount.
U kunt vanaf elke pagina ook Storage-accounts zoeken en selecteren.
Een blobcontainer maken
In deze sectie maakt u in Azure Blob Storage een blobcontainer met de naam adftutorial.
Selecteer op de pagina Storage-account Overzicht > Containers.
Selecteer in de werkbalk van de pagina <Account name> - Containers Container.
Voer in het dialoogvenster Nieuwe container als naam adftutorial in en selecteer OK. De pagina <Account name> - Containers is bijgewerkt en bevat adftutorial in de lijst containers.
Voeg een invoermap en -bestand toe aan de blobcontainer
In dit gedeelte maakt u een map met de naam invoer in de container die u hebt gemaakt en vervolgens uploadt u een voorbeeldbestand naar de invoermap. Voor u begint, opent u een tekstverwerker zoals Kladblok en maakt u een bestand met de naam emp.txt met de volgende inhoud:
John, Doe
Jane, Doe
Sla het bestand op in de map c:\ADFv2QuickStartPSH. (Maak de map als deze nog niet bestaat.) Ga terug naar de Azure-portal en voer de volgende stappen uit:
Selecteer op de pagina <Account name> - Containers waar u begon adftutorial uit de bijgewerkte lijst containers.
- Als u het venster hebt gesloten of naar een andere pagina bent gegaan, meldt u zich weer aan bij de Azure Portal.
- Selecteer in het menu Azure Portal Alle services en selecteer Storage > Storage-accounts. U kunt vanaf elke pagina ook Storage-accounts zoeken en selecteren.
- Selecteer uw opslagaccount en selecteer vervolgens Containers > adftutorial.
Selecteer in de werkbalk van de containerpagina adftutorial Uploaden.
Selecteer op de pagina Blob uploaden het venster Bestanden en blader vervolgens naar en selecteer het bestand emp.txt.
Vouw de kop Geavanceerd uit. De pagina wordt nu als volgt weergegeven:
In het vak Uploaden naar map voert u invoer in.
Selecteer de knop Uploaden. Als het goed is, ziet u in de lijst nu het bestand emp.txt, evenals de uploadstatus hiervan.
Selecteer het pictogram Sluiten (X) om de pagina Blob uploaden te sluiten.
Houdt de containerpagina adftutorial open. U gaat hiermee aan het einde van deze QuickStart de uitvoer controleren.
Een gegevensfactory maken
Start de webbrowser Microsoft Edge of Google Chrome. Op dit moment wordt de Data Factory-gebruikersinterface alleen ondersteund in de webbrowsers Microsoft Edge en Google Chrome.
Ga naar de Azure Portal.
Selecteer in Azure Portal Een resource maken > Integratie > Data Factory:
Voer op de pagina Nieuwe data factory ADFTutorialDataFactory in als naam.
De naam van de Azure-gegevensfactory moet wereldwijd uniek zijn. Als u het volgende foutbericht ziet, wijzigt u de naam van de data factory (bijvoorbeeld <uwnaam>ADFTutorialDataFactory) en probeert u het opnieuw. Zie het artikel Data factory - Naamgevingsregels voor naamgevingsregels voor Data Factory-artefacten.
Selecteer voor Abonnement het Azure-abonnement waarin u de gegevensfactory wilt maken.
Voer een van de volgende stappen uit voor Resourcegroep:
- Selecteer Bestaande gebruiken en selecteer een bestaande resourcegroep in de lijst.
- Selecteer Nieuwe maken en voer de naam van een resourcegroep in.
Zie Resourcegroepen gebruiken om Azure-resources te beheren voor meer informatie.
Selecteer V2 als Versie.
Selecteer voor Locatie een locatie voor de data factory.
De lijst bevat alleen locaties die worden ondersteund door Data Factory en waar uw Azure Data Factory-metagegevens worden opgeslagen. De bijbehorende gegevensarchieven (zoals Azure Storage en Azure SQL Database) en berekeningen (zoals Azure HDInsight) die Data Factory gebruikt, kunnen in andere regio's worden uitgevoerd.
Selecteer Maken.
Wanneer het maken is voltooid, ziet u de pagina Data Factory. Selecteer Openen op de tegel Azure Data Factory Studio openen om de toepassing Azure Data Factory gebruikersinterface (UI) op een afzonderlijk tabblad te starten.
Het hulpprogramma Copy Data starten
Selecteer op de startpagina van Azure Data Factory de tegel Opnemen om het hulpprogramma Gegevens kopiëren starten.
Kies op de pagina Eigenschappen van Gegevens kopiëren hulpprogramma de optie Ingebouwde kopieertaak onder Taaktype en selecteer vervolgens Volgende.
Voltooi op de pagina Brongegevensarchief de volgende stappen:
Klik op + Nieuwe verbinding maken om een verbinding toe te voegen.
Selecteer het type gekoppelde service dat u wilt aanmaken voor de bronverbinding. In deze zelfstudie gebruiken we Azure Blob Storage. Selecteer het in de galerie en klik vervolgens op Doorgaan.
Geef op de pagina Nieuwe verbinding (Azure Blob Storage) een naam op voor de verbinding. Selecteer uw Azure-abonnement in de lijst Met Azure-abonnementen en uw opslagaccount in de lijst Storage-accountnaam, test de verbinding en selecteer vervolgens Maken.
Selecteer de zojuist gemaakte verbinding in het verbindingsblok.
Selecteer in de sectie Bestand of map de optie Bladeren om naar de map adftutorial/input te gaan, selecteer hetemp.txt bestand en klik vervolgens op OK.
Selecteer het selectievakje Binair exemplaar in om het bestand as-is te kopiëren, en selecteer vervolgens Volgende.
Voltooi op de pagina Doelgegevensopslag de volgende stappen:
Selecteer de AzureBlobStorage-verbinding die u hebt gemaakt in het blok Verbinding.
Voer in de sectie Mappad adftutorial/output in voor het mappad.
Laat andere instellingen op de standaardinstelling staan en selecteer volgende.
Geef op Instellingen pagina een naam op voor de pijplijn en de beschrijving en selecteer vervolgens Volgende om andere standaardconfiguraties te gebruiken.
Controleer op de pagina Overzicht alle instellingen. Selecteer vervolgens Volgende.
Selecteer op de pagina Implementatie voltooid de optie Controleren om de pijplijn of taak die u hebt gemaakt, te controleren.
De toepassing wordt overgeschakeld naar het Monitor-tabblad. U ziet de status van de pijplijn op dit tabblad. Selecteer Vernieuwen om de lijst te vernieuwen. Klik op de koppeling onder Pijplijnnaam om details van de activiteitsuit voeren weer te geven of de pijplijn opnieuw uit te voeren.
Selecteer op de pagina Activiteitsuit runs de koppeling Details (pictogram van een bril) onder de kolom Activiteitsnaam voor meer informatie over de kopieerbewerking. Zie Overzicht van kopieeractiviteit voor meer informatie over de eigenschappen.
Als u wilt teruggaan naar de weergave Pipeline Runs, selecteert u de koppeling Alle pijplijn-runs in het breadcrumb-menu. Selecteer Vernieuwen om de weergave te vernieuwen.
Controleer of er een emp.txt- bestand is gemaakt in de uitvoermap van de container adftutorial. Als de uitvoermap niet bestaat, wordt deze automatisch gemaakt in de Data Factory-service.
Schakel over naar het tabblad Auteur boven het tabblad Monitor op het linkerpaneel, zodat u de gekoppelde services, gegevenssets en pijplijnen kunt bewerken. Zie Een gegevensfactory maken in Azure Portal voor meer informatie over het bewerken hiervan in de gebruikersinterface van Data Factory.
Volgende stappen
Met de pijplijn in dit voorbeeld worden gegevens gekopieerd van de ene locatie naar een andere locatie in Azure Blob Storage. Doorloop de zelfstudies voor meer informatie over het gebruiken van Data Factory in andere scenario's.