Snabbstart: Använd Kopiera data för att kopiera data

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

I den här snabbstarten använder du Azure-portalen för att skapa en datafabrik. Sedan använder du verktyget Kopiera data för att skapa en pipeline som kopierar data från en mapp i en Azure Blob Storage till en annan mapp.

Anteckning

Om du inte har använt Azure Data Factory tidigare kan du läsa Introduktion till Azure Data Factory.

Förutsättningar

Azure-prenumeration

Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.

Azure-roller

Om du vill skapa Data Factory-instanser måste det användarkonto du använder för att logga in på Azure vara medlem av rollerna deltagare eller ägare, eller vara administratör för Azure-prenumerationen. Om du vill visa de behörigheter som du har i prenumerationen går du till Azure Portal, väljer ditt användarnamn i det övre högra hörnet, väljer ikonen "..." för fler alternativ och väljer sedan Mina behörigheter. Om du har åtkomst till flera prenumerationer väljer du rätt prenumeration.

För att skapa och hantera underordnade resurser för Data Factory – inklusive datauppsättningar, länkade tjänster, pipelines, utlösare och integreringskörningar – gäller följande krav:

  • Om du vill skapa och hantera underordnade resurser i Azure Portal måste du tillhöra rollen Data Factory-deltagare på resursgruppsnivå eller högre.
  • För att skapa och hantera underordnade resurser med PowerShell eller SDK räcker det att du har rollen som deltagare på resursnivå eller högre.

För exempel på instruktioner om hur du lägger till en användare till en roll läser du artikeln Lägg till roller.

Mer information finns i följande artiklar:

Azure-lagringskonto

Du använder ett allmänt Azure Storage (särskilt Blob Storage) som både käll- och måldatalager i den här snabbstarten. Om du inte har något konto för generell användning Azure Storage du skapa ett i Skapa ett lagringskonto.

Hämta lagringskontots namn

Du behöver namnet på ditt Azure Storage för den här snabbstarten. Följande procedur innehåller steg för att hämta namnet på ditt lagringskonto:

  1. I en webbläsare går du till den Azure Portal loggar in med ditt användarnamn och lösenord för Azure.
  2. På Azure Portal väljer du Alla tjänster och sedan Lagringslagringskonton. > Du kan också söka efter och välja Lagringskonton på valfri sida.
  3. På sidan Lagringskonton filtrerar du efter ditt lagringskonto (om det behövs) och väljer sedan ditt lagringskonto.

Du kan också söka efter och välja Lagringskonton på valfri sida.

Skapa en blobcontainer

I det här avsnittet skapar du en blobcontainer med namnet adftutorial i Azure Blob Storage.

  1. På lagringskontosidan väljer du Översikt > Containrar.

  2. På sidan <Account name> - Containrars verktygsfält väljer du Container.

  3. I dialogrutan Ny container anger du adftutorial som namn och väljer OK. Sidan <Account name> - Containrar uppdateras för att inkludera adftutorial i listan över containrar.

    Lista över containrar

Lägga till en indatamapp och fil för blobcontainern

I det här avsnittet skapar du en mapp med namnet input i containern du skapade och laddar sedan upp en exempelfil till indatamappen. Innan du börjar öppnar du en textredigerare, till exempel Anteckningar, och skapar en filemp.txt med följande innehåll:

John, Doe
Jane, Doe

Spara filen i mappen C:\ADFv2QuickStartPSH. (Om mappen inte redan finns skapar du den.) Gå sedan tillbaka till Azure Portal och följ dessa steg:

  1. På sidan <Account name> - Containrar där du slutade väljer du adftutorial i den uppdaterade listan över containrar.

    1. Om du stängde fönstret eller gick till en annan sida loggar du in på Azure Portal igen.
    2. På Azure Portal väljer du Alla tjänster och sedan Lagringslagringskonton. > Du kan också söka efter och välja Lagringskonton på valfri sida.
    3. Välj ditt lagringskonto och välj sedan Containers > adftutorial.
  2. Välj Ladda upp på containersidan adftutorial i verktygsfältet.

  3. På sidan Ladda upp blob väljer du rutan Filer och bläddrar sedan till och väljer emp.txt fil.

  4. Expandera rubriken Avancerat. Sidan visas nu så här:

    Välj länken Avancerat

  5. I rutan Ladda upp till mapp anger du indata.

  6. Välj knappen Ladda upp. Du bör se filen emp.txt och uppladdningens status i listan.

  7. Välj ikonen Stäng (ett X) för att stänga sidan Ladda upp blob.

Låt containersidan adftutorial vara öppen. Du kommer att använda den för att bekräfta utdata i slutet av snabbstarten.

Skapa en datafabrik

  1. Starta webbläsaren Microsoft Edge eller Google Chrome. Användargränssnittet för Data Factory stöds för närvarande bara i webbläsarna Microsoft Edge och Google Chrome.

  2. Gå till Azure-portalen.

  3. På menyn Azure Portal väljer du Skapa en resursintegrering > > Data Factory:

    Skapa ny datafabrik

  4. På sidan Ny datafabrik anger du ADFTutorialDataFactory som Namn.

    Namnet på den Azure Data Factory måste vara globalt unikt. Om du ser följande fel ändrar du namnet på datafabriken (till exempel < > dittnamn ADFTutorialDataFactory) och försöker skapa den igen. Namngivningsregler för Data Factory-artefakter finns i artikeln Data Factory – namnregler.

    Fel när ett namn inte är tillgängligt

  5. Välj den Azure-prenumeration där du vill skapa den nya datafabriken för Prenumeration.

  6. För Resursgrupp utför du något av följande steg:

    • Välj Använd befintlig och välj en befintlig resursgrupp från listan.
    • Välj Skapa ny och ange namnet på en resursgrupp.

    Mer information om resursgrupper finns i Använda resursgrupper till att hantera Azure-resurser.

  7. För Version väljer du V2.

  8. För Plats väljer du en plats för datafabriken.

    I listan visas endast platser som Data Factory har stöd för och var dina Azure Data Factory-metadata kommer att lagras. De associerade datalager (som Azure Storage och Azure SQL Database) och beräkningar (till exempel Azure HDInsight) som Data Factory använder kan köras i andra regioner.

  9. Välj Skapa.

  10. När datafabriken har skapats visas sidan Datafabrik. Välj Öppnapanelen Öppna Azure Data Factory Studio för att Azure Data Factory användargränssnittet (UI) på en separat flik.

    Startsidan för Azure Data Factory med panelen Open Azure Data Factory Studio.

Starta verktyget Kopiera data

  1. På startsidan för Azure Data Factory väljer du panelen Mata in för att starta Kopiera data verktyget.

    Skärmbild som visar Azure Data Factory startsidan.

  2. På sidan Egenskaper i Kopiera data väljer du Inbyggd kopieringsaktivitet under Aktivitetstyp och väljer sedan Nästa.

    &quot;Sidan &quot; Egenskaper

  3. Gör följande på sidan Källdatalager:

    1. Klicka på + Skapa ny anslutning för att lägga till en anslutning.

    2. Välj den länkade tjänsttyp som du vill skapa för källanslutningen. I den här självstudien använder vi Azure Blob Storage. Välj den från galleriet och välj sedan Fortsätt.

      Välj Blob

    3. På sidan Ny anslutning (Azure Blob Storage) anger du ett namn på anslutningen. Välj din Azure-prenumeration i listan över Azure-prenumerationer och ditt lagringskonto från listan Storage för kontonamn, testa anslutningen och välj sedan Skapa.

      Konfigurera Azure Blob Storage-konto

    4. Välj den nyligen skapade anslutningen i anslutningsblocket.

    5. I avsnittet Fil eller mapp väljer du Bläddra för att navigera till mappen adftutorial/input, markerar filen emp.txt och klickar sedan på OK.

    6. Markera kryssrutan Binär kopia för att kopiera filen som den är och välj sedan Nästa.

      Skärmbild som visar sidan Källdatalager.

  4. På sidan Måldatalager utför du följande steg:

    1. Välj den AzureBlobStorage-anslutning som du skapade i anslutningsblocket.

    2. I avsnittet Mappsökväg anger du adftutorial/output för mappsökvägen.

      Skärmbild som visar sidan Måldatalager.

    3. Lämna övriga inställningar som standard och välj sedan Nästa.

  5. På sidan Inställningar anger du ett namn för pipelinen och dess beskrivning och väljer sedan Nästa för att använda andra standardkonfigurationer.

    Skärmbild som visar inställningssidan.

  6. Granska alla inställningar på sidan Summary (Sammanfattning) och klicka på Nästa.

  7. Sidan om att distributionen har slutförts visas. Välj Övervaka om du vill övervaka den pipeline du har skapat.

    &quot;Sidan Distributionen är &quot; klar

  8. Programmet växlar till fliken Övervaka. Du ser status för pipelinen på den här fliken. Välj Uppdatera för att uppdatera listan. Klicka på länken under Pipelinenamn för att visa information om aktivitetskörningar eller köra pipelinen igen.

    Uppdatera pipeline

  9. På sidan Aktivitetskörningar väljer du länken Information (glasögonikonen) under kolumnen Aktivitetsnamn för mer information om kopieringsåtgärden. Mer information om egenskaperna finns i Copy Activity overview (Översikt över kopieringsaktivitet).

  10. Om du vill gå tillbaka till vyn Pipeline Runs (Pipelinekörningar) väljer du länken All pipeline runs (Alla pipelinekörningar) på den dynamiska menyn. Välj Uppdatera för att uppdatera vyn.

  11. Verifiera att filen emp.txt har skapats i mappen output för containern adftutorial. Om utdatamappen inte finns skapas Data Factory automatiskt.

  12. Växla till fliken Fönster över fliken Övervakare på den vänstra panelen så att du kan redigera länkade tjänster, datauppsättningar och piplines. Mer information om hur du redigerar dessa i användargränssnittet för Data Factory finns i Skapa en datafabrik med hjälp av Azure-portalen.

    Välj fliken Författare

Nästa steg

Pipelinen i det här exemplet kopierar data från en plats till en annan i Azure Blob Storage. Gå igenom självstudiekurserna om du vill lära dig hur du använder Data Factory i fler scenarier.