Så här kopierar du data med kopieringsaktivitet

I Datapipeline kan du använda aktiviteten Kopiera för att kopiera data mellan datalager som finns i molnet.

När du har kopierat data kan du använda andra aktiviteter för att transformera och analysera dem ytterligare. Du kan också använda aktiviteten Kopiera för att publicera transformerings- och analysresultat för Business Intelligence (BI) och programförbrukning.

För att kopiera data från en källa till ett mål utför tjänsten som kör aktiviteten Kopiera följande steg:

  1. Läser data från ett källdatalager.
  2. Utför serialisering/deserialisering, komprimering/dekomprimering, kolumnmappning och så vidare. Den utför dessa åtgärder baserat på konfigurationen.
  3. Skriver data till måldatalagret.

Förutsättningar

För att komma igång måste du uppfylla följande krav:

  • Ett Microsoft Fabric-klientkonto med en aktiv prenumeration. Skapa ett konto utan kostnad.

  • Kontrollera att du har en Microsoft Fabric-aktiverad arbetsyta.

Lägga till en kopieringsaktivitet med hjälp av kopieringsassistenten

Följ de här stegen för att konfigurera kopieringsaktiviteten med hjälp av kopieringsassistenten.

Börja med kopieringsassistenten

  1. Öppna en befintlig datapipeline eller skapa en ny datapipeline.

  2. Välj Kopiera data på arbetsytan för att öppna verktyget Kopieringsassistenten för att komma igång. Eller välj Använd kopieringsassistenten i listrutan Kopiera data under fliken Aktiviteter i menyfliksområdet.

    Skärmbild som visar alternativ för att öppna kopieringsassistenten.

Konfigurera din källa

  1. Välj en datakällatyp i kategorin. Du använder Azure Blob Storage som exempel. Välj Azure Blob Storage och välj sedan Nästa.

    Skärmbild av skärmen Välj datakälla.

    Skärmbild som visar var du väljer rätt datakälla.

  2. Skapa en anslutning till datakällan genom att välja Skapa ny anslutning.

    Skärmbild som visar var du väljer Ny anslutning.

    När du har valt Skapa ny anslutning fyller du i nödvändig anslutningsinformation och väljer sedan Nästa. Information om hur du skapar anslutningar för varje typ av datakälla finns i artikeln om varje anslutningsapp.

    Om du har befintliga anslutningar kan du välja Befintlig anslutning och välja din anslutning i listrutan.

    Skärmbild som visar den befintliga anslutningen.

  3. Välj den fil eller mapp som ska kopieras i det här källkonfigurationssteget och välj sedan Nästa.

    Skärmbild som visar var du väljer de data som ska kopieras.

Konfigurera målet

  1. Välj en datakällatyp i kategorin. Du använder Azure Blob Storage som exempel. Välj Azure Blob Storage och välj sedan Nästa.

    Skärmbild som visar hur du väljer Azure Blob Storage.

  2. Du kan antingen skapa en ny anslutning som länkar till ett nytt Azure Blob Storage-konto genom att följa stegen i föregående avsnitt eller använda en befintlig anslutning från listrutan för anslutning. Funktionerna i Testanslutning och Redigera är tillgängliga för varje vald anslutning.

    Skärmbild som visar alternativ för dataanslutning.

  3. Konfigurera och mappa dina källdata till målet. Välj sedan Nästa för att slutföra målkonfigurationerna.

    Skärmbild av skärmen Mappa till mål.

    Skärmbild av Anslut till datamålet.

Granska och skapa kopieringsaktiviteten

  1. Granska inställningarna för kopieringsaktiviteten i föregående steg och välj OK för att slutföra. Eller så kan du gå tillbaka till föregående steg för att redigera inställningarna om det behövs i verktyget.

    Skärmbild som visar skärmen Granska och skapa.

När kopieringsaktiviteten är klar läggs den sedan till i din datapipelinearbetsyta. Alla inställningar, inklusive avancerade inställningar för den här kopieringsaktiviteten, är tillgängliga under flikarna när den väljs.

Skärmbild som visar en kopieringsaktivitet på arbetsytan för datapipelinen.

Nu kan du antingen spara din datapipeline med den här enkla kopieringsaktiviteten eller fortsätta att utforma din datapipeline.

Lägga till en kopieringsaktivitet direkt

Följ de här stegen för att lägga till en kopieringsaktivitet direkt.

Lägga till en kopieringsaktivitet

  1. Öppna en befintlig datapipeline eller skapa en ny datapipeline.

  2. Lägg till en kopieringsaktivitet antingen genom att välja Lägg till pipelineaktivitet> aktiviteten Kopiera eller genom att välja Kopiera data>Lägg till på arbetsytan under fliken Aktiviteter.

    Skärmbild som visar två sätt att lägga till en kopieringsaktivitet.

Konfigurera dina allmänna inställningar under fliken Allmänt

Information om hur du konfigurerar dina allmänna inställningar finns i Allmänt.

Konfigurera källan på källfliken

  1. Välj + Ny bredvid Anslut ion för att skapa en anslutning till datakällan.

    Skärmbild som visar var du ska välja Ny.

    1. Välj datakälltypen i popup-fönstret. Du använder Azure SQL Database som exempel. Välj Azure SQL Database och välj sedan Fortsätt.

      Skärmbild som visar hur du väljer datakällan.

    2. Den navigerar till sidan för att skapa anslutningen. Fyll i nödvändig anslutningsinformation på panelen och välj sedan Skapa. Information om hur du skapar anslutningar för varje typ av datakälla finns i artikeln om varje anslutningsapp.

      Skärmbild som visar sidan Ny anslutning.

    3. När anslutningen har skapats tar den dig tillbaka till datapipelinesidan. Välj sedan Uppdatera för att hämta anslutningen som du skapade i listrutan. Du kan också välja en befintlig Azure SQL Database-anslutning från listrutan direkt om du redan har skapat den tidigare. Funktionerna i Testanslutning och Redigera är tillgängliga för varje vald anslutning. Välj sedan Azure SQL Database i Anslut ionstyp.

      Skärmbild som visar var anslutningen ska uppdateras.

  2. Ange en tabell som ska kopieras. Välj Förhandsgranska data för att förhandsgranska källtabellen. Du kan också använda fråga och lagrad procedur för att läsa data från din källa.

    Skärmbild som visar alternativ för källtabellinställningar.

  3. Expandera Avancerat för mer avancerade inställningar.

    Skärmbild av avancerade inställningar.

Konfigurera målet under målfliken

  1. Välj måltyp. Det kan vara antingen ditt interna förstklassiga datalager från din arbetsyta, till exempel Lakehouse, eller dina externa datalager. Du använder Lakehouse som exempel.

    Skärmbild som visar var du väljer måltyp.

  2. Välj att använda Lakehouse i datalagertypen Arbetsyta. Välj + Ny och navigerar till sidan För att skapa Lakehouse. Ange namnet på Lakehouse och välj sedan Skapa.

    Skärmbild som visar hur Lakehouse skapas.

  3. När anslutningen har skapats tar den dig tillbaka till datapipelinesidan. Välj sedan Uppdatera för att hämta anslutningen som du skapade i listrutan. Du kan också välja en befintlig Lakehouse-anslutning från listrutan direkt om du redan har skapat den tidigare.

    Skärmbild som visar val av anslutning.

  4. Ange en tabell eller konfigurera filsökvägen för att definiera filen eller mappen som mål. Välj Tabeller och ange en tabell för att skriva data.

    Skärmbild som visar var du hittar tabellinställningar.

  5. Expandera Avancerat för mer avancerade inställningar.

    Skärmbild av Avancerade alternativ.

Nu kan du antingen spara din datapipeline med den här enkla kopieringsaktiviteten eller fortsätta att utforma din datapipeline.

Konfigurera dina mappningar under mappningsfliken

Om anslutningsappen som du använder stöder mappning kan du gå till fliken Mappning för att konfigurera mappningen.

  1. Välj Importera scheman för att importera dataschemat.

    Skärmbild av mappningsinställningar 1.

  2. Du kan se att den automatiska mappningen visas. Ange källkolumnen och målkolumnen. Om du skapar en ny tabell i målet kan du anpassa namnet på målkolumnen här. Om du vill skriva data till den befintliga måltabellen kan du inte ändra det befintliga målkolumnnamnet . Du kan också visa typen av käll- och målkolumner.

    Skärmbild av mappningsinställningar 2.

Dessutom kan du välja + Ny mappning för att lägga till ny mappning, välja Rensa för att rensa alla mappningsinställningar och välja Återställ för att återställa alla mappningskolumner för källa .

Konfigurera din typkonvertering

Expandera Inställningar för typkonvertering för att konfigurera typkonverteringen om det behövs.

Skärmbild av konvertering av mappningstyp.

Se följande tabell för inställningsinformationen.

Inställning beskrivning
Tillåt datatrunkering Tillåt datatrunkering när du konverterar källdata till mål med en annan typ under kopieringen. Till exempel från decimal till heltal, från DatetimeOffset till Datetime.
Behandla booleskt värde som tal Behandla booleskt värde som tal. Du kan till exempel behandla sant som 1.
Datumformat Formatera sträng när du konverterar mellan datum och strängar, t.ex. "åååå-MM-dd". Mer information finns i Anpassade datum- och tidsformatsträngar.

Datumkolumnen kan läsas som datumtyp för:
 • Amazon RDS för SQL Server
 • Azure SQL Database
 • Hanterad Azure SQL Database-instans
 • Azure Synapse Analytics
 • Avgränsat textformat
 • Lakehouse Table
 • Parquet-format
 • SQL-server
DateTime-format Formatera sträng när du konverterar mellan datum utan tidszonsförskjutning och strängar. Till exempel "åååå-MM-dd HH:mm:ss.fff".
DateTimeOffset-format Formatera sträng när du konverterar mellan datum med tidszonsförskjutning och strängar. Till exempel "åååå-MM-dd HH:mm:ss.fff zzz".
TimeSpan-format Formatera sträng när du konverterar mellan tidsperioder och strängar. Till exempel "dd.hh:mm:ss".
Kultur Kulturinformation som ska användas vid konvertering av typer. Till exempel "en-us", "fr-fr".

Konfigurera dina andra inställningar under fliken Inställningar

Fliken Inställningar innehåller inställningar för prestanda, mellanlagring och så vidare.

Skärmbild av fliken Inställningar.

Se följande tabell för beskrivningen av varje inställning.

Inställning beskrivning
Intelligent dataflödesoptimering Ange för att optimera dataflödet. Du kan välja mellan:
Automatisk
Standard
Balanserad
Maximalt
När du väljer Auto tillämpas den optimala inställningen dynamiskt baserat på ditt källmålspar och datamönster. Du kan också anpassa dataflödet och det anpassade värdet kan vara 2–256 medan högre värde innebär fler vinster.
Grad av kopieringsparallellitet Ange graden av parallellitet som datainläsningen skulle använda.
Feltolerans När du väljer det här alternativet kan du ignorera vissa fel som inträffat mitt i kopieringsprocessen. Till exempel inkompatibla rader mellan käll- och målarkiv, fil som tas bort under dataflytt osv.
Aktivera loggning När du väljer det här alternativet kan du logga kopierade filer, överhoppade filer och rader
Aktivera mellanlagring Ange om data ska kopieras via ett mellanlagringslager. Aktivera endast mellanlagring för de fördelaktiga scenarierna.
Mellanlagringskontoanslutning När du väljer Aktivera mellanlagring anger du anslutningen för en Azure Storage-datakälla som ett mellanlagringslager. Välj + Ny för att skapa en mellanlagringsanslutning om du inte har den.

Konfigurera parametrar i en kopieringsaktivitet

Parametrar kan användas för att styra beteendet för en pipeline och dess aktiviteter. Du kan använda Lägg till dynamiskt innehåll för att ange parametrar för dina egenskaper för kopieringsaktivitet. Nu ska vi ange Lakehouse/Data Warehouse/KQL Database som ett exempel för att se hur du använder den.

  1. När du har valt Arbetsyta som datalagertyp och markerat Lakehouse/Data Warehouse/KQL Database som datalagertyp för arbetsytan väljer du Lägg till dynamiskt innehåll i listrutan i Lakehouse, Data Warehouse eller KQL Database.

  2. I popup-fönstret Lägg till dynamiskt innehåll går du till fliken Parametrar och väljer +.

    Skärmbild som visar sidan Lägg till dynamiskt innehåll.

  3. Ange namnet på parametern och ge den ett standardvärde om du vill, eller så kan du ange värdet för parametern när du har valt Kör i pipelinen.

    Skärmbild som visar hur du skapar en ny parameter.

    Observera att parametervärdet ska vara Lakehouse/Data Warehouse/KQL Database-objekt-ID. Om du vill hämta ditt Objekt-ID för Lakehouse/Data Warehouse/KQL Database öppnar du Lakehouse/Data Warehouse/KQL-databasen på arbetsytan och ID:t är efter /lakehouses/eller /datawarehouses/ i /databases/ din URL.

    • Lakehouse-objekt-ID:

      Skärmbild som visar Lakehouse-objekt-ID.

    • Data Warehouse-objekt-ID:

      Skärmbild som visar objekt-ID:t för informationslagret.

    • KQL Database-objekt-ID:

      Skärmbild som visar KQL Database-objekt-ID:t.

  4. Välj Spara för att gå tillbaka till fönstret Lägg till dynamiskt innehåll . Välj sedan parametern så att den visas i uttrycksrutan. Välj sedan OK. Du går tillbaka till pipelinesidan och kan se att parameteruttrycket har angetts efter Lakehouse-objekt-ID/:t Data Warehouse-objekt-ID/:t KQL Database-objekt-ID.

    Skärmbild som visar val av parameter.