Share via


Gegevens kopiëren met behulp van kopieeractiviteit

In Data Pipeline kunt u de Copy-activiteit gebruiken om gegevens te kopiëren tussen gegevensarchieven die zich in de cloud bevinden.

Nadat u de gegevens hebt gekopieerd, kunt u andere activiteiten gebruiken om deze verder te transformeren en te analyseren. U kunt ook de Copy-activiteit gebruiken om transformatie- en analyseresultaten te publiceren voor business intelligence (BI) en toepassingsverbruik.

Als u gegevens van een bron naar een bestemming wilt kopiëren, voert de service die de Copy-activiteit uitvoert de volgende stappen uit:

  1. Leest gegevens uit een brongegevensarchief.
  2. Serialisatie/deserialisatie, compressie/decompressie, kolomtoewijzing, enzovoort. Deze bewerkingen worden uitgevoerd op basis van de configuratie.
  3. Hiermee schrijft u gegevens naar het doelgegevensarchief.

Vereisten

Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:

  • Een Microsoft Fabric-tenantaccount met een actief abonnement. Gratis een account maken

  • Zorg ervoor dat u een werkruimte met Microsoft Fabric hebt ingeschakeld.

Een kopieeractiviteit toevoegen met behulp van de kopieerassistent

Volg deze stappen om uw kopieeractiviteit in te stellen met behulp van de kopieerassistent.

Beginnen met de kopieerassistent

  1. Open een bestaande gegevenspijplijn of maak een nieuwe gegevenspijplijn.

  2. Selecteer Gegevens kopiëren op het canvas om het hulpprogramma Copy Assistant te openen om aan de slag te gaan. Of selecteer Kopieerassistent gebruiken in de vervolgkeuzelijst Gegevens kopiëren onder het tabblad Activiteiten op het lint.

    Schermopname met opties voor het openen van de kopieerassistent.

Uw bron configureren

  1. Selecteer een gegevensbrontype in de categorie. U gebruikt Azure Blob Storage als voorbeeld. Selecteer Azure Blob Storage en selecteer vervolgens Volgende.

    Schermopname van het scherm Gegevensbron kiezen.

    Schermopname die laat zien waar de juiste gegevensbron moet worden geselecteerd.

  2. Maak een verbinding met uw gegevensbron door nieuwe verbinding maken te selecteren.

    Schermopname die laat zien waar u Nieuwe verbinding moet selecteren.

    Nadat u Nieuwe verbinding maken hebt geselecteerd, vult u de vereiste verbindingsgegevens in en selecteert u Volgende. Raadpleeg elk connectorartikel voor meer informatie over het maken van een verbinding voor elk type gegevensbron.

    Als u bestaande verbindingen hebt, kunt u Bestaande verbinding selecteren en uw verbinding selecteren in de vervolgkeuzelijst.

    Schermopname van de bestaande verbinding.

  3. Kies het bestand of de map die u wilt kopiëren in deze bronconfiguratiestap en selecteer vervolgens Volgende.

    Schermopname die laat zien waar u de te kopiëren gegevens selecteert.

Uw bestemming configureren

  1. Selecteer een gegevensbrontype in de categorie. U gebruikt Azure Blob Storage als voorbeeld. Selecteer Azure Blob Storage en selecteer vervolgens Volgende.

    Schermopname die laat zien hoe u Azure Blob Storage selecteert.

  2. U kunt een nieuwe verbinding maken die is gekoppeld aan een nieuw Azure Blob Storage-account door de stappen in de vorige sectie te volgen of een bestaande verbinding te gebruiken in de vervolgkeuzelijst voor verbindingen. De mogelijkheden van Verbinding testen en Bewerken zijn beschikbaar voor elke geselecteerde verbinding.

    Schermopname met opties voor gegevensverbinding.

  3. Configureer en wijs uw brongegevens toe aan uw bestemming. Selecteer vervolgens Volgende om de doelconfiguraties te voltooien.

    Schermopname van het scherm Toewijzen aan doel.

    Schermopname van Verbinding maken naar gegevensbestemming.

Uw kopieeractiviteit controleren en maken

  1. Controleer de instellingen voor de kopieeractiviteit in de vorige stappen en selecteer OK om te voltooien. U kunt ook teruggaan naar de vorige stappen om uw instellingen zo nodig in het hulpprogramma te bewerken.

    Schermopname van het scherm Controleren en maken.

Zodra de kopieeractiviteit is voltooid, wordt deze toegevoegd aan uw gegevenspijplijncanvas. Alle instellingen, inclusief geavanceerde instellingen voor deze kopieeractiviteit, zijn beschikbaar onder de tabbladen wanneer deze is geselecteerd.

Schermopname van een kopieeractiviteit op het canvas van de gegevenspijplijn.

U kunt nu uw gegevenspijplijn opslaan met deze enkele kopieeractiviteit of doorgaan met het ontwerpen van uw gegevenspijplijn.

Een kopieeractiviteit rechtstreeks toevoegen

Volg deze stappen om een kopieeractiviteit rechtstreeks toe te voegen.

Een kopieeractiviteit toevoegen

  1. Open een bestaande gegevenspijplijn of maak een nieuwe gegevenspijplijn.

  2. Voeg een kopieeractiviteit toe door pijplijnactiviteit toevoegen te selecteren Copy-activiteit of door Gegevens kopiëren>naar canvas te selecteren op het tabblad Activiteiten.>

    Schermopname van twee manieren om een kopieeractiviteit toe te voegen.

Uw algemene instellingen configureren op het tabblad Algemeen

Zie Algemeen voor meer informatie over het configureren van uw algemene instellingen.

Uw bron configureren op het tabblad Bron

  1. Selecteer + Nieuw naast de Verbinding maken ion om een verbinding met uw gegevensbron te maken.

    Schermopname die laat zien waar u Nieuw moet selecteren.

    1. Kies het gegevensbrontype in het pop-upvenster. U gebruikt Azure SQL Database als voorbeeld. Selecteer Azure SQL Database en vervolgens Doorgaan.

      Schermopname die laat zien hoe u de gegevensbron selecteert.

    2. Hiermee gaat u naar de pagina voor het maken van de verbinding. Vul de vereiste verbindingsgegevens in het deelvenster in en selecteer Vervolgens Maken. Raadpleeg elk connectorartikel voor meer informatie over het maken van een verbinding voor elk type gegevensbron.

      Schermopname van de pagina Nieuwe verbinding.

    3. Zodra de verbinding is gemaakt, gaat u terug naar de gegevenspijplijnpagina. Selecteer Vervolgens Vernieuwen om de verbinding op te halen die u hebt gemaakt in de vervolgkeuzelijst. U kunt ook rechtstreeks in de vervolgkeuzelijst een bestaande Azure SQL Database-verbinding kiezen als u deze al hebt gemaakt. De mogelijkheden van Verbinding testen en Bewerken zijn beschikbaar voor elke geselecteerde verbinding. Selecteer vervolgens Azure SQL Database in Verbinding maken iontype.

      Schermopname die laat zien waar u de verbinding kunt vernieuwen.

  2. Geef een tabel op die moet worden gekopieerd. Selecteer Voorbeeldgegevens om een voorbeeld van uw brontabel te bekijken. U kunt ook de query- en opgeslagen procedure gebruiken om gegevens uit uw bron te lezen.

    Schermopname met opties voor brontabelinstellingen.

  3. Vouw Geavanceerd uit voor meer geavanceerde instellingen.

    Schermopname van geavanceerde instellingen.

Uw bestemming configureren op het doeltabblad

  1. Kies uw doeltype. Dit kan uw interne eersteklas gegevensarchief zijn vanuit uw werkruimte, zoals Lakehouse of uw externe gegevensarchieven. U gebruikt Lakehouse als voorbeeld.

    Schermopname die laat zien waar het doeltype moet worden geselecteerd.

  2. Kies ervoor om Lakehouse te gebruiken in het gegevensarchieftype Werkruimte. Selecteer + Nieuw en hiermee gaat u naar de pagina voor het maken van Lakehouse. Geef uw Lakehouse-naam op en selecteer Vervolgens Maken.

    Schermopname van het maken van Lakehouse.

  3. Zodra de verbinding is gemaakt, gaat u terug naar de gegevenspijplijnpagina. Selecteer Vervolgens Vernieuwen om de verbinding op te halen die u hebt gemaakt in de vervolgkeuzelijst. U kunt ook een bestaande Lakehouse-verbinding in de vervolgkeuzelijst rechtstreeks kiezen als u deze al eerder hebt gemaakt.

    Schermopname van het selecteren van verbinding.

  4. Geef een tabel op of stel het bestandspad in om het bestand of de map als doel te definiëren. Selecteer hier Tabellen en geef een tabel op om gegevens te schrijven.

    Schermopname die laat zien waar u tabelinstellingen kunt vinden.

  5. Vouw Geavanceerd uit voor meer geavanceerde instellingen.

    Schermopname van geavanceerde opties.

U kunt nu uw gegevenspijplijn opslaan met deze enkele kopieeractiviteit of doorgaan met het ontwerpen van uw gegevenspijplijn.

Uw toewijzingen configureren op het tabblad Toewijzing

Als de connector die u toepast ondersteuning biedt voor toewijzing, gaat u naar het tabblad Toewijzing om uw toewijzing te configureren.

  1. Selecteer Schema's importeren om uw gegevensschema te importeren.

    Schermopname van toewijzingsinstellingen 1.

  2. U kunt zien dat de automatische toewijzing wordt weergegeven. Geef de kolom Bron en de doelkolom op. Als u een nieuwe tabel in het doel maakt, kunt u hier de naam van de doelkolom aanpassen. Als u gegevens naar de bestaande doeltabel wilt schrijven, kunt u de naam van de bestaande doelkolom niet wijzigen. U kunt ook het type bron- en doelkolommen weergeven.

    Schermopname van toewijzingsinstellingen 2.

Bovendien kunt u + Nieuwe toewijzing selecteren om nieuwe toewijzing toe te voegen, wissenom alle toewijzingsinstellingen te wissen en Opnieuw instellen selecteren om alle toewijzingsbronkolom opnieuw in te stellen.

Uw typeconversie configureren

Vouw de instellingen voor typeconversie uit om uw typeconversie zo nodig te configureren.

Schermopname van conversie van toewijzingstype.

Zie de volgende tabel voor de instellingsdetails.

Instelling Beschrijving
Afkapping van gegevens toestaan Sta afkapping van gegevens toe bij het converteren van brongegevens naar bestemming met een ander type tijdens het kopiëren. Bijvoorbeeld van decimaal naar geheel getal, van DatetimeOffset naar Datetime.
Booleaanse waarde behandelen als getal Booleaanse waarde behandelen als getal. Behandel bijvoorbeeld waar als 1.
Datumnotatie Tekenreeks opmaken bij het converteren tussen datums en tekenreeksen, bijvoorbeeld 'jjjj-MM-dd'. Zie Tekenreeksen voor aangepaste datum- en tijdnotatie voor meer informatie.

De datumkolom kan worden gelezen als datumtype voor:
 • Amazon RDS voor SQL Server
 • Azure SQL Database
 • Beheerd exemplaar van Azure SQL Database
 • Azure Synapse Analytics
 • Tekstopmaak met scheidingstekens
 • Lakehouse Table
 • Parquet-indeling
 • SQL Server
Datum/tijd-indeling Maak een tekenreeks op bij het converteren tussen datums zonder tijdzoneverschil en tekenreeksen. Bijvoorbeeld 'jjjj-MM-dd HH:mm:ss.fff'.
DateTimeOffset-indeling Maak een tekenreeks op bij het converteren tussen datums met tijdzone-offset en tekenreeksen. Bijvoorbeeld 'jjjj-MM-dd HH:mm:ss.fff zzz'.
Tijdspanne-indeling Tekenreeks opmaken bij het converteren tussen tijdsperioden en tekenreeksen. Bijvoorbeeld 'dd.hh:mm:ss'.
Cultuur Cultuurinformatie die moet worden gebruikt bij het converteren van typen. Bijvoorbeeld 'en-us', 'fr-fr'.

Uw andere instellingen configureren op het tabblad Instellingen

Het tabblad Instellingen bevat de instellingen van prestaties, fasering, enzovoort.

Schermopname van Instellingen tabblad.

Zie de volgende tabel voor de beschrijving van elke instelling.

Instelling Beschrijving
Intelligente doorvoeroptimalisatie Geef op om de doorvoer te optimaliseren. U kunt kiezen uit:
Automatisch
Standaard
Evenwichtig
Maximum
Wanneer u Auto kiest, wordt de optimale instelling dynamisch toegepast op basis van uw bron-doelpaar en gegevenspatroon. U kunt ook uw doorvoer aanpassen en aangepaste waarde kan 2-256 zijn, terwijl een hogere waarde meer winst impliceert.
Mate van kopieerparallelisme Geef de mate van parallelle uitvoering op die wordt gebruikt voor het laden van gegevens.
Fouttolerantie Wanneer u deze optie selecteert, kunt u enkele fouten negeren die tijdens het kopieerproces zijn opgetreden. Bijvoorbeeld incompatibele rijen tussen bron- en doelopslag, bestand dat wordt verwijderd tijdens gegevensverplaatsing, enzovoort.
Logboekregistratie inschakelen Wanneer u deze optie selecteert, kunt u gekopieerde bestanden vastleggen, bestanden overgeslagen en rijen overslaan
Fasering inschakelen Geef op of u gegevens wilt kopiëren via een tussentijdse faseringsopslag. Schakel fasering alleen in voor de gunstige scenario's.
Verbinding met faseringsaccount Wanneer u Fasering inschakelen selecteert, geeft u de verbinding van een Azure-opslaggegevensbron op als tijdelijke faseringsopslag. Selecteer + Nieuw om een faseringsverbinding te maken als u deze niet hebt.

Parameters configureren in een kopieeractiviteit

Parameters kunnen worden gebruikt om het gedrag van een pijplijn en de bijbehorende activiteiten te beheren. U kunt dynamische inhoud toevoegen gebruiken om parameters op te geven voor de eigenschappen van de kopieeractiviteit. Laten we lakehouse/datawarehouse/KQL-database als voorbeeld opgeven om te zien hoe u deze kunt gebruiken.

  1. Selecteer in uw bron of doel, nadat u Werkruimte hebt geselecteerd als gegevensarchieftype en de KQL-database van Lakehouse/Data Warehouse/als gegevensarchieftype werkruimte hebt opgegeven, dynamische inhoud toevoegen in de vervolgkeuzelijst van Lakehouse of Data Warehouse of KQL Database.

  2. Selecteer in het pop-upvenster Dynamische inhoud toevoegen, onder het tabblad Parameters , de optie +.

    Schermopname van de pagina Dynamische inhoud toevoegen.

  3. Geef de naam voor de parameter op en geef deze desgewenst een standaardwaarde op, of u kunt de waarde voor de parameter opgeven nadat u Uitvoeren in de pijplijn hebt geselecteerd.

    Schermopname van het maken van een nieuwe parameter.

    Houd er rekening mee dat de parameterwaarde Lakehouse/Data Warehouse/KQL Database-object-id moet zijn. Als u uw Lakehouse/Data Warehouse/KQL Database-object-id wilt ophalen, opent u uw Lakehouse-/Data Warehouse/KQL-database in uw werkruimte en bevindt de id zich na /lakehouses/of /datawarehouses//databases/ in uw URL.

    • Lakehouse-object-id:

      Schermopname van de object-id van Lakehouse.

    • Object-id datawarehouse:

      Schermopname van de object-id datawarehouse.

    • KQL Database-object-id:

      Schermopname van de object-id van de KQL-database.

  4. Selecteer Opslaan om terug te gaan naar het deelvenster Dynamische inhoud toevoegen. Selecteer vervolgens de parameter zodat deze wordt weergegeven in het expressievak. Selecteer vervolgens OK. U gaat terug naar de pijplijnpagina en ziet dat de parameterexpressie is opgegeven na de object-id van het Lakehouse-object-id//KQL Database-object-id.

    Schermopname van het selecteren van de parameter.