Gegevens opnemen in een toegewezen SQL-pool

In dit artikel leert u hoe u gegevens van een Azure Data Lake Gen 2-opslagaccount opneemt in een toegewezen SQL-pool in Azure Synapse Analytics.

Vereisten

  • Azure-abonnement: als u geen Azure-abonnement hebt, maakt u een gratis Azure-account voordat u begint.
  • Azure-opslagaccount: u gebruikt Azure Data Lake Storage Gen 2 als brongegevensarchief. Als u geen opslagaccount hebt, raadpleegt u Een Azure Storage-account maken voor de stappen om er een te maken.
  • Azure Synapse Analytics: u gebruikt een toegewezen SQL-pool als sinkgegevensopslag.

Gekoppelde services maken

In Azure Synapse Analytics definieert u de verbindingsgegevens voor andere services in een gekoppelde service. In deze sectie voegt u een Azure Synapse Analytics en Azure Data Lake Storage Gen2 gekoppelde service toe.

  1. Open de Azure Synapse Analytics UX en ga naar het tabblad Beheren.
  2. Selecteer onder Externe verbindingen de optie Gekoppelde services.
  3. Selecteer Nieuw om een gekoppelde service toe te voegen.
  4. Selecteer de tegel Azure Data Lake Storage Gen2 in de lijst en selecteer Doorgaan.
  5. Voer uw verificatiereferenties in. Accountsleutel, service-principal en beheerde identiteit worden momenteel ondersteund. Selecteer Verbinding testen om te controleren of uw referenties juist zijn. Selecteer Maken nadat dit is voltooid.
  6. Herhaal stap 3-5, maar in plaats van Azure Data Lake Storage Gen2, selecteert u de tegel Azure Synapse Analytics en voert u de bijbehorende verbindingsreferenties in. Voor Azure Synapse Analytics worden MOMENTEEL SQL-verificatie, beheerde identiteit en service-principal ondersteund.

Pijplijn maken

Een pijplijn bevat de logische stroom voor het uitvoeren van een reeks activiteiten. In deze sectie maakt u een pijplijn met een kopieeractiviteit die gegevens van ADLS Gen2 opneemt in een toegewezen SQL-pool.

  1. Ga naar het tabblad Integreren . Selecteer het pluspictogram naast de pijplijnheader en selecteer Pijplijn.
  2. Sleep onder Verplaatsen en transformeren in het activiteitenvenster gegevens kopiëren naar het pijplijncanvas.
  3. Selecteer de kopieeractiviteit en ga naar het tabblad Bron . Selecteer Nieuw om een nieuwe brongegevensset te maken.
  4. Selecteer Azure Data Lake Storage gen2 als uw gegevensarchief en selecteer Doorgaan.
  5. Selecteer DelimitedText als uw indeling en selecteer Doorgaan.
  6. Selecteer in het deelvenster eigenschappen instellen de gekoppelde ADLS-service die u hebt gemaakt. Geef het bestandspad van de brongegevens op en geef op of de eerste rij een koptekst heeft. U kunt het schema importeren uit het bestandsarchief of een voorbeeldbestand. Als u klaar bent, klikt u op OK.
  7. Ga naar het tabblad Sink . Selecteer Nieuw om een nieuwe sinkgegevensset te maken.
  8. Selecteer Azure Synapse Analytics als uw gegevensarchief en selecteer Doorgaan.
  9. Selecteer in het deelvenster eigenschappen instellen de gekoppelde Azure Synapse Analytics-service die u hebt gemaakt. Als u naar een bestaande tabel schrijft, selecteert u deze in de vervolgkeuzelijst. Schakel anders Bewerken in en voer de naam van de nieuwe tabel in. Selecteer OK wanneer u klaar bent
  10. Als u een tabel maakt, schakelt u Automatisch tabel maken in het veld tabeloptie in.

Pijplijn opsporen en publiceren

Wanneer u klaar bent met het configureren van de pijplijn, kunt u deze uitvoeren om fouten op te sporten voordat u uw artefacten publiceert en te controleren of alles klopt.

  1. Selecteer Fouten opsporen om fouten op te sporen in de pijplijn. De status van de pijplijnuitvoering wordt weergegeven op het tabblad Uitvoer onder in het venster.
  2. Zodra de pijplijn kan worden uitgevoerd, selecteert u alles publiceren in de bovenste werkbalk. Met deze actie publiceert u entiteiten (gegevenssets en pijplijnen) die u hebt gemaakt in de Synapse Analytics-service.
  3. Wacht tot u het bericht Gepubliceerd ziet. Als u meldingen wilt bekijken, selecteert u de knop met de bel in de rechterbovenhoek.

De pijplijn activeren en controleren

In deze stap activeert u handmatig de pijplijn die in de vorige stap is gepubliceerd.

  1. Selecteer op de werkbalk de optie Trigger toevoegen en selecteer vervolgens Nu activeren. Selecteer op de pagina Pijplijnuitvoeringde optie Voltooien.
  2. Ga naar het tabblad Controle in de zijbalk aan de linkerkant. U ziet een pijplijn die wordt geactiveerd door een handmatige trigger. U kunt via de links in de kolom Acties details van de activiteiten bekijken en de pijplijn opnieuw uitvoeren.
  3. Selecteer de link Uitvoeringen van activiteit weergeven in de kolom Acties om de activiteituitvoeringen te zien die zijn gekoppeld aan de pijplijnuitvoering. Omdat er in dit voorbeeld slechts één activiteit is, ziet u slechts één vermelding in de lijst. Selecteer de link Details (pictogram van een bril) in de kolom Acties om details over de kopieerbewerking te zien. Selecteer Pijplijnuitvoeringen bovenaan om terug te gaan naar de weergave Pijplijnuitvoeringen. Selecteer Vernieuwen om de weergave te vernieuwen.
  4. Controleer of uw gegevens correct zijn geschreven in de toegewezen SQL-pool.

Volgende stappen

Zie het artikel Gegevens opnemen in Azure Data Lake Storage Gen2 voor meer informatie over gegevensintegratie voor Azure Synapse Analytics.