Snabbstart: Läsa in data i SQL med kopieringsaktiviteten

Azure Synapse Analytics erbjuder olika analysmotorer som hjälper dig att mata in, transformera, modellera och analysera dina data. En dedikerad SQL-pool erbjuder T-SQL-baserade beräknings- och lagringsfunktioner. När du har skapat SQL dedikerad pool i Synapse-arbetsytan kan data läsas in, modelleras, bearbetas och levereras för snabbare analysinsikter.

I den här snabbstarten lär du dig att läsa in data från Azure SQL Database till Azure Synapse Analytics. Du kan följa liknande steg för att kopiera data från andra typer av datalager. Det här liknande flödet gäller även för datakopiering för andra källor och mottagare.

Förutsättningar

  • Azure-prenumeration: Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.
  • Azure Synapse arbetsyta: Skapa en Synapse-arbetsyta med hjälp Azure Portal följa anvisningarna i Snabbstart: Skapa en Synapse-arbetsyta.
  • Azure SQL Database: Den här självstudien kopierar data från Adventure Works LT-exempeldatauppsättningen i Azure SQL Database. Du kan skapa den här exempeldatabasen SQL Database genom att följa anvisningarna i Skapa en exempeldatabas i Azure SQL Database. Eller så kan du använda andra datalager genom att följa liknande steg.
  • Azure-lagringskonto: Azure Storage används som mellanlagringsområde i kopieringsåtgärden. Om du inte har något Azure-lagringskonto finns det anvisningar i Skapa ett lagringskonto.
  • Azure Synapse Analytics: Du använder en dedikerad SQL som ett datalager för mottagare. Om du inte har en Azure Synapse Analytics-instans kan du gå till Skapa en dedikerad SQL för steg för att skapa en.

När synapse-arbetsytan har skapats kan du öppna din Synapse-Synapse Studio:

I den här snabbstarten använder vi arbetsytan med namnet "adftest2020" som exempel. Du kommer automatiskt till Synapse Studio startsidan.

Synapse Studio startsidan

Skapa länkade tjänster

I Azure Synapse Analytics är en länkad tjänst där du definierar din anslutningsinformation till andra tjänster. I det här avsnittet skapar du följande två typer av länkade tjänster: Azure SQL Database och Azure Data Lake Storage Gen2 (ADLS Gen2) länkade tjänster.

  1. På Synapse Studio väljer du fliken Hantera i det vänstra navigeringsfönstret.

  2. Under Externa anslutningar väljer du Länkade tjänster.

    Skapa ny länkad tjänst

  3. Om du vill lägga till en länkad tjänst väljer du Ny.

  4. Välj Azure SQL Database från galleriet och välj sedan Fortsätt. Du kan skriva "sql" i sökrutan för att filtrera anslutningsapparna.

    Skapa en ny Azure SQL Database länkad tjänst

  5. På sidan New Linked Service (Ny länkad tjänst) väljer du servernamnet och DB-namnet i listrutan och anger användarnamn och lösenord. Klicka på Testa anslutning för att verifiera inställningarna och välj sedan Skapa.

    Konfigurera Azure SQL Database länkad tjänst

  6. Upprepa steg 3–4, men välj Azure Data Lake Storage Gen2 i stället från galleriet. På sidan New Linked Service (Ny länkad tjänst) väljer du namnet på ditt lagringskonto i listrutan. Klicka på Testa anslutning för att verifiera inställningarna och välj sedan Skapa.

    Konfigurera Azure Data Lake Storage Gen2

Skapa en pipeline

En pipeline innehåller det logiska flödet för en körning av en uppsättning aktiviteter. I det här avsnittet skapar du en pipeline som innehåller en kopieringsaktivitet som matar in data från Azure SQL Database till en dedikerad SQL pool.

  1. Gå till fliken Integrera. Välj plusikonen bredvid rubriken pipelines och välj Pipeline.

    Skapa en ny pipeline

  2. Under Flytta och transformera i fönstret Aktiviteter drar du Kopiera data till pipelinearbetsytan.

  3. Välj kopieringsaktiviteten och gå till fliken Källa. Välj Ny för att skapa en ny källdatauppsättning.

    Skapa en källdatauppsättning

  4. Välj Azure SQL Database som datalager och välj Fortsätt.

  5. I fönstret Ange egenskaper väljer du den länkade Azure SQL Database som du skapade i ett tidigare steg.

  6. Under Tabellnamn väljer du en exempeltabell som ska användas i följande kopieringsaktivitet. I den här snabbstarten använder vi tabellen "SalesLT.Customer" som exempel.

    Konfigurera egenskaper för källdatauppsättning

  7. Välj OK när du är klar.

  8. Välj kopieringsaktiviteten och gå till fliken Mottagare. Välj Ny för att skapa en ny datauppsättning för mottagare.

  9. Välj Azure Synapse dedikerad SQL som datalager och välj Fortsätt.

  10. I fönstret Ange egenskaper väljer du den SQL Analytics-pool som du skapade i tidigare steg. Om du skriver till en befintlig tabell väljer du den under Tabellnamn i listrutan. Annars markerar du "Redigera" och anger det nya tabellnamnet. Välj OK när du är klar.

  11. För Inställningar för datauppsättning för mottagare aktiverar du Skapa tabell automatiskt i fältet Tabellalternativ.

    Aktivera automatisk skapa

  12. På sidan Inställningar markerar du kryssrutan för Aktivera mellanlagring. Det här alternativet gäller om dina källdata inte är kompatibla med PolyBase. I avsnittet Mellanlagringsinställningar väljer du den Azure Data Lake Storage Gen2-länkad tjänst som du skapade i ett tidigare steg som mellanlagring.

    Lagringen används för mellanlagring av data innan de läses in i Azure Synapse Analytics med hjälp av PolyBase. När kopieringen är klar rensas mellanliggande data i Azure Data Lake Storage Gen2 automatiskt.

    Aktivera mellanlagring

  13. Verifiera pipelinen genom att välja Verifiera i verktygsfältet. Resultatet av pipelineverifieringen visas till höger på sidan.

Felsöka och publicera en pipeline

När du har konfigurerat pipelinen kan du köra en felsökningskörning innan du publicerar artefakterna för att kontrollera att allt är korrekt.

  1. Välj Felsöka i verktygsfält för att felsöka pipelinen. Du ser status för pipelinekörningen på fliken Utdata längst ned i fönstret.

    Felsöka pipeline

  2. När pipelinekörningen har körts väljer du Publicera alla i det översta verktygsfältet. Den här åtgärden publicerar entiteter (datauppsättningar och pipeliner) som du har skapat Synapse Analytics tjänsten.

  3. Vänta tills du ser meddelandet om att entiteterna har publicerats. Om du vill se meddelanden väljer du klockknappen längst upp till höger.

Utlösa och övervaka pipelinen

I det här avsnittet utlöser du manuellt pipelinen som publicerades i föregående steg.

  1. Välj Lägg till utlösare i verktygsfältet och välj sedan Trigger Now (Utlöst nu). På sidan Pipeline Run (Pipelinekörning) väljer du OK.

  2. Gå till fliken Övervaka i det vänstra sidofältet. Du ser en pipelinekörning som är utlöst av en manuell utlösare.

  3. När pipelinekörningen har slutförts väljer du länken under kolumnen Pipelinenamn för att visa information om aktivitetskörningen eller för att köra pipelinen igen. I det här exemplet finns det bara en aktivitet, så du ser bara en post i listan.

  4. Om du vill ha mer information om kopieringsåtgärden väljer du länken Information (glasögonikonen) under kolumnen Aktivitetsnamn. Du kan övervaka information som mängden data som kopieras från källan till mottagaren, dataflöde, körningssteg med motsvarande varaktighet och använda konfigurationer.

    Aktivitetsinformation

  5. Om du vill växla tillbaka till vyn med pipelinekörningar väljer du länken Alla pipelinekörningar högst upp. Om du vill uppdatera listan väljer du Refresh (Uppdatera).

  6. Kontrollera att dina data är korrekt skrivna i den dedikerade SQL poolen.

Nästa steg

Gå vidare till följande artikel om du vill veta Azure Synapse Analytics support: