Läsa in data i Azure Synapse Analytics med Azure Data Factory eller en Synapse-pipeline

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Azure Synapse Analytics är en molnbaserad, utskalningsdatabas som kan bearbeta enorma mängder data, både relationsbaserade och icke-relationella. Azure Synapse Analytics bygger på MPP-arkitekturen (Massively Parallel Processing) som är optimerad för arbetsbelastningar i företags informationslager. Det erbjuder molnasticitet med flexibiliteten att skala lagring och beräkning oberoende av varandra.

Att komma igång med Azure Synapse Analytics är nu enklare än någonsin. Azure Data Factory och dess motsvarande pipelinefunktion i Azure Synapse tillhandahåller en fullständigt hanterad molnbaserad dataintegreringstjänst. Du kan använda tjänsten för att fylla i Azure Synapse Analytics med data från ditt befintliga system och spara tid när du skapar dina analyslösningar.

Azure Data Factory och Synapse-pipelines ger följande fördelar vid inläsning av data i Azure Synapse Analytics:

  • Lätt att konfigurera: En intuitiv 5-stegsguide utan att skript krävs.
  • Stöd för omfattande datalager: Inbyggt stöd för en omfattande uppsättning lokala och molnbaserade datalager. En detaljerad lista finns i tabellen över datalager som stöds.
  • Säker och kompatibel: Data överförs via HTTPS eller ExpressRoute. Den globala tjänstnärvaron säkerställer att dina data aldrig lämnar den geografiska gränsen.
  • Ojämförlig prestanda med hjälp av PolyBase: Polybase är det mest effektiva sättet att flytta data till Azure Synapse Analytics. Använd funktionen för mellanlagringsblob för att uppnå höga belastningshastigheter från alla typer av datalager, inklusive Azure Blob Storage och Data Lake Store. (Polybase stöder Azure Blob Storage och Azure Data Lake Store som standard.) Mer information finns i aktiviteten Kopiera prestanda.

Den här artikeln visar hur du använder verktyget Kopiera data för att läsa in data från Azure SQL Database till Azure Synapse Analytics. Du kan följa liknande steg för att kopiera data från andra typer av datalager.

Anteckning

Mer information finns i Kopiera data till eller från Azure Synapse Analytics.

Förutsättningar

  • Azure-prenumeration: Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.
  • Azure Synapse Analytics: Informationslagret innehåller de data som kopieras från den SQL databasen. Om du inte har en Azure Synapse Analytics kan du läsa anvisningarna i Skapa en Azure Synapse Analytics.
  • Azure SQL Database: Den här självstudien kopierar data från Adventure Works LT-exempeldatauppsättningen i Azure SQL Database. Du kan skapa den här exempeldatabasen SQL Database genom att följa anvisningarna i Skapa en exempeldatabas i Azure SQL Database.
  • Azure Storage-konto: Azure Storage används som mellanlagringsblob i masskopieringsåtgärden. Om du inte har något Azure-lagringskonto finns det anvisningar i Skapa ett lagringskonto.

Skapa en datafabrik

Anteckning

Du kan hoppa över skapandet av en ny datafabrik om du vill använda pipelinefunktionen i din befintliga Synapse-arbetsyta för att läsa in data. Azure Synapse bäddar in funktionerna i Azure Data Factory i dess pipeline-funktion.

  1. På den vänstra menyn väljer du Skapa en resurs > Data och analys > Data Factory:

  2. På sidan Ny datafabrik anger du värden för följande objekt:

    • Namn: Ange LoadSQLDWDemo som namn. Namnet på din datafabrik måste vara *globalt unikt. Om du får felet "Datafabriksnamnet LoadSQLDWDemo är inte tillgängligt" anger du ett annat namn för datafabriken. Du kan till exempel använda namnet dittnamnADFTutorialDataFactory. Försök att skapa datafabriken igen. Se artikeln Data Factory – namnregler för namnregler för Data Factory-artefakter.
    • Prenumeration: Välj den Azure-prenumeration där du vill skapa datafabriken.
    • Resursgrupp: Välj en befintlig resursgrupp i listrutan eller välj alternativet Skapa ny och ange namnet på en resursgrupp. Mer information om resursgrupper finns i Använda resursgrupper till att hantera Azure-resurser.
    • Version: Välj V2.
    • Plats: Välj platsen för datafabriken. Endast platser som stöds visas i listrutan. Datalager som används av datafabriken kan finnas på andra platser och i andra regioner. Dessa datalager omfattar Azure Data Lake Store, Azure Storage, Azure SQL Database och så vidare.
  3. Välj Skapa.

  4. När datafabriken har skapats går du till datafabriken. Du ser Data Factory på startsidan enligt följande bild:

    Startsidan för Azure Data Factory med panelen Öppna Azure Data Factory Studio.

    Välj Öppna på panelen Öppna Azure Data Factory Studio för att starta dataintegreringsprogrammet på en separat flik.

Läsa in data till Azure Synapse Analytics

  1. På startsidan för Azure Data Factory eller Azure Synapse väljer du panelen Mata in för att starta Kopiera data verktyget. Välj sedan den inbyggda kopieringsuppgiften.

  2. På sidan Egenskaper väljer du Inbyggd kopieringsaktivitet under Uppgiftstyp och väljer sedan Nästa.

    Sidan Egenskaper

  3. På sidan Källdatalager utför du följande steg:

    Tips

    I den här självstudien använder du SQL autentisering som autentiseringstyp för källdatalagret, men du kan välja andra autentiseringsmetoder som stöds:tjänstens huvudnamn och hanterad identitet om det behövs. Mer information finns i motsvarande avsnitt i den här artikeln. Om du vill lagra hemligheter för datalager på ett säkert sätt rekommenderar vi också att du använder Azure Key Vault. Detaljerade bilder finns i den här artikeln.

    1. Välj + Ny anslutning.

    2. Välj Azure SQL Database från galleriet och välj Fortsätt. Du kan skriva "SQL" i sökrutan för att filtrera anslutningsapparna.

      Välj Azure SQL DB

    3. På sidan Ny anslutning (Azure SQL Database) väljer du servernamnet och databasnamnet i listrutan och anger användarnamn och lösenord. Välj Testa anslutning för att verifiera inställningarna och välj sedan Skapa.

      Konfigurera Azure SQL DB

    4. På sidan Källdatalager väljer du den nyligen skapade anslutningen som källa i avsnittet Anslutning.

    5. I avsnittet Källtabeller anger du SalesLT för att filtrera tabellerna. Välj rutan (Markera alla) om du vill använda alla tabeller för kopian och välj sedan Nästa.

    Skärmbild som visar konfigurationen av sidan "Källdatalager".

  4. På sidan Tillämpa filter anger du dina inställningar eller väljer Nästa. Du kan förhandsgranska data och visa schemat för indata genom att välja knappen Förhandsgranska data på den här sidan.

     Skärmbild som visar sidan Använd filter.

  5. På sidan Måldatalager utför du följande steg:

    Tips

    I den här självstudien använder du SQL autentisering som autentiseringstyp för måldatalagret, men du kan välja andra autentiseringsmetoder som stöds:tjänstens huvudnamn och hanterad identitet om det behövs. Mer information finns i motsvarande avsnitt i den här artikeln. Om du vill lagra hemligheter för datalager på ett säkert sätt rekommenderar vi också att du använder Azure Key Vault. Detaljerade bilder finns i den här artikeln.

    1. Välj + Ny anslutning för att lägga till en anslutning.

    2. Välj Azure Synapse Analytics från galleriet och välj Fortsätt.

      Välj Azure Synapse Analytics

    3. På sidan Ny anslutning (Azure Synapse Analytics) väljer du servernamnet och databasnamnet i listrutan och anger användarnamn och lösenord. Välj Testa anslutning för att verifiera inställningarna och välj sedan Skapa.

      Konfigurera Azure Synapse Analytics

    4. På sidan Måldatalager väljer du den nyligen skapade anslutningen som mottagare i avsnittet Anslutning.

  6. I avsnittet Tabellmappning granskar du innehållet och väljer Nästa. En intelligent tabellmappning visas. Källtabellerna mappas till måltabellerna baserat på tabellnamnen. Om det inte finns någon källtabell i målet skapar tjänsten en måltabell med samma namn som standard. Du kan också mappa en källtabell till en befintlig måltabell.

    Skärmbild som visar konfigurationen av sidan Måldatalager.

  7. På sidan Kolumnmappning granskar du innehållet och väljer Nästa. Den intelligenta tabellmappningen baseras på kolumnnamnet. Om du låter tjänsten automatiskt skapa tabellerna kan datatypkonverteringen ske när det finns inkompatibiliteter mellan käll- och målarkiven. Om det finns en datatypskonvertering som inte stöds mellan käll- och målkolumnen visas ett felmeddelande bredvid motsvarande tabell.

    Sidan kolumnmappning

  8. Inställningar utför du följande steg:

    1. Ange CopyFromSQLToSQLDW för fältet Uppgiftsnamn.

    2. I avsnittet Mellanlagringsinställningar väljer du + Ny för att skapa en mellanlagring. Lagringen används för mellanlagring av data innan de läses in i Azure Synapse Analytics med hjälp av PolyBase. När kopieringen är klar rensas interimdata i Azure Blob Storage rensas automatiskt.

    3. På sidan Ny länkad tjänst väljer du ditt lagringskonto och sedan Skapa för att distribuera den länkade tjänsten.

    4. Avmarkera alternativet Använd standardtyp och välj sedan Nästa.

    Konfigurera PolyBase

  9. Granska inställningarna på sidan Sammanfattning och välj Nästa.

  10. Välj Övervaka på sidan Distribution för att övervaka pipelinen (aktiviteten).

     Skärmbild som visar distributionssidan.

  11. Observera att fliken Övervaka till vänster väljs automatiskt. När pipelinekörningen har slutförts väljer du länken CopyFromSQLToSQLDW under kolumnen Pipelinenamn för att visa information om aktivitetskörningen eller köra pipelinen igen.


  1. Om du vill växla tillbaka till vyn med pipelinekörningar väljer du länken Alla pipelinekörningar högst upp. Om du vill uppdatera listan väljer du Refresh (Uppdatera).

    Övervaka aktivitetskörningar

  2. Om du vill övervaka körningsinformationen för varje kopieringsaktivitet väljer du länken Information (glasögonikonen) under Aktivitetsnamn i vyn för aktivitetskörningar. Du kan övervaka information som mängden data som kopieras från källan till mottagaren, dataflöde, körningssteg med motsvarande varaktighet och använda konfigurationer.

    Övervaka aktivitetskörningsinformation först

    Övervaka aktivitetskörningsinformation sekund

Nästa steg

Gå vidare till följande artikel om du vill veta Azure Synapse Analytics support: