Načtení dat do služby Azure synapse Analytics pomocí Azure Data Factory nebo kanálu synapse

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Azure synapse Analytics je cloudová, škálovatelná databáze, která dokáže zpracovávat obrovské objemy dat, a to jak v relačních, tak i v nerelačních sítích. Azure synapse Analytics je postavená na architektuře MPP (Theed Parallel Processing), která je optimalizovaná pro úlohy podnikového datového skladu. Nabízí cloudovou flexibilitu, díky které můžete nezávisle škálovat úložiště a výpočetní výkon.

Začínáme s Azure synapse Analytics je teď jednodušší než kdy dřív. Azure Data Factory a jeho ekvivalentní funkce kanálů v rámci Azure synapse sám poskytují plně spravovanou cloudovou službu pro integraci dat. Službu můžete použít k naplnění analýzy Azure synapse daty ze stávajícího systému a ušetřit čas při vytváření analytických řešení.

Kanály Azure Data Factory a synapse nabízejí následující výhody pro načítání dat do Azure synapse Analytics:

  • Snadné nastavení: intuitivní průvodce 5 kroky bez nutnosti skriptování.
  • Bohatá Podpora úložiště dat: Integrovaná podpora pro bohatou sadu místních a cloudových úložišť dat. Podrobný seznam najdete v tabulce podporovaných úložišť dat.
  • Zabezpečení a dodržování předpisů: data se přenáší přes protokol HTTPS nebo ExpressRoute. Přítomnost globální služby zajišťuje, že vaše data nikdy neopustí zeměpisnou hranici.
  • Neparalelní výkon pomocí základu: základem je nejúčinnější způsob, jak přesouvat data do Azure synapse Analytics. Pomocí funkce pracovního objektu blob můžete dosáhnout vysoké rychlosti zatížení ze všech typů úložišť dat, včetně služby Azure Blob Storage a Data Lake Store. (Základem podporuje službu Azure Blob Storage a Azure Data Lake Store ve výchozím nastavení.) Podrobnosti najdete v tématu o výkonu aktivity kopírování.

v tomto článku se dozvíte, jak pomocí nástroje Kopírování dat načíst Data z Azure SQL Database do Azure Synapse Analytics. Můžete postupovat podle podobných kroků a kopírovat data z jiných typů úložišť dat.

Poznámka

Další informace najdete v tématu kopírování dat do nebo ze služby Azure synapse Analytics.

Požadavky

  • Předplatné Azure: Pokud ještě nemáte předplatné Azure, vytvořte si bezplatný účet před tím, než začnete.
  • Azure Synapse Analytics: datový sklad obsahuje data, která se kopírují z databáze SQL. Pokud nemáte Azure synapse Analytics, přečtěte si pokyny v tématu Vytvoření služby Azure synapse Analytics.
  • Azure SQL Database: v tomto kurzu se zkopírují data z ukázkové datové sady adventure Works LT v Azure SQL Database. tuto ukázkovou databázi můžete v SQL Database vytvořit podle pokynů v části vytvoření ukázkové databáze v Azure SQL Database.
  • účet úložiště Azure: Azure Storage se používá jako pracovní objekt blob v operaci hromadného kopírování. Pokud účet úložiště Azure nemáte, přečtěte si pokyny v tématu Vytvoření účtu úložiště.

Vytvoření datové továrny

Poznámka

Vytvoření nové datové továrny můžete přeskočit, pokud chcete použít funkci kanálů v rámci stávajícího pracovního prostoru Synapse k načtení dat. Azure synapse vloží funkce Azure Data Factory v rámci své funkce kanálů.

  1. V nabídce vlevo vyberte vytvořit prostředek > data a analýzy > Data Factory:

  2. Na stránce Nová datová továrna zadejte hodnoty pro následující položky:

    • Název: jako název zadejte LoadSQLDWDemo . Název vaší datové továrny musí být * globálně jedinečný. Pokud se zobrazí chyba "název objektu pro vytváření dat" LoadSQLDWDemo "není k dispozici", zadejte jiný název pro objekt pro vytváření dat. Můžete například použít název YourADFTutorialDataFactory. Zkuste vytvořit datovou továrnu znovu. Pravidla pojmenování artefaktů služby Data Factory najdete v tématu Data Factory – pravidla pojmenování.
    • Předplatné: vyberte předplatné Azure, ve kterém chcete vytvořit datovou továrnu.
    • Skupina prostředků: v rozevíracím seznamu vyberte existující skupinu prostředků nebo vyberte možnost vytvořit novou a zadejte název skupiny prostředků. Informace o skupinách prostředků najdete v článku Použití skupin prostředků ke správě prostředků Azure.
    • Verze: Vyberte V2.
    • Umístění: vyberte umístění pro datovou továrnu. V rozevíracím seznamu se zobrazí pouze podporovaná umístění. Úložiště dat, která služba Data Factory používá, můžou být v jiných umístěních a oblastech. mezi tato úložiště dat patří Azure Data Lake Store, Azure Storage, Azure SQL Database a tak dále.
  3. Vyberte Vytvořit.

  4. Až se vytváření dokončí, přejdete do vaší datové továrny. Zobrazí se Domovská stránka Data Factory , jak je znázorněno na následujícím obrázku:

    Domovská stránka Azure Data Factory s dlaždicí otevřít Azure Data Factory Studio.

    Vyberte otevřít na dlaždici otevřít Azure Data Factory Studio a spusťte aplikaci pro integraci dat na samostatné kartě.

Načtení dat do služby Azure Synapse Analytics

  1. Na domovské stránce Azure Data Factory nebo v pracovním prostoru synapse Azure Vyberte dlaždici ingestovat a spusťte nástroj kopírování dat. Pak vyberte předdefinovaný úkol kopírování.

  2. Na stránce vlastnosti zvolte v části typ úkolu předdefinovaná úloha kopírování a pak vyberte Další.

    Stránka Vlastnosti

  3. Na stránce zdrojové úložiště dat proveďte následující kroky:

    Tip

    v tomto kurzu použijete SQL ověřování jako typ ověřování pro zdrojové úložiště dat, ale v případě potřeby můžete vybrat jiné podporované metody ověřování:instanční objekt a spravovaná identita . Podrobnosti najdete v odpovídajících částech tohoto článku . K bezpečnému ukládání tajných kódů pro úložiště dat je také vhodné použít Azure Key Vault. Podrobnější ilustrace najdete v tomto článku .

    1. Vyberte + nové připojení.

    2. v galerii vyberte Azure SQL Database a pak vyberte pokračovat. můžete zadat text "SQL" do vyhledávacího pole, chcete-li filtrovat konektory.

      Výběr Azure SQL DB

    3. na stránce nové připojení (Azure SQL Database) vyberte název serveru a název databáze z rozevíracího seznamu a zadejte uživatelské jméno a heslo. Vyberte Test připojení , abyste ověřili nastavení, a pak vyberte vytvořit.

      Konfigurace Azure SQL DB

    4. Na stránce zdrojové úložiště dat vyberte nově vytvořené připojení jako zdroj v části připojení .

    5. V části zdrojové tabulky zadejte tabulky SalesLT a vyfiltrujte tabulky. Zvolte pole (Vybrat vše) , chcete-li použít všechny tabulky pro kopii, a poté vyberte možnost Další.

    Snímek obrazovky s konfigurací stránky zdrojové úložiště dat

  4. Na stránce použít filtr určete nastavení nebo vyberte Další. Kliknutím na tlačítko Náhled dat na této stránce můžete zobrazit náhled dat a zobrazit schéma vstupních dat.

     Snímek obrazovky zobrazující stránku použít filtr

  5. Na stránce cílové úložiště dat proveďte následující kroky:

    Tip

    v tomto kurzu použijete SQL ověřování jako typ ověřování pro cílové úložiště dat, ale v případě potřeby můžete vybrat jiné podporované metody ověřování:instanční objekt a spravovaná identita . Podrobnosti najdete v odpovídajících částech tohoto článku . K bezpečnému ukládání tajných kódů pro úložiště dat je také vhodné použít Azure Key Vault. Podrobnější ilustrace najdete v tomto článku .

    1. Vyberte + nové připojení a přidejte připojení.

    2. Z Galerie vyberte Azure synapse Analytics a vyberte pokračovat.

      Výběr služby Azure synapse Analytics

    3. Na stránce nové připojení (Azure synapse Analytics) v rozevíracím seznamu vyberte název vašeho serveru a databázi a zadejte uživatelské jméno a heslo. Vyberte Test připojení , abyste ověřili nastavení, a pak vyberte vytvořit.

      Konfigurace Azure synapse Analytics

    4. Na stránce cílové úložiště dat vyberte nově vytvořené připojení jako jímku v části připojení .

  6. V části mapování tabulky zkontrolujte obsah a vyberte Další. Zobrazí se mapování inteligentní tabulky. Zdrojové tabulky jsou namapovány na cílové tabulky založené na názvech tabulek. Pokud zdrojová tabulka v cíli neexistuje, služba vytvoří ve výchozím nastavení cílovou tabulku se stejným názvem. Zdrojovou tabulku můžete také namapovat na existující cílovou tabulku.

    Snímek obrazovky s konfigurací stránky cílové úložiště dat

  7. Na stránce mapování sloupců zkontrolujte obsah a vyberte Další. Mapování inteligentní tabulky je založené na názvu sloupce. Pokud necháte službu automaticky vytvářet tabulky, převod datového typu může nastat, pokud dojde k nekompatibilitě mezi zdrojovým a cílovým úložištěm. Pokud je mezi zdrojovým a cílovým sloupcem převod nepodporovaného datového typu, zobrazí se vedle odpovídající tabulky chybová zpráva.

    Stránka mapování sloupců

  8. na stránce Nastavení proveďte následující kroky:

    1. Pro pole název úlohy zadejte CopyFromSQLToSQLDW .

    2. V části pracovní nastavení vyberte + Nová a nové pracovní úložiště. Úložiště se používá pro přípravu dat před jejich načtením do Azure synapse Analytics pomocí základu. po dokončení kopírování se dočasná data v Azure Blob Storage automaticky vyčistí.

    3. Na stránce Nová propojená služba vyberte svůj účet úložiště a vyberte vytvořit a nasaďte propojenou službu.

    4. Zrušte výběr možnosti použít výchozí typ a pak vyberte Další.

    Konfigurovat základ

  9. Na stránce Souhrn zkontrolujte nastavení a klikněte na tlačítko Další.

  10. Na stránce Nasazení vyberte Monitorovat a začněte monitorovat kanál (úlohu).

     Snímek obrazovky zobrazující stránku nasazení

  11. Všimněte si, že je vlevo automaticky vybraná karta Monitorování. Po úspěšném dokončení kanálu vyberte odkaz CopyFromSQLToSQLDW pod sloupcem název kanálu , abyste zobrazili podrobnosti o spuštění aktivit nebo znovu spustíte kanál.


  1. Pokud chcete přejít zpátky k zobrazení spuštění kanálu, vyberte odkaz všechny spuštění kanálu v horní části. Seznam můžete aktualizovat kliknutím na Aktualizovat.

    Monitorování spuštění aktivit

  2. Chcete-li monitorovat podrobnosti o spuštění každé aktivity kopírování, vyberte odkaz Podrobnosti (ikona brýlí) v části název aktivity v zobrazení spuštění aktivit. Můžete monitorovat podrobnosti, jako je objem dat zkopírovaných ze zdroje, do jímky, propustnosti dat, kroky provádění s odpovídající dobou trvání a používané konfigurace.

    Nejprve monitorovat podrobnosti o spuštění aktivit

    Podrobnosti o spuštění aktivity monitorování – sekunda

Další kroky

V následujícím článku se dozvíte o podpoře Azure synapse Analytics: