Přesun dat do nebo ze služby Azure Blob Storage pomocí konektorů SSIS

Sada Funkcí Azure pro integrační služby (SSIS) poskytuje komponenty pro připojení k Azure, přenos dat mezi Azure a místními zdroji dat a zpracování dat uložených v Azure.

Tato nabídka odkazuje na technologie, které můžete použít k přesunu dat do a ze služby Azure Blob Storage:

Jakmile zákazníci přesunou místní data do cloudu, budou mít přístup ke svým datům z jakékoli služby Azure, aby využili plného výkonu sady technologií Azure. Data se můžou následně použít například v Azure Machine Učení nebo v clusteru HDInsight.

Příklady použití těchto prostředků Azure jsou v názorných průvodcích SQL a HDInsight .

Diskuzi o kanonických scénářích, které používají SSIS k dosažení obchodních potřeb běžných ve scénářích integrace hybridních dat, najdete v tématu Další informace o balíčku funkcí SQL Server Integration Services pro Azure .

Poznámka:

Úplný úvod do služby Azure Blob Storage najdete v základech služby Azure Blob a v rozhraní REST API služby Azure Blob Service.

Požadavky

Abyste mohli provádět úlohy popsané v tomto článku, musíte mít nastavené předplatné Azure a účet Azure Storage. K nahrání nebo stažení dat potřebujete název účtu a klíč účtu Azure Storage.

Pokud chcete používat konektory SSIS, musíte stáhnout:

Poznámka:

SSIS se instaluje s SQL Serverem, ale není součástí verze Express. Informace o tom, které aplikace jsou součástí různých edicí SQL Serveru, najdete v technické dokumentaci k SQL Serveru.

Informace o instalaci služby SSIS najdete v tématu Instalace integračních služeb (SSIS)

Informace o tom, jak začít používat SISS k vytváření jednoduchých balíčků extrakce, transformace a načítání (ETL), najdete v kurzu služby SSIS: Vytvoření jednoduchého balíčku ETL.

Stáhnout datovou sadu taxislužby NYC

V tomto příkladu se používá veřejně dostupná datová sada, která je k dispozici v otevřených datových sadách Azure a v datech záznamu cesty TLC. Datová sada se skládá z přibližně 173 milionů jízd taxíkem v NYC v roce 2013. Existují dva typy dat: data podrobností o jízdě a data jízdného.

Nahrání dat do služby Blob Storage

K přesunu dat pomocí balíčku funkcí SSIS z místního prostředí do blob Storage používáme instanci úlohy Nahrání objektů blob v Azure, jak je znázorněno tady:

Screenshot that shows Azure Blob Upload Task button.

Následující tabulka popisuje parametry, které úloha používá.

Pole Popis
AzureStorage Připojení ion Určuje existujícího správce služby Azure Storage Připojení ion nebo vytvoří nový účet, který odkazuje na účet služby Azure Storage, který odkazuje na umístění hostovaných souborů objektů blob.
BlobContainer Určuje název kontejneru objektů blob, který obsahuje nahrané soubory jako objekty blob.
BlobDirectory Určuje adresář objektů blob, ve kterém je nahraný soubor uložený jako objekt blob bloku. Adresář objektů blob je virtuální hierarchická struktura. Pokud objekt blob již existuje, nahradí se.
LocalDirectory Určuje místní adresář, který obsahuje soubory, které se mají nahrát.
Název_souboru Určuje filtr názvů pro výběr souborů se zadaným vzorem názvů. Například MySheet*.xls* obsahuje soubory, jako jsou MySheet001.xls a MySheetABC.xlsx
TimeRangeFrom/TimeRangeTo Určuje filtr časového rozsahu. Soubory změněné po timeRangeFrom a před TimeRangeTo jsou zahrnuty.

Poznámka:

Přihlašovací údaje AzureStorage Připojení ion musí být správné a objekt BlobContainer musí existovat před pokusem o přenos.

Stažení dat ze služby Blob Storage

Pokud chcete stáhnout data ze služby Blob Storage do místního úložiště pomocí služby SSIS, použijte instanci úlohy stažení objektů blob v Azure.

Pokročilejší scénáře SSIS v Azure

Balíček funkcí SSIS umožňuje složitější toky zpracovávat pomocí úloh balení dohromady. Například data objektů blob se můžou nacházet přímo do clusteru HDInsight, jehož výstup by se dal stáhnout zpět do objektu blob a pak do místního úložiště. SSIS může spouštět úlohy Hive a Pig v clusteru HDInsight pomocí dalších konektorů SSIS:

  • Pokud chcete spustit skript Hive v clusteru Azure HDInsight se službou SSIS, použijte úlohu Azure HDInsight Hive.
  • Pokud chcete spustit skript Pig v clusteru Azure HDInsight se službou SSIS, použijte úlohu Pig služby Azure HDInsight.

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autor:

Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.

Další kroky