Přesun dat do nebo ze služby Azure Blob Storage pomocí konektorů SSIS
Sada Funkcí Azure pro integrační služby (SSIS) poskytuje komponenty pro připojení k Azure, přenos dat mezi Azure a místními zdroji dat a zpracování dat uložených v Azure.
Tato nabídka odkazuje na technologie, které můžete použít k přesunu dat do a ze služby Azure Blob Storage:
Jakmile zákazníci přesunou místní data do cloudu, budou mít přístup ke svým datům z jakékoli služby Azure, aby využili plného výkonu sady technologií Azure. Data se můžou následně použít například v Azure Machine Učení nebo v clusteru HDInsight.
Příklady použití těchto prostředků Azure jsou v názorných průvodcích SQL a HDInsight .
Diskuzi o kanonických scénářích, které používají SSIS k dosažení obchodních potřeb běžných ve scénářích integrace hybridních dat, najdete v tématu Další informace o balíčku funkcí SQL Server Integration Services pro Azure .
Poznámka:
Úplný úvod do služby Azure Blob Storage najdete v základech služby Azure Blob a v rozhraní REST API služby Azure Blob Service.
Požadavky
Abyste mohli provádět úlohy popsané v tomto článku, musíte mít nastavené předplatné Azure a účet Azure Storage. K nahrání nebo stažení dat potřebujete název účtu a klíč účtu Azure Storage.
- Pokud chcete nastavit předplatné Azure, podívejte se na bezplatnou měsíční zkušební verzi.
- Pokyny k vytvoření účtu úložiště a získání informací o účtu a klíči najdete v tématu O účtech Azure Storage.
Pokud chcete používat konektory SSIS, musíte stáhnout:
- SQL Server 2014 nebo 2016 Standard (nebo vyšší): Instalace zahrnuje službu SQL Server Integration Services.
- Microsoft SQL Server 2014 nebo 2016 Integration Services Feature Pack pro Azure: Tyto konektory je možné stáhnout z SQL Serveru 2014 Integration Services a SQL Server 2016 Integration Services.
Poznámka:
SSIS se instaluje s SQL Serverem, ale není součástí verze Express. Informace o tom, které aplikace jsou součástí různých edicí SQL Serveru, najdete v technické dokumentaci k SQL Serveru.
Informace o instalaci služby SSIS najdete v tématu Instalace integračních služeb (SSIS)
Informace o tom, jak začít používat SISS k vytváření jednoduchých balíčků extrakce, transformace a načítání (ETL), najdete v kurzu služby SSIS: Vytvoření jednoduchého balíčku ETL.
Stáhnout datovou sadu taxislužby NYC
V tomto příkladu se používá veřejně dostupná datová sada, která je k dispozici v otevřených datových sadách Azure a v datech záznamu cesty TLC. Datová sada se skládá z přibližně 173 milionů jízd taxíkem v NYC v roce 2013. Existují dva typy dat: data podrobností o jízdě a data jízdného.
Nahrání dat do služby Blob Storage
K přesunu dat pomocí balíčku funkcí SSIS z místního prostředí do blob Storage používáme instanci úlohy Nahrání objektů blob v Azure, jak je znázorněno tady:
Následující tabulka popisuje parametry, které úloha používá.
Pole | Popis |
---|---|
AzureStorage Připojení ion | Určuje existujícího správce služby Azure Storage Připojení ion nebo vytvoří nový účet, který odkazuje na účet služby Azure Storage, který odkazuje na umístění hostovaných souborů objektů blob. |
BlobContainer | Určuje název kontejneru objektů blob, který obsahuje nahrané soubory jako objekty blob. |
BlobDirectory | Určuje adresář objektů blob, ve kterém je nahraný soubor uložený jako objekt blob bloku. Adresář objektů blob je virtuální hierarchická struktura. Pokud objekt blob již existuje, nahradí se. |
LocalDirectory | Určuje místní adresář, který obsahuje soubory, které se mají nahrát. |
Název_souboru | Určuje filtr názvů pro výběr souborů se zadaným vzorem názvů. Například MySheet*.xls* obsahuje soubory, jako jsou MySheet001.xls a MySheetABC.xlsx |
TimeRangeFrom/TimeRangeTo | Určuje filtr časového rozsahu. Soubory změněné po timeRangeFrom a před TimeRangeTo jsou zahrnuty. |
Poznámka:
Přihlašovací údaje AzureStorage Připojení ion musí být správné a objekt BlobContainer musí existovat před pokusem o přenos.
Stažení dat ze služby Blob Storage
Pokud chcete stáhnout data ze služby Blob Storage do místního úložiště pomocí služby SSIS, použijte instanci úlohy stažení objektů blob v Azure.
Pokročilejší scénáře SSIS v Azure
Balíček funkcí SSIS umožňuje složitější toky zpracovávat pomocí úloh balení dohromady. Například data objektů blob se můžou nacházet přímo do clusteru HDInsight, jehož výstup by se dal stáhnout zpět do objektu blob a pak do místního úložiště. SSIS může spouštět úlohy Hive a Pig v clusteru HDInsight pomocí dalších konektorů SSIS:
- Pokud chcete spustit skript Hive v clusteru Azure HDInsight se službou SSIS, použijte úlohu Azure HDInsight Hive.
- Pokud chcete spustit skript Pig v clusteru Azure HDInsight se službou SSIS, použijte úlohu Pig služby Azure HDInsight.
Přispěvatelé
Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.
Hlavní autor:
- Mark Tabladillo | Vedoucí architekt cloudových řešení
Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.
Další kroky
- Seznámení se službou Azure Blob Storage
- Kopírování a přesouvání objektů blob z jednoho kontejneru nebo účtu úložiště do jiného
- Spouštění existujících balíčků SSIS ve službě Azure Data Factory nebo kanálu Azure Synapse
Související prostředky
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro