SSIS コネクタを使用して Azure Blob Storage 間でデータを移動する

Azure Feature Pack for Integration Services (SSIS) には、Azure への接続、Azure とオンプレミスのデータ ソースとの間でのデータ転送、Azure に格納したデータの処理に必要なコンポーネントが用意されています。

このメニューは、Azure Blob Storage との間でデータを移動する際に使用できるテクノロジへのリンクとなっています。

オンプレミスデータをクラウドに移行すると、任意のAzureサービスからデータにアクセスして、Azureテクノロジスイートの機能を最大限に活用できます。 データは、その後、Azure Machine LearningやHDInsightクラスターなどで使用できます。

これらの Azure リソースを使用する例については、SQLHDInsight のチュートリアルを参照してください。

ハイブリッド データ統合のシナリオに共通するビジネス ニーズを満たすために SSIS を使用する標準的なシナリオの詳細については、 SQL Server Integration Services Feature Pack for Azure をさらに活用する方法 に関するブログを参照してください。

注意

Azure Blob Storageの詳細については、Azure Blobの基本Azure Blob Service REST APIに関するページを参照してください。

前提条件

この記事で説明するタスクを実行するには、Azure サブスクリプションと Azure Storage アカウントの設定が必要です。 データをアップロードまたはダウンロードするために、Azure Storage アカウント名とアカウント キーを確認しておく必要があります。

SSIS コネクタを使用するには、次のものをダウンロードする必要があります。

  • SQL Server 2014 または 2016 Standard 以降: インストールには SQL Server Integration Services が含まれます。
  • Microsoft SQL Server 2014または2016 Integration Services Feature Pack for Azure: これらのコネクタは、それぞれSQL Server 2014 Integration ServicesおよびSQL Server 2016 Integration Servicesからダウンロードできます。

Note

SSIS は SQL Server と共にインストールされますが、Express バージョンには含まれていません。 SQL Serverのさまざまなエディションに含まれるアプリケーションの詳細については、SQL Serverの技術ドキュメントを参照してください。

SSIS をインストールする場合は、「Integration Services (SSIS) のインストール」を参照してください。

SISSを使用して簡単な抽出、変換、読み込み (ETL) パッケージを構築する方法については、SSISチュートリアルを参照してください。簡単なETLパッケージの作成

NYC タクシー データセットをダウンロードする

ここで説明する例では、AzureオープンデータセットTLC旅行レコードデータで利用可能な、一般公開されているデータセットを使用します。 このデータセットは、2013 年のニューヨーク市における約 1 億 7300 万件のタクシー乗車情報で構成されています。 データには、乗車の詳細データと料金データの 2 種類があります。

Blob Storage にデータをアップロードする

SSIS Feature Packを使用してオンプレミスからBLOBストレージにデータを移動するには、次に示すAzure BLOBアップロードタスクのインスタンスを使用します。

Screenshot that shows Azure Blob Upload Task button.

次の表では、タスクで使用されるパラメーターについて説明します。

フィールド 説明
[AzureStorageConnection] 既存の Azure Storage 接続マネージャーを指定するか、BLOB ファイルがホストされる場所を指す Azure Storage アカウントを参照する、新しい Azure Storage 接続マネージャーを作成します。
BlobContainer アップロードしたファイルを BLOB として保持する BLOB コンテナーの名前を指定します。
BlobDirectory アップロードしたファイルがブロック BLOB として格納される BLOB ディレクトリを指定します。 BLOB ディレクトリは仮想階層構造です。 BLOB が既に存在する場合は置き換えられます。
LocalDirectory アップロードするファイルが含まれているローカル ディレクトリを指定します。
FileName 指定された名前のパターンを使用したファイルを選択するための名前フィルターを指定します。 たとえば、MySheet*.xls* には、MySheet001.xls や MySheetABC.xlsx などのファイルが含まれます。
TimeRangeFrom/TimeRangeTo 時間範囲フィルターを指定します。 TimeRangeFrom から TimeRangeTo までの間に変更されたファイルが含まれます。

注意

転送を試す前に、AzureStorageConnection の資格情報が正しく、BlobContainer が存在することを確認する必要があります。

Blob Storageからデータをダウンロードします

SSISを使用してBlob Storageからオンプレミスストレージにデータをダウンロードするには、Azure BLOBダウンロードタスクのインスタンスを使用します。

より高度なSSIS Azureシナリオ

SSIS 機能パックでは、複数のタスクを 1 つにパッケージ化することで、さらに複雑なフローを処理できます。 たとえば、BLOB データを HDInsight クラスターに直接フィードし、HDInsight クラスターの出力を BLOB にダウンロードしてから、さらにオンプレミス ストレージにダウンロードすることができます。 SSIS は、追加の SSIS コネクタを使用することで、HDInsight クラスター上で Hive ジョブおよび Pig ジョブを実行できます。

  • SSIS を使用して Azure HDInsight クラスター上で Hive スクリプトを実行するには、 Azure HDInsight Hive タスクを使用します。
  • SSIS を使用して Azure HDInsight クラスター上で Pig スクリプトを実行するには、 Azure HDInsight Pig タスクを使用します。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパル作成者:

  • Mark Tabladillo | シニア クラウド ソリューション アーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ