SSIS コネクタを使用して Azure Blob Storage 間でデータを移動する

[アーティクル]
03/05/2024

Azure Feature Pack for Integration Services (SSIS) には、Azure への接続、Azure とオンプレミスのデータソースとの間でのデータ転送、Azure に格納したデータの処理に必要なコンポーネントが用意されています。

このメニューは、Azure Blob Storage との間でデータを移動する際に使用できるテクノロジへのリンクとなっています。

オンプレミスデータをクラウドに移行すると、任意のAzureサービスからデータにアクセスして、Azureテクノロジスイートの機能を最大限に活用できます。データは、その後、Azure Machine LearningやHDInsightクラスターなどで使用できます。

これらの Azure リソースを使用する例については、SQL と HDInsight のチュートリアルを参照してください。

ハイブリッドデータ統合のシナリオに共通するビジネスニーズを満たすために SSIS を使用する標準的なシナリオの詳細については、 SQL Server Integration Services Feature Pack for Azure をさらに活用する方法に関するブログを参照してください。

注意

Azure Blob Storageの詳細については、Azure Blobの基本とAzure Blob Service REST APIに関するページを参照してください。

前提条件

この記事で説明するタスクを実行するには、Azure サブスクリプションと Azure Storage アカウントの設定が必要です。データをアップロードまたはダウンロードするために、Azure Storage アカウント名とアカウントキーを確認しておく必要があります。

Azure サブスクリプションを設定するには、 1 か月間の無料試用版に関するページをご覧ください。
ストレージアカウントの作成と、アカウントとキー情報の取得についての手順については、Azure Storage アカウントについての記事を参照してください。

SSIS コネクタを使用するには、次のものをダウンロードする必要があります。

SQL Server 2014 または 2016 Standard 以降: インストールには SQL Server Integration Services が含まれます。
Microsoft SQL Server 2014または2016 Integration Services Feature Pack for Azure: これらのコネクタは、それぞれSQL Server 2014 Integration ServicesおよびSQL Server 2016 Integration Servicesからダウンロードできます。

Note

SSIS は SQL Server と共にインストールされますが、Express バージョンには含まれていません。 SQL Serverのさまざまなエディションに含まれるアプリケーションの詳細については、SQL Serverの技術ドキュメントを参照してください。

SSIS をインストールする場合は、「Integration Services (SSIS) のインストール」を参照してください。

SISSを使用して簡単な抽出、変換、読み込み (ETL) パッケージを構築する方法については、SSISチュートリアルを参照してください。簡単なETLパッケージの作成。

NYC タクシーデータセットをダウンロードする

ここで説明する例では、AzureオープンデータセットとTLC旅行レコードデータで利用可能な、一般公開されているデータセットを使用します。このデータセットは、2013 年のニューヨーク市における約 1 億 7300 万件のタクシー乗車情報で構成されています。データには、乗車の詳細データと料金データの 2 種類があります。

Blob Storage にデータをアップロードする

SSIS Feature Packを使用してオンプレミスからBLOBストレージにデータを移動するには、次に示すAzure BLOBアップロードタスクのインスタンスを使用します。

Screenshot that shows Azure Blob Upload Task button.

次の表では、タスクで使用されるパラメーターについて説明します。

フィールド	説明
[AzureStorageConnection]	既存の Azure Storage 接続マネージャーを指定するか、BLOB ファイルがホストされる場所を指す Azure Storage アカウントを参照する、新しい Azure Storage 接続マネージャーを作成します。
BlobContainer	アップロードしたファイルを BLOB として保持する BLOB コンテナーの名前を指定します。
BlobDirectory	アップロードしたファイルがブロック BLOB として格納される BLOB ディレクトリを指定します。 BLOB ディレクトリは仮想階層構造です。 BLOB が既に存在する場合は置き換えられます。
LocalDirectory	アップロードするファイルが含まれているローカルディレクトリを指定します。
FileName	指定された名前のパターンを使用したファイルを選択するための名前フィルターを指定します。たとえば、MySheet.xls には、MySheet001.xls や MySheetABC.xlsx などのファイルが含まれます。
TimeRangeFrom/TimeRangeTo	時間範囲フィルターを指定します。 TimeRangeFrom から TimeRangeTo までの間に変更されたファイルが含まれます。

注意

転送を試す前に、AzureStorageConnection の資格情報が正しく、BlobContainer が存在することを確認する必要があります。

Blob Storageからデータをダウンロードします

SSISを使用してBlob Storageからオンプレミスストレージにデータをダウンロードするには、Azure BLOBダウンロードタスクのインスタンスを使用します。

より高度なSSIS Azureシナリオ

SSIS 機能パックでは、複数のタスクを 1 つにパッケージ化することで、さらに複雑なフローを処理できます。たとえば、BLOB データを HDInsight クラスターに直接フィードし、HDInsight クラスターの出力を BLOB にダウンロードしてから、さらにオンプレミスストレージにダウンロードすることができます。 SSIS は、追加の SSIS コネクタを使用することで、HDInsight クラスター上で Hive ジョブおよび Pig ジョブを実行できます。

SSIS を使用して Azure HDInsight クラスター上で Hive スクリプトを実行するには、 Azure HDInsight Hive タスクを使用します。
SSIS を使用して Azure HDInsight クラスター上で Pig スクリプトを実行するには、 Azure HDInsight Pig タスクを使用します。

共同作成者

この記事は、Microsoft によって保守されています。当初の寄稿者は以下のとおりです。

プリンシパル作成者:

Mark Tabladillo | シニアクラウドソリューションアーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

SSIS コネクタを使用して Azure Blob Storage 間でデータを移動する

前提条件

NYC タクシーデータセットをダウンロードする

Blob Storage にデータをアップロードする

Blob Storageからデータをダウンロードします

より高度なSSIS Azureシナリオ

共同作成者

次のステップ

フィードバック

フィードバック

その他のリソース

SSIS コネクタを使用して Azure Blob Storage 間でデータを移動する

前提条件

NYC タクシー データセットをダウンロードする

Blob Storage にデータをアップロードする

Blob Storageからデータをダウンロードします

より高度なSSIS Azureシナリオ

共同作成者

次のステップ

関連リソース

フィードバック

フィードバック

その他のリソース

NYC タクシーデータセットをダウンロードする