SSIS コネクタを使用して Azure Blob Storage 間でデータを移動する
Azure Feature Pack for Integration Services (SSIS) には、Azure への接続、Azure とオンプレミスのデータ ソースとの間でのデータ転送、Azure に格納したデータの処理に必要なコンポーネントが用意されています。
このメニューは、Azure Blob Storage との間でデータを移動する際に使用できるテクノロジへのリンクとなっています。
オンプレミスデータをクラウドに移行すると、任意のAzureサービスからデータにアクセスして、Azureテクノロジスイートの機能を最大限に活用できます。 データは、その後、Azure Machine LearningやHDInsightクラスターなどで使用できます。
これらの Azure リソースを使用する例については、SQL と HDInsight のチュートリアルを参照してください。
ハイブリッド データ統合のシナリオに共通するビジネス ニーズを満たすために SSIS を使用する標準的なシナリオの詳細については、 SQL Server Integration Services Feature Pack for Azure をさらに活用する方法 に関するブログを参照してください。
注意
Azure Blob Storageの詳細については、Azure Blobの基本とAzure Blob Service REST APIに関するページを参照してください。
前提条件
この記事で説明するタスクを実行するには、Azure サブスクリプションと Azure Storage アカウントの設定が必要です。 データをアップロードまたはダウンロードするために、Azure Storage アカウント名とアカウント キーを確認しておく必要があります。
- Azure サブスクリプションを設定するには、 1 か月間の無料試用版に関するページをご覧ください。
- ストレージ アカウントの作成と、アカウントとキー情報の取得についての手順については、Azure Storage アカウントについての記事を参照してください。
SSIS コネクタを使用するには、次のものをダウンロードする必要があります。
- SQL Server 2014 または 2016 Standard 以降: インストールには SQL Server Integration Services が含まれます。
- Microsoft SQL Server 2014または2016 Integration Services Feature Pack for Azure: これらのコネクタは、それぞれSQL Server 2014 Integration ServicesおよびSQL Server 2016 Integration Servicesからダウンロードできます。
Note
SSIS は SQL Server と共にインストールされますが、Express バージョンには含まれていません。 SQL Serverのさまざまなエディションに含まれるアプリケーションの詳細については、SQL Serverの技術ドキュメントを参照してください。
SSIS をインストールする場合は、「Integration Services (SSIS) のインストール」を参照してください。
SISSを使用して簡単な抽出、変換、読み込み (ETL) パッケージを構築する方法については、SSISチュートリアルを参照してください。簡単なETLパッケージの作成。
NYC タクシー データセットをダウンロードする
ここで説明する例では、AzureオープンデータセットとTLC旅行レコードデータで利用可能な、一般公開されているデータセットを使用します。 このデータセットは、2013 年のニューヨーク市における約 1 億 7300 万件のタクシー乗車情報で構成されています。 データには、乗車の詳細データと料金データの 2 種類があります。
Blob Storage にデータをアップロードする
SSIS Feature Packを使用してオンプレミスからBLOBストレージにデータを移動するには、次に示すAzure BLOBアップロードタスクのインスタンスを使用します。
次の表では、タスクで使用されるパラメーターについて説明します。
フィールド | 説明 |
---|---|
[AzureStorageConnection] | 既存の Azure Storage 接続マネージャーを指定するか、BLOB ファイルがホストされる場所を指す Azure Storage アカウントを参照する、新しい Azure Storage 接続マネージャーを作成します。 |
BlobContainer | アップロードしたファイルを BLOB として保持する BLOB コンテナーの名前を指定します。 |
BlobDirectory | アップロードしたファイルがブロック BLOB として格納される BLOB ディレクトリを指定します。 BLOB ディレクトリは仮想階層構造です。 BLOB が既に存在する場合は置き換えられます。 |
LocalDirectory | アップロードするファイルが含まれているローカル ディレクトリを指定します。 |
FileName | 指定された名前のパターンを使用したファイルを選択するための名前フィルターを指定します。 たとえば、MySheet*.xls* には、MySheet001.xls や MySheetABC.xlsx などのファイルが含まれます。 |
TimeRangeFrom/TimeRangeTo | 時間範囲フィルターを指定します。 TimeRangeFrom から TimeRangeTo までの間に変更されたファイルが含まれます。 |
注意
転送を試す前に、AzureStorageConnection の資格情報が正しく、BlobContainer が存在することを確認する必要があります。
Blob Storageからデータをダウンロードします
SSISを使用してBlob Storageからオンプレミスストレージにデータをダウンロードするには、Azure BLOBダウンロードタスクのインスタンスを使用します。
より高度なSSIS Azureシナリオ
SSIS 機能パックでは、複数のタスクを 1 つにパッケージ化することで、さらに複雑なフローを処理できます。 たとえば、BLOB データを HDInsight クラスターに直接フィードし、HDInsight クラスターの出力を BLOB にダウンロードしてから、さらにオンプレミス ストレージにダウンロードすることができます。 SSIS は、追加の SSIS コネクタを使用することで、HDInsight クラスター上で Hive ジョブおよび Pig ジョブを実行できます。
- SSIS を使用して Azure HDInsight クラスター上で Hive スクリプトを実行するには、 Azure HDInsight Hive タスクを使用します。
- SSIS を使用して Azure HDInsight クラスター上で Pig スクリプトを実行するには、 Azure HDInsight Pig タスクを使用します。
共同作成者
この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。
プリンシパル作成者:
- Mark Tabladillo | シニア クラウド ソリューション アーキテクト
パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。
次のステップ
- Azure Blob Storage の概要
- コンテナー間またはストレージ アカウント間で BLOB をコピーまたは移動する
- Azure Data Factory または Azure Synapse Pipeline で既存の SSIS パッケージを実行する
関連リソース
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示