Azure Synapse Analytics タスク

適用対象:SQL Server Azure Data Factory の SSIS Integration Runtime

Azure Synapse Analytics タスクにより、SSIS パッケージはファイル システムまたは Azure Blob Storage から Azure Synapse Analytics 専用 SQL プールに表形式データをコピーできます。 「Azure Synapse Analytics Loading Patterns and Strategies」(Azure Synapse Analytics の読み込みパターンと戦略) で説明されているように、このタスクはパフォーマンス向上のために PolyBase を利用します。 現在サポートされているソース データ ファイル形式は、UTF8 エンコーディングの区切り記号付きテキストです。 ファイル システムからのコピーでは、データは最初にステージングのために Azure Blob Storage にアップロードされ、それから専用 SQL プールにアップロードされます。 そのため、Azure Blob Storage アカウントが必要です。

注意

サービスの種類が Data Lake Gen2 の Azure Storage 接続マネージャーはサポートされていません。

ステージングまたはソースに Azure Data Lake Gen2 を使う場合は、種類が Azure Blob Storage である Azure Storage 接続マネージャー経由で接続できます。

Azure Synapse Analytics タスクは、SQL Server Integration Services (SSIS) Feature Pack for Azure のコンポーネントです。

Azure Synapse Analytics タスクを追加するには、SSIS ツールボックスからデザイナー キャンバスにドラッグ アンド ドロップし、ダブルクリックまたは右クリックして [編集] をクリックし、タスク エディター ダイアログ ボックスを表示します。

[全般] ページで、次のプロパティを構成します。

[SourceType] では、ソース データ ストアの種類を指定します。 次のいずれかの種類を選択します。

  • [FileSystem]: ソース データはローカル ファイル システムに存在します。
  • [BlobStorage]: ソース データは Azure Blob Storage に存在します。

各ソースの種類のプロパティを次に示します。

FileSystem (ファイル システム)

フィールド 説明
LocalDirectory アップロードするデータ ファイルを含むローカル ディレクトリを指定します。
Recursively サブディレクトリを再帰的に検索するかどうかを指定します。
FileName 特定の名前のパターンを持つファイルを選択する名前フィルターを指定します。 MySheet*.xsl* の場合、MySheet001.xsl や MySheetABC.xslx などのファイルが含まれます。
[RowDelimiter] 各行の終わりに印を付ける文字を指定します。
[列区切り記号] 各列の終わりに印を付ける 1 つ以上の文字を指定します。 例: | (パイプ)、\t (タブ)、' (単一引用符)、" (二重引用符)、および 0x5c (バック スラッシュ)。
IsFirstRowHeader 各データ ファイルの最初の行に実際のデータの代わりに列名を含めるかどうかを指定します。
AzureStorageConnection Azure Storage 接続マネージャーを指定します。
BlobContainer ローカル データをアップロードし、PolyBase 経由で Azure Synapse Analytics 専用 SQL プールにリレーする BLOB コンテナーの名前を指定します。 コンテナーが存在しない場合、新規作成されます。
BlobDirectory ローカル データをアップロードし、PolyBase 経由で Azure Synapse Analytics 専用 SQL プールにリレーする BLOB ディレクトリ (仮想階層構造) を指定します。
RetainFiles Azure Storage にアップロードしたファイルを保持するかどうかを指定します。
CompressionType Azure Storage にファイルをアップロードするときに使用する圧縮形式を指定します。 ローカル ソースは影響を受けません。
CompressionLevel 圧縮形式に使用する圧縮レベルを指定します。
SqlPoolConnection Azure Synapse Analytics 専用 SQL プールの ADO.NET 接続マネージャーを指定します。
TableName アップロード先のテーブルの名前を指定します。 既存のテーブル名を選択するか、[<新しいテーブル...>] を選択して新規作成します。
TableDistribution 新しいテーブルの配布方法を指定します。 TableNameに新しいテーブル名が指定されている場合に適用されます。
HashColumnName ハッシュ テーブル配分に使用される列を指定します。 TableDistributionHASHが指定されている場合に適用されます。

BlobStorage

フィールド 説明
AzureStorageConnection Azure Storage 接続マネージャーを指定します。
BlobContainer ソース データが存在する BLOB コンテナーの名前を指定します。
BlobDirectory ソース データが存在する BLOB ディレクトリ (仮想階層構造) を指定します。
[RowDelimiter] 各行の終わりに印を付ける文字を指定します。
[列区切り記号] 各列の終わりに印を付ける 1 つ以上の文字を指定します。 例: | (パイプ)、\t (タブ)、' (単一引用符)、" (二重引用符)、および 0x5c (バック スラッシュ)。
CompressionType ソース データに使用される圧縮形式を指定します。
SqlPoolConnection Azure Synapse Analytics 専用 SQL プールの ADO.NET 接続マネージャーを指定します。
TableName アップロード先のテーブルの名前を指定します。 既存のテーブル名を選択するか、[<新しいテーブル...>] を選択して新規作成します。
TableDistribution 新しいテーブルの配布方法を指定します。 TableNameに新しいテーブル名が指定されている場合に適用されます。
HashColumnName ハッシュ テーブル配分に使用される列を指定します。 TableDistributionHASHが指定されている場合に適用されます。

新しいテーブルと既存のテーブルにいずれにコピーするかに基づき、異なる [マッピング] ページが表示されます。 前者の場合、マッピングするアップロード元の列とそれに対応する、作成予定のアップロード先のテーブルの名前を構成します。 後者の場合、アップロード元の列とアップロード先の列の間のマッピング関係を構成します。

[列] ページで、マッピング元ごとのデータ型プロパティを構成します。

[T-SQL] ページには、Azure Blob Storage から専用 SQL プールにデータを読み込むための T-SQL が表示されます。 T-SQL は別のページの構成から自動生成され、タスク実行の一部として実行されます。 生成された T-SQL を特定のニーズに合わせて手動で編集することもできます。 [編集] ボタンをクリックしてください。 [リセット] ボタンをクリックすれば、自動的に生成されたものに後で戻すことができます。