CDC 制御タスク

適用対象:SQL Server Azure Data Factory の SSIS Integration Runtime

重要

CDC 制御タスク、CDC ソース、CDC スプリッターなどの CDC フロー コンポーネントは非推奨となりました。 詳細は発表を参照してください。

CDC 制御タスクは、変更データ キャプチャ (CDC) パッケージのライフ サイクルの制御に使用します。 CDC 制御タスクは、初期読み込みパッケージと CDC パッケージとの同期処理を行い、CDC パッケージの実行で処理されるログ シーケンス番号 (LSN) 範囲を管理します。 また、エラー シナリオおよび復旧の処理も行います。

CDC 制御タスクは CDC パッケージの状態を SSIS パッケージ変数に保持します。また、データベース テーブルに保存して、アクティブ化されるパッケージ間および共通の CDC プロセスを実行する複数のパッケージ間 (たとえば、あるタスクが初期読み込みを実行し、別のタスクがトリクル フィード更新を実行する場合) で状態が維持されるようにすることもできます。

CDC 制御タスクでは、2 つのグループの操作がサポートされます。 1 つ目のグループは初期読み込みと変更処理との間の同期処理を行い、もう 1 つのグループは CDC パッケージ実行時の LSN の変更処理範囲の管理と正常に処理された範囲の追跡を行います。

次の操作は、初期読み込みと変更処理との間の同期処理を行います。

Operation 説明
ResetCdcState この操作は、現在の CDC コンテキストに関連付けられた、永続的な CDC の状態をリセットするために使用されます。 この操作の実行後に、LSN-timestamp sys.fn_cdc_get_max_lsn テーブルの現在の最大 LSN が次の処理範囲の開始位置になります。 この操作には、ソース データベースへの接続が必要です。
MarkInitialLoadStart この操作は初期読み込みパッケージの開始時に使用され、ソース データベースで現在の LSN を記録します。その後、初期読み込みパッケージがソース テーブルの読み取りを開始します。 この操作には、 sys.fn_cdc_get_max_lsnを呼び出すための、ソース データベースへの接続が必要です。

(Oracle ではなく) SQL Server CDC での作業時に MarkInitialLoadStart を選択した場合、接続マネージャーで指定されたユーザーは、db_owner か sysadmin である必要があります。
MarkInitialLoadEnd この操作は初期読み込みパッケージの終了時に使用され、初期読み込みパッケージがソース テーブルの読み取りを終了した後で、ソース データベースで現在の LSN を記録します。 この LSN を特定するために、この操作が発生したときの時刻が記録され、CDC データベース内の cdc.lsn_time_マッピング テーブルに対するクエリにより、その時刻より後に行われた変更が検索されます。

(Oracle ではなく) SQL Server CDC での作業時に MarkInitialLoadEnd を選択した場合、接続マネージャーで指定されたユーザーは、db_owner か sysadmin である必要があります。
MarkCdcStart この操作は、初期読み込みがスナップショット データベースから行われるときに使用されます。 この場合、変更処理は、スナップショット LSN の直後から開始されます。 使用するスナップショット データベースの名前と、スナップショット LSN に関するクエリを SQL Server に対して実行する CDC 制御タスクを使用できます。 また、スナップショット LSN を直接指定するオプションもあります。

(Oracle ではなく) SQL Server CDC での作業時に MarkCdcStart を選択した場合、接続マネージャーで指定されたユーザーは、db_owner か sysadmin である必要があります。

処理範囲の管理には、次の操作を使用します。

Operation 説明
GetProcessingRange この操作は、CDC ソース データ フローを使用するデータ フローを呼び出す前に使用されます。 この操作は、呼び出し時に CDC ソース データ フローが読み取る LSN の範囲を設定します。 範囲は、データ フローの処理中に CDC ソースによって使用される SSIS パッケージ変数に格納されます。

格納される状態の詳細については、「 状態変数の定義」を参照してください。
MarkProcessedRange この操作は、CDC 実行で完全に処理された最後の LSN を記録するために、各 CDC の実行後 (CDC データ フローが正常に完了した後) に実行されます。 GetProcessingRange を次に実行する際、この位置が次の処理範囲の開始位置になります。

CDC 状態の永続性の処理

CDC 制御タスクは、アクティブ化のたびに永続的な状態を維持します。 CDC 状態に格納される情報を使用して CDC パッケージの処理範囲およびエラー条件を検出する処理範囲を決定し、管理します。 永続的な状態は文字列として格納されます。 詳細については、「 状態変数の定義」を参照してください。

CDC 制御タスクは、2 種類の状態の永続性をサポートします。

  • 手動の状態の永続性: この場合、CDC 制御タスクがパッケージ変数に格納されている状態を管理しますが、パッケージ開発者は、CDC 制御を呼び出す前に永続的なストアから変数を読み取り、CDC 制御が最後に呼び出され、CDC の実行が完了した後で変数に書き戻す必要があります。

  • 自動の状態の永続性: CDC 状態はデータベースのテーブルに格納されます。 状態は、 [状態の格納に使用するテーブル] プロパティに指定されたテーブルに、 StateName プロパティに指定されている名前で格納されます。これは、状態を格納するために選択した接続マネージャー内にあります。 既定ではソース接続マネージャーですが、ターゲット接続マネージャーにするのが一般的です。 CDC 制御タスクは状態テーブルの状態値を更新し、アンビエント トランザクションの一環としてコミットされます。

エラー処理

CDC 制御タスクは、次の場合にエラーを報告することがあります。

  • 永続的な CDC 状態の読み取りに失敗したとき、または永続的な状態の更新が失敗したとき。

  • ソース データベースからの現在の LSN 情報の読み取りに失敗したとき。

  • 読み取った CDC 状態に一貫性がないとき。

このような場合、CDC 制御タスクはエラーを報告します。このエラーは、SSIS が制御フローのエラーを処理する標準的な方法で処理できます。

CDC 制御タスクは、GetProcessingRange 操作の直後、MarkProcessedRange が呼び出される前に別の GetProcessingRange 操作が呼び出された場合に、警告も報告します。 これは、先に実行された操作が失敗した状況、または、別の CDC パッケージが同じ CDC 状態名を使用して実行されている状況を示します。

CDC 制御タスクの構成

プロパティは、SSIS デザイナーを使用して、またはプログラムによって設定できます。

このセクションの内容

状態変数の定義

CDC 制御タスク エディター

[CDC 制御タスク エディター] ダイアログ ボックスを使用すると、CDC 制御タスクを構成できます。 CDC 制御タスクの構成では、CDC データベースへの接続、CDC タスクの操作、状態管理情報の定義などを行います。

CDC 制御タスクの詳細については、「 CDC Control Task」を参照してください。

CDC 制御タスク エディターを開くには

  1. SQL Server Data Toolsで、CDC 制御タスクの含まれる SQL Server 2019 Integration Services (SSIS) パッケージを開きます。

  2. [制御フロー] タブで、CDC 制御タスクをダブルクリックします。

オプション

[SQL Server CDC データベースの ADO.NET 接続マネージャー]
既存の接続マネージャーを一覧から選択するか、 [新規作成] をクリックして新しい接続を作成します。 選択した変更テーブルが存在する、CDC に対応した SQL Server データベースへの接続である必要があります。

[CDC 制御操作]
このタスクに対して実行する操作を選択します。 どの操作でも、状態変数を使用します。この変数は、状態を格納してパッケージ内のコンポーネント間で受け渡しする SSIS パッケージ変数に格納されます。

  • [初期読み込みの開始をマーク]: この操作は、スナップショットのないアクティブ データベースから初期読み込みを実行するときに使用されます。 初期読み込みパッケージの開始時に呼び出され、ソース データベースで現在の LSN を記録します。その後、初期読み込みパッケージがソース テーブルの読み取りを開始します。 この操作には、ソース データベースへの接続が必要です。

    (Oracle ではなく) SQL Server CDC での作業時に [初期読み込みの開始をマーク] を選択した場合、接続マネージャーで指定されたユーザーは、db_ownersysadminである必要があります。

  • [初期読み込みの終了をマーク]: この操作は、スナップショットのないアクティブ データベースから初期読み込みを実行するときに使用されます。 初期読み込みパッケージの終了時に呼び出され、初期読み込みパッケージがソース テーブルの読み取りを終了した後で、ソース データベースで現在の LSN を記録します。 この LSN を特定するために、この操作が発生したときの時刻が記録され、CDC データベース内の cdc.lsn_time_マッピング テーブルに対するクエリにより、その時刻より後に行われた変更が検索されます。

    (Oracle ではなく) SQL Server CDC での作業時に [初期読み込みの終了をマーク] を選択した場合、接続マネージャーで指定されたユーザーは、db_ownersysadminである必要があります。

  • [CDC の開始をマーク]: この操作は、初期読み込みがスナップショット データベースまたは休止データベースから行われるときに使用されます。 初期読み込みパッケージ内の任意のポイントで呼び出されます。 この操作は、スナップショット LSN またはスナップショット データベースの名前 (これからスナップショット LSN が動的に派生) が設定されるパラメーターを受け取ります。ただし、このパラメーターは空のままにすることもでき、その場合は、現在のデータベース LSN が変更処理パッケージの開始 LSN として使用されます。

    この操作は、[初期読み込みの開始をマーク] または [初期読み込みの終了をマーク] 操作の代わりに使用されます。

    (Oracle ではなく) SQL Server CDC での作業時に [CDC の開始をマーク] を選択した場合、接続マネージャーで指定されたユーザーは、db_ownersysadminである必要があります。

  • [処理範囲の取得]: この操作は、CDC ソース データ フローを使用するデータ フローを呼び出す前に、変更処理パッケージで使用されます。 この操作は、呼び出し時に CDC ソース データ フローが読み取る LSN の範囲を設定します。 範囲は、データ フローの処理中に CDC ソースによって使用される SSIS パッケージ変数に格納されます。

    格納されるすべての種類の CDC 状態の詳細については、「 状態変数の定義」を参照してください。

  • [処理済みの範囲をマーク]: この操作は、(CDC データ フローが正常に完了した後) CDC 実行の終了時に変更処理パッケージで使用され、CDC 実行で完全に処理された最後の LSN を記録します。 GetProcessingRange を次に実行する際、この位置によって次の処理範囲の開始位置が決まります。

  • [CDC の状態をリセット]: この操作は、現在の CDC コンテキストに関連付けられた、永続的な CDC の状態をリセットするために使用されます。 この操作の実行後に、LSN-timestamp sys.fn_cdc_get_max_lsn テーブルの現在の最大 LSN が次の処理範囲の開始位置になります。 この操作には、ソース データベースへの接続が必要です。

    この操作は、新たに作成された変更レコードのみを処理し、古い変更レコードをすべて無視する場合などに使用します。

[CDC 状態を含む変数]
タスク操作の状態情報を格納する SSIS パッケージ変数を選択します。 始める前に、変数を定義する必要があります。 [状態の自動保持]を選択した場合、状態変数は自動的に読み込まれ、保存されます。

状態変数の定義の詳細については、「 状態変数の定義」を参照してください。

[CDC/スナップショット名を開始する SQL Server LSN]:
初期読み込みの実行開始位置となる、現在のソース データベース LSN またはスナップショット データベースの名前を入力し、CDC の開始位置を決定します。 [CDC 制御操作][CDC の開始をマーク]に設定されている場合にのみ、使用できます。

これらの操作の詳細については、「 CDC Control Task」を参照してください。

[状態をデータベース テーブルに自動的に格納する]
このチェック ボックスをオンにすると、指定されたデータベースに含まれる状態テーブルへの CDC 状態の読み込みと格納が CDC 制御タスクで自動的に処理されます。 オフにした場合、開発者は、パッケージの開始時に CDC 状態を読み込み、変更された CDC 状態を保存する必要があります。

[状態が格納されるデータベースの接続マネージャー]
既存の ADO.NET 接続マネージャーを一覧から選択するか、[新規作成] をクリックして新しい接続を作成します。 これは、状態テーブルが含まれる SQL Server データベースへの接続です。 状態テーブルには状態情報が含まれています。

[状態の自動保持] が選択されている場合にのみ使用できます。これは必須パラメーターです。

[状態の格納に使用するテーブル]
CDC 状態の格納に使用する状態テーブルの名前を入力します。 指定するテーブルには、 namestate の 2 列が必要で、両方ともデータ型が varchar (256)である必要があります。

[新規作成] を選択して、必要な列を備えた新しい状態テーブルを構築する SQL スクリプトを入手することもできます。 [状態の自動保持] が選択されている場合、開発者は前の要件に従って状態テーブルを作成する必要があります。

[状態の自動保持] が選択されている場合にのみ使用できます。これは必須パラメーターです。

状態名
永続的な CDC 状態に関連付ける名前を入力します。 同じ CDC コンテキストを使用する完全読み込みパッケージと CDC パッケージでは、共通の状態名を指定する必要があります。 この名前は、状態テーブルで状態行を検索するために使用されます。