Azure Synapse Link for SQL Server 2022

この記事は、Azure Synapse Link for SQL Server 2022 の機能を理解するうえで役立ちます。 Azure Synapse Link for SQL の機能を利用して、SQL Server 2022 から Azure Synapse Analytics 専用 SQL プールにオペレーショナル データをレプリケートできます。

リンク接続は、SQL Server 2022 と Azure Synapse Analytics 専用 SQL プール間のマッピング関係を識別します。 Synapse ワークスペースでリンク接続を作成、管理、監視、削除することができます。 リンク接続の作成時に、ソース データベースと同期先 Synapse 専用 SQL プールの両方を選択して、ソース データベースのオペレーショナル データが指定の同期先 Synapse 専用 SQL プールに自動的にレプリケートされるようにすることができます。 レプリケートするソース データベースから 1 つ以上のテーブルを追加または削除することも可能です。

リンク接続は、開始、停止、一時停止、または再開できます。 リンク接続を開始すると、ソース データベースの完全な初期読み込みが行われてから、SQL Server 2022 の変更フィード機能により増分変更フィードが行われます。 リンク接続を停止すると、オペレーショナル データに対して行われた更新は、Synapse 専用 SQL プールに同期されません。 リンク接続を再度開始すると、ソース データベースから完全な初期読み込みが行われます。 リンク接続を一時停止すると、オペレーショナル データに対して行われた更新は、Synapse 専用 SQL プールに同期されなくなります。 リンク接続を再開すると、Synapse 専用 SQL プールへのリンク接続を一時停止した所から引き続き更新が同期されます。 詳細については、SQL Server 2022 および Azure SQL Database の Azure Synapse Link 変更フィードに関する記事を参照してください。

データをレプリケートするには、リンク接続ごとにコンピューティング コア数を選択する必要があります。 コア数はコンピューティング能力を表し、データ レプリケーションの待機時間とコストに影響します。

また、連続モードまたはバッチ モードを選択してデータをレプリケートすることで、コストと待機時間のトレードオフを行うこともできます。 連続モードを選択すると、ランタイムが連続的に実行されるため、SQL DB またはSQL Server に適用されたすべての変更は、短い待機時間で Synapse にレプリケートされます。 バッチ モードを選択し、間隔を指定すると、SQL DB または SQL Server に適用された変更は、累積され、指定された間隔ごとにバッチ モードで Synapse にレプリケートされます。 ランタイムがデータをレプリケートするために必要な時間に対してのみ課金が発生するため、こうすることにより、コストを節約できます。 データの各バッチがレプリケートされた後で、ランタイムは自動的にシャットダウンされます。

ランディング ゾーン

ランディング ゾーンは、Azure Synapse Link for SQL Server 2022 に必要な中間ステージング ストアです。 まず、オペレーショナル データが SQL Server 2022 からランディング ゾーンに読み込まれます。 次に、データがランディング ゾーンから Synapse 専用 SQL プールにコピーされます。 ランディング ゾーンとして使用する独自の Azure Data Lake Storage Gen2 アカウントを指定する必要があります。 このランディング ゾーンを、Azure Synapse Link for SQL 以外に使用することはサポートされていません。

リンク接続がランディング ゾーンにアクセスするには、Azure Data Lake Storage Gen2 アカウントからの共有アクセス署名 (SAS) トークンが必要です。 SAS トークンには有効期限があることに注意してください。 SAS トークンが有効であることを維持するために、必ず有効期限の前に SAS トークンをローテーションしてください。 そうしないと、Azure Synapse Link for SQL は SQL Server 2022 からのデータのレプリケートに失敗します。

セルフホステッド統合ランタイム

セルフホステッド統合ランタイムは、オンプレミスのマシンまたは仮想マシンにダウンロードしてインストールできるソフトウェア エージェントです。 Azure Synapse Link for SQL Server 2022 でファイアウォールの背後にあるオンプレミス SQL Server 2022 のデータにアクセスするためにこれが必要です。 現在、セルフホステッド IR は、Windows オペレーティングシステムでのみサポートされています。 詳細については、「セルフホステッド統合ランタイムを作成する」を参照してください。

監視

Azure Synapse Link for SQL は、リンクとテーブルの各レベルで監視できます。 各リンク接続について、次の状態が表示されます。

  • 初期: リンク接続は作成されていますが、開始されていません。 初期状態では課金されません。
  • 開始: リンク接続で、データをレプリケートするためのコンピューティング エンジンが設定されます。
  • 実行中: リンク接続でデータがレプリケートされています。
  • 停止中: リンク接続が停止されます。 コンピューティング エンジンがシャットダウン中です。
  • 停止: リンク接続が停止しています。 停止状態では課金されません。
  • 一時停止中: リンク接続が一時停止されます。 コンピューティング エンジンがシャットダウン中です。
  • 一時停止: リンク接続が一時停止されています。 一時停止状態では課金されません。
  • 再開中: 変更のレプリケートを続行するようにコンピューティング エンジンを設定すると、リンク接続が再開されます。

各テーブルについて、次の状態が表示されます。

  • スナップショット作成中: ソース テーブルは、最初にフル スナップショットで同期先に読み込まれます。
  • レプリケート中: ソース テーブルの更新が、同期先にレプリケートされます。
  • 失敗: ソース テーブルのデータを同期先にレプリケートできません。 エラーを修正後に再試行する場合は、リンク接続からテーブルを削除して、再度追加します。
  • 中断: エラーにより、このテーブルのレプリケーションは中断されています。 エラーが解決された後に再開されます。

次のメトリックを取得して、サービスの高度な監視を有効にすることもできます。

  • リンク接続イベント: 開始、停止、または失敗を含むリンク接続イベントの数。
  • リンク テーブル イベント: スナップショット、削除、または失敗を含むリンク テーブル イベントの数。
  • リンク待機時間 (秒): データ処理の待機時間 (秒)。
  • Link データの処理済みデータ ボリューム (バイト): SQL の Synapse Link によって処理されたデータ ボリューム (バイト単位)。
  • Link 処理済み行: SQL の Synapse Link によって (変更された) 処理された行数。

詳細については、「Synapse Link for SQL の変更フィードを管理する」を参照してください。

テーブル間のトランザクションの一貫性

各リンク接続でテーブル間のトランザクションの一貫性を有効にすることができます。 ただし、これによりレプリケーションの全体的なスループットが制限されます。

既知の制限事項

既知の制限事項と問題がまとめられたリストについては、「Azure Synapse Link for SQL の既知の制限事項と問題」を参照してください。

次のステップ