Azure Synapse Link for Azure Cosmos DB (プレビュー) とはWhat is Azure Synapse Link for Azure Cosmos DB (Preview)?

適用対象: SQL API MongoDB 用 Azure Cosmos DB API

重要

Azure Synapse Link for Azure Cosmos DB は現在プレビュー段階にあります。Azure Synapse Link for Azure Cosmos DB is currently in preview. このプレビュー バージョンはサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。This preview version is provided without a service level agreement, and it's not recommended for production workloads. 詳細については、「Microsoft Azure プレビューの追加使用条件」を参照してください。For more information, see Supplemental terms of use for Microsoft Azure previews.

Azure Synapse Link for Azure Cosmos DB は、クラウド ネイティブのハイブリッド トランザクションと分析処理 (HTAP) の機能です。これを使用すると、Azure Cosmos DB のオペレーショナル データに対してリアルタイムに近い分析を実行できます。Azure Synapse Link for Azure Cosmos DB is a cloud-native hybrid transactional and analytical processing (HTAP) capability that enables you to run near real-time analytics over operational data in Azure Cosmos DB. Azure Synapse Link によって、Azure Cosmos DB と Azure Synapse Analytics の間に緊密でシームレスな統合が作成されます。Azure Synapse Link creates a tight seamless integration between Azure Cosmos DB and Azure Synapse Analytics.

Azure Synapse Link では、完全に分離された列ストアである Azure Cosmos DB 分析ストアを使用することで、オペレーショナル データに対して、Azure Synapse Analytics で抽出、変換、読み込み (ETL) なしの分析を大規模に実行できます。Using Azure Cosmos DB analytical store, a fully isolated column store, Azure Synapse Link enables no Extract-Transform-Load (ETL) analytics in Azure Synapse Analytics against your operational data at scale. ビジネス アナリスト、データ エンジニア、データ サイエンティストは、ビジネス インテリジェンス、分析、機械学習のパイプラインをほぼリアルタイムで実行するために、Synapse Spark または Synapse SQL のどちらでも同じように使用できるようになりました。Business analysts, data engineers and data scientists can now use Synapse Spark or Synapse SQL interchangeably to run near real-time business intelligence, analytics, and machine learning pipelines. Azure Cosmos DB でのトランザクション ワークロードのパフォーマンスに影響を与えることなく、これを実現できます。You can achieve this without impacting the performance of your transactional workloads on Azure Cosmos DB.

次の図では、Azure Synapse Link と Azure Cosmos DB および Azure Synapse Analytics との統合を示します。The following image shows the Azure Synapse Link integration with Azure Cosmos DB and Azure Synapse Analytics:

Azure Synapse Analytics と Azure Cosmos DB の統合のアーキテクチャ図

利点Benefits

ミッション クリティカルなトランザクション ワークロードのパフォーマンスへの影響を最小限に抑えながら、大規模なオペレーショナル データセットを分析するには、従来であれば、Azure Cosmos DB のオペレーショナル データが抽出、変換、読み込み (ETL) パイプラインによって抽出および処理されます。To analyze large operational datasets while minimizing the impact on the performance of mission-critical transactional workloads, traditionally, the operational data in Azure Cosmos DB is extracted and processed by Extract-Transform-Load (ETL) pipelines. ETL パイプラインでは、データ移動の多くのレイヤーが必要になるため、操作が複雑になり、トランザクション ワークロードのパフォーマンスに影響します。ETL pipelines require many layers of data movement resulting in much operational complexity, and performance impact on your transactional workloads. また、開始時からオペレーショナル データが分析されるまでの待機時間も長くなります。It also increases the latency to analyze the operational data from the time of origin.

従来の ETL ベースのソリューションと比較すると、Azure Synapse Link for Azure Cosmos DB には次のような利点があります。When compared to the traditional ETL-based solutions, Azure Synapse Link for Azure Cosmos DB offers several advantages such as:

管理する ETL ジョブがないことによる複雑さの軽減Reduced complexity with No ETL jobs to manage

Azure Synapse Link では、Azure Synapse Analytics を使用して Azure Cosmos DB 分析ストアに直接アクセスすることができ、複雑なデータ移動がありません。Azure Synapse Link allows you to directly access Azure Cosmos DB analytical store using Azure Synapse Analytics without complex data movement. ETL や変更フィード ジョブがないので、オペレーショナル データに対して行われたすべての更新は、ほぼリアルタイムで分析ストアに表示されます。Any updates made to the operational data are visible in the analytical store in near real-time with no ETL or change feed jobs. 追加のデータ変換を行うことなく、Synapse Analytics から分析ストアに対して大規模な分析を実行できます。You can run large scale analytics against analytical store, from Synapse Analytics, without additional data transformation.

オペレーショナル データに関するほぼリアルタイムの分析情報Near real-time insights into your operational data

Azure Synapse Link を使用すると、オペレーショナル データに関する豊富な分析情報を、ほぼリアルタイムで取得できます。You can now get rich insights on your operational data in near real-time, using Azure Synapse Link. ETL ベースのシステムでは、多くのレイヤーでオペレーショナル データを抽出、変換、読み込む必要があるため、オペレーショナル データを分析するための待機時間が長くなる傾向があります。ETL-based systems tend to have higher latency for analyzing your operational data, due to many layers needed to extract, transform and load the operational data. Azure Cosmos DB 分析ストアと Azure Synapse Analytics のネイティブな統合により、オペレーショナル データをほぼリアルタイムで分析でき、新しいビジネス シナリオが可能になります。With native integration of Azure Cosmos DB analytical store with Azure Synapse Analytics, you can analyze operational data in near real-time enabling new business scenarios.

運用ワークロードへの影響がないNo impact on operational workloads

Azure Synapse Link では、トランザクション ワークロード用にプロビジョニングされたスループットを使用してトランザクション操作を処理しながら (行ベースのトランザクション ストア)、Azure Cosmos DB 分析ストア (個別の列ストア) に対して分析クエリを実行できます。With Azure Synapse Link, you can run analytical queries against an Azure Cosmos DB analytical store (a separate column store) while the transactional operations are processed using provisioned throughput for the transactional workload (a row-based transactional store). 分析ワークロードは、トランザクション ワークロードのトラフィックとは無関係に処理され、オペレーショナル データ用にプロビジョニングされたスループットは使用されません。The analytical workload is served independent of the transactional workload traffic without consuming any of the throughput provisioned for your operational data.

大規模な分析ワークロード用に最適化Optimized for large-scale analytics workloads

Azure Cosmos DB 分析ストアは、コンピューティング ランタイムに依存せずに、分析ワークロードに対してスケーラビリティ、弾力性、パフォーマンスを提供するように最適化されています。Azure Cosmos DB analytical store is optimized to provide scalability, elasticity, and performance for analytical workloads without any dependency on the compute run-times. ストレージ テクノロジは、分析ワークロードを最適化するように自己管理されています。The storage technology is self-managed to optimize your analytics workloads. Azure Synapse Analytics のサポートが組み込まれているため、このストレージ レイヤーに対するアクセスは簡単でハイ パフォーマンスです。With built-in support into Azure Synapse Analytics, accessing this storage layer provides simplicity and high performance.

コスト効率Cost effective

Azure Synapse Link を使うと、コスト効率のよいフル マネージドの運用分析用ソリューションを利用できます。With Azure Synapse Link, you can get a cost-optimized, fully managed solution for operational analytics. これにより、従来の ETL パイプラインでオペレーショナル データを分析するために必要であったストレージとコンピューティングの余分なレイヤーが不要になります。It eliminates the extra layers of storage and compute required in traditional ETL pipelines for analyzing operational data.

Azure Cosmos DB 分析ストアは、使用量ベースの価格モデルに従います。このモデルは、データ ストレージと、実行された分析の読み書き操作およびクエリに基づいています。Azure Cosmos DB analytical store follows a consumption-based pricing model, which is based on data storage and analytical read/write operations and queries executed . トランザクション ワークロードに対して現在行っているような、スループットのプロビジョニングは必要ありません。It doesn’t require you to provision any throughput, as you do today for the transactional workloads. Azure Synapse Analytics から高度なエラスティック コンピューティング エンジンを使用してデータにアクセスすることにより、ストレージとコンピューティングの実行のコスト効率が大幅に向上します。Accessing your data with highly elastic compute engines from Azure Synapse Analytics makes the overall cost of running storage and compute very efficient.

ローカルに使用可能でグローバルに分散されたマルチリージョン書き込みの分析Analytics for locally available, globally distributed, multi-region writes

Azure Cosmos DB のデータの最も近いリージョン コピーに対して、分析クエリを効率的に実行できます。You can run analytical queries effectively against the nearest regional copy of the data in Azure Cosmos DB. Azure Cosmos DB には、グローバルに分散された分析ワークロードとトランザクション ワークロードをアクティブ/アクティブ方式で実行するための最新の機能が用意されています。Azure Cosmos DB provides the state-of-the-art capability to run the globally distributed analytical workloads along with transactional workloads in an active-active manner.

オペレーショナル データの HTAP シナリオを有効にするEnable HTAP scenarios for your operational data

Synapse Link によって、Azure Cosmos DB 分析ストアと Azure Synapse Analytics のランタイム サポートが統合されます。Synapse Link brings together Azure Cosmos DB analytical store with Azure Synapse analytics runtime support. この統合により、大規模なデータセットのオペレーショナル データに対するリアルタイムの更新に基づいて分析情報を生成する、クラウド ネイティブの HTAP (ハイブリッド トランザクション/分析処理) ソリューションを構築できます。This integration enables you to build cloud native HTAP (Hybrid transactional/analytical processing) solutions that generate insights based on real-time updates to your operational data over large datasets. それによって、ライブの傾向に基づいてアラートを生成したり、ほぼリアルタイムのダッシュボードを作成したりする新しいビジネス シナリオや、ユーザーの行動に基づくビジネス エクスペリエンスが、可能になります。It unlocks new business scenarios to raise alerts based on live trends, build near real-time dashboards, and business experiences based on user behavior.

Azure Cosmos DB 分析ストアAzure Cosmos DB analytical store

Azure Cosmos DB 分析ストアは、Azure Cosmos DB 内のオペレーショナル データの列指向の表現です。Azure Cosmos DB analytical store is a column-oriented representation of your operational data in Azure Cosmos DB. この分析ストアは、大規模なオペレーショナル データ セットに対する高速でコスト効率の高いクエリに適しており、データをコピーする必要や、トランザクション ワークロードのパフォーマンスに対する影響はありません。This analytical store is suitable for fast, cost effective queries on large operational data sets, without copying data and impacting the performance of your transactional workloads.

分析ストアでは、Azure Cosmos DB のフル マネージド機能 ("自動同期") として、トランザクション ワークロードでの高頻度の挿入、更新、削除がほぼリアルタイムで自動的に取得されます。Analytical store automatically picks up high frequency inserts, updates, deletes in your transactional workloads in near real time, as a fully managed capability (“auto-sync”) of Azure Cosmos DB. 変更フィードや ETL は必要ありません。No change feed or ETL is required.

グローバルに分散された Azure Cosmos DB アカウントがある場合、コンテナーの分析ストアを有効にした後、そのアカウントのすべてのリージョンでそれを使用できるようになります。If you have a globally distributed Azure Cosmos DB account, after you enable analytical store for a container, it will be available in all regions for that account. 分析ストアの詳細については、Azure Cosmos DB 分析ストアの概要に関する記事を参照してください。For more information on the analytical store, see Azure Cosmos DB Analytical store overview article.

Azure Synapse Analytics との統合Integration with Azure Synapse Analytics

Synapse Link では、Azure Synapse Analytics から Azure Cosmos DB コンテナーに直接接続し、別のコネクタを使用せずに分析ストアにアクセスできるようになりました。With Synapse Link, you can now directly connect to your Azure Cosmos DB containers from Azure Synapse Analytics and access the analytical store with no separate connectors. Azure Synapse Analytics では、現在、Synapse Apache Spark および Synapse SQL サーバーレスとの Synapse Link をサポートしています。Azure Synapse Analytics currently supports Synapse Link with Synapse Apache Spark and Synapse SQL serverless.

Azure Synapse Analytics でサポートされているさまざまな分析ランタイム間の相互運用機能により、Azure Cosmos DB 分析ストアからデータを同時にクエリできます。You can query the data from Azure Cosmos DB analytical store simultaneously, with interop across different analytics run times supported by Azure Synapse Analytics. オペレーショナル データを分析するために、追加のデータ変換は必要ありません。No additional data transformations are required to analyze the operational data. 次のものを使用して、分析ストアのデータのクエリと分析を行うことができます。You can query and analyze the analytical store data using:

  • Scala、Python、SparkSQL、C# が完全にサポートされている Synapse Apache Spark。Synapse Apache Spark with full support for Scala, Python, SparkSQL, and C#. Synapse Spark は Data Engineering とデータ サイエンスのシナリオにおける中心的存在ですSynapse Spark is central to data engineering and data science scenarios

  • T-SQL 言語を使用する SQL サーバーレスと、使い慣れた BI ツール (Power BI Premium など) に対するサポートSQL serverless with T-SQL language and support for familiar BI tools (for example, Power BI Premium, etc.)

注意

Azure Synapse Analytics からは、Azure Cosmos DB コンテナー内の分析ストアとトランザクション ストアの両方にアクセスできます。From Azure Synapse Analytics, you can access both analytical and transactional stores in your Azure Cosmos DB container. ただし、オペレーショナル データに対して大規模な分析やスキャンを実行する場合は、トランザクション ワークロードのパフォーマンスへの影響を避けるため、分析ストアを使用することをお勧めします。However, if you want to run large-scale analytics or scans on your operational data, we recommend that you use analytical store to avoid performance impact on transactional workloads.

注意

Azure Cosmos DB コンテナーを Azure リージョンの Synapse ランタイムに接続することにより、そのリージョン内での分析を低待機時間で実行できます。You can run analytics with low latency in an Azure region by connecting your Azure Cosmos DB container to Synapse runtime in that region.

この統合により、次のようなさまざまなユーザーに対する HTAP シナリオが可能になります。This integration enables the following HTAP scenarios for different users:

  • Synapse SQL を通じて Azure Cosmos DB のライブ オペレーショナル データに直接アクセスし、Power BI レポートをモデル化して発行する BI エンジニア。A BI engineer who wants to model and publish a Power BI report to access the live operational data in Azure Cosmos DB directly through Synapse SQL.

  • Synapse SQL でクエリを実行することで、Azure Cosmos DB コンテナー内のオペレーショナル データから分析情報を抽出し、大規模なデータを読み取り、その結果を他のデータ ソースと結合するデータ アナリスト。A data analyst who wants to derive insights from the operational data in an Azure Cosmos DB container by querying it with Synapse SQL, read the data at scale and combine those findings with other data sources.

  • 複雑な Data Engineering を行わずにモデルを改善し、そのモデルをトレーニングする機能を、Synapse Spark を使用して見つけたいデータ サイエンティスト。A data scientist who wants to use Synapse Spark to find a feature to improve their model and train that model without doing complex data engineering. また、Spark Synapse を使用してデータのスコアリングをリアルタイムで行うために、モデルのポスト推論の結果を Azure Cosmos DB に書き込むこともできます。They can also write the results of the model post inference into Azure Cosmos DB for real-time scoring on the data through Spark Synapse.

  • 手動の ETL プロセスを使用せずに、Azure Cosmos DB コンテナーに対する SQL テーブルまたは Spark テーブルを作成することで、コンシューマーがデータにアクセスできるようにしたいと考えているデータ エンジニア。A data engineer who wants to make data accessible for consumers, by creating SQL or Spark tables over Azure Cosmos DB containers without manual ETL processes.

Azure Cosmos DB の Azure Synapse Analytics ランタイムによるサポートの詳細については、Cosmos DB に対する Azure Synapse Analytics のサポートに関するページを参照してください。For more information on Azure Synapse Analytics runtime support for Azure Cosmos DB, see Azure Synapse Analytics for Cosmos DB support.

Synapse Link は、次の場合にお勧めします。Synapse Link is recommended in the following cases:

  • Azure Cosmos DB のお客様で、オペレーショナル データに対して分析、BI、機械学習を実行したい場合。If you are an Azure Cosmos DB customer and you want to run analytics, BI, and machine learning over your operational data. このような場合、Synapse Link では、トランザクション ストアのプロビジョニング済みスループットに影響を与えることなく、より統合された分析エクスペリエンスが提供されます。In such cases, Synapse Link provides a more integrated analytics experience without impacting your transactional store’s provisioned throughput. 次に例を示します。For example:

    • 現在、別のコネクタを使用して、Azure Cosmos DB のオペレーショナル データで分析または BI を直接実行している場合If you are running analytics or BI on your Azure Cosmos DB operational data directly using separate connectors today, or

    • ETL プロセスを実行して、別の分析システムにオペレーショナル データを抽出している場合。If you are running ETL processes to extract operational data into a separate analytics system.

このような場合、Synapse Link では、トランザクション ストアのプロビジョニング済みスループットに影響を与えることなく、より統合された分析エクスペリエンスが提供されます。In such cases, Synapse Link provides a more integrated analytics experience without impacting your transactional store’s provisioned throughput.

高いコンカレンシー、ワークロードの管理、複数のデータ ソース間での集計の永続化など、従来のデータ ウェアハウスの要件を探している場合は、Synapse Link は推奨されません。Synapse Link is not recommended if you are looking for traditional data warehouse requirements such as high concurrency, workload management, and persistence of aggregates across multiple data sources. 詳細については、Azure Synapse Link for Azure Cosmos DB を使用して実現できる一般的なシナリオに関するページを参照してください。For more information, see common scenarios that can be powered with Azure Synapse Link for Azure Cosmos DB.

制限事項Limitations

  • 現在 Azure Synapse Link for Azure Cosmos DB は、SQL API および Azure Cosmos DB の MongoDB 用 API に対してサポートされています。Today Azure Synapse Link for Azure Cosmos DB is supported for SQL API and Azure Cosmos DB API for MongoDB. Gremlin API と Table API に対してはサポートされていません。It is not supported for Gremlin API and Table API. Cassandra API のサポートはプライベート プレビュー段階にあります。詳細については、Azure Synapse Link チームにお問い合わせください。Support for Cassandra API is in private preview, for more information please contact the Azure Synapse Link team.

  • 現時点では、分析ストアは新しいコンテナーに対してのみ有効にすることができます。Currently, the analytical store can only be enabled for new containers. 既存のコンテナーに分析ストアを使用するには、Azure Cosmos DB 移行ツールを使用して、既存のコンテナーから新しいコンテナーにデータを移行します。To use analytical store for existing containers, migrate data from your existing containers to new containers using Azure Cosmos DB migration tools. 新規および既存の Azure Cosmos DB アカウントで Synapse Link を有効にすることができます。You can enable Synapse Link on new and existing Azure Cosmos DB accounts.

  • 分析ストアが有効になっているコンテナーの場合、現時点では分析ストアでのデータの自動バックアップと復元がサポートされていません。For the containers with analytical store turned on, automatic backup and restore of your data in the analytical store is not supported at this time. データベース アカウントで Synapse Link が有効になっている場合、Azure Cosmos DB によって、コンテナーのトランザクション ストア (のみ) のデータをスケジュールされたバックアップ間隔で引き続き自動バックアップされます。When Synapse Link is enabled on a database account, Azure Cosmos DB will continue to automatically take backups of your data in the transactional store (only) of containers at scheduled backup interval, as always. 分析ストアが有効になっているコンテナーを新しいアカウントに復元すると、トランザクション ストアのみが有効な状態 (つまり分析ストアは有効でない状態) でコンテナーが復元されるので注意してください。It is important to note that when a container with analytical store turned on is restored to a new account, the container will be restored with only transactional store and no analytical store enabled.

  • プロビジョニングされた Synapse SQL での Azure Cosmos DB 分析ストアへのアクセスは、現在使用できません。Accessing the Azure Cosmos DB analytics store with Synapse SQL provisioned is currently not available.

価格Pricing

Azure Synapse Link の課金モデルには、Azure Cosmos DB 分析ストアと Synapse ランタイムを使用して発生するコストが含まれます。The billing model of Azure Synapse Link includes the costs incurred by using the Azure Cosmos DB analytical store and the Synapse runtime. 詳細については、Azure Cosmos DB 分析ストアの価格に関するページおよび「Azure Synapse Analytics の価格」をご覧ください。To learn more, see the Azure Cosmos DB analytical store pricing and Azure Synapse Analytics pricing articles.

次のステップNext steps

詳しく学習するために、次のドキュメントを参照してください。To learn more, see the following docs: