Microsoft Azure Cosmos DB용 Synapse Link(미리 보기)란?What is Azure Synapse Link for Azure Cosmos DB (Preview)?

적용 대상: SQL api Azure Cosmos DB Api for MongoDB

중요

Microsoft Azure Cosmos DB용 Synapse Link는 현재 미리 보기로 제공됩니다.Azure Synapse Link for Azure Cosmos DB is currently in preview. 이 미리 보기 버전은 서비스 수준 계약 없이 제공되며 프로덕션 워크로드에는 사용하지 않는 것이 좋습니다.This preview version is provided without a service level agreement, and it's not recommended for production workloads. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.For more information, see Supplemental terms of use for Microsoft Azure previews.

Microsoft Azure Cosmos DB용 Synapse Link는 클라우드 네이티브 HTAP(하이브리드 트랜잭션 및 분석 처리) 기능으로, 이를 통해 Microsoft Azure Cosmos DB의 작동 데이터에 대해 근 실시간 분석을 실행할 수 있습니다.Azure Synapse Link for Azure Cosmos DB is a cloud-native hybrid transactional and analytical processing (HTAP) capability that enables you to run near real-time analytics over operational data in Azure Cosmos DB. Azure Synapse Link를 통해 Microsoft Azure Cosmos DB와 Azure Synapse Analytics가 긴밀하게 통합됩니다.Azure Synapse Link creates a tight seamless integration between Azure Cosmos DB and Azure Synapse Analytics.

Azure Synapse Link는 완전 격리된 열 저장소인 Microsoft Azure Cosmos DB 분석 저장소를 사용하여 Azure Synapse Analytics에서 대규모 작동 데이터에 대해 ETL(추출, 변환 및 로드) 분석을 수행할 수 없습니다.Using Azure Cosmos DB analytical store, a fully isolated column store, Azure Synapse Link enables no Extract-Transform-Load (ETL) analytics in Azure Synapse Analytics against your operational data at scale. 비즈니스 분석가, 데이터 엔지니어 및 데이터 과학자는 이제 Synapse Spark나 Synapse SQL을 혼용하여 근 실시간 비즈니스 인텔리전스, 분석 및 기계 학습 파이프라인을 실행할 수 있습니다.Business analysts, data engineers and data scientists can now use Synapse Spark or Synapse SQL interchangeably to run near real-time business intelligence, analytics, and machine learning pipelines. Microsoft Azure Cosmos DB의 트랜잭션 워크로드 성능에 영향을 주지 않고 이를 달성할 수 있습니다.You can achieve this without impacting the performance of your transactional workloads on Azure Cosmos DB.

다음 이미지에서는 Microsoft Azure Cosmos DB 및 Azure Synapse Analytics와의 Azure Synapse Link 통합을 보여줍니다.The following image shows the Azure Synapse Link integration with Azure Cosmos DB and Azure Synapse Analytics:

Microsoft Azure Cosmos DB와 Azure Synapse Analytics 통합을 위한 아키텍처 다이어그램

이점Benefits

중요 업무용 트랜잭션 워크로드의 성능에 미치는 영향을 최소화하면서 대규모 작동 데이터 세트를 분석하기 위해 일반적으로 ETL 파이프라인에서 Microsoft Azure Cosmos DB의 작동 데이터를 추출하고 처리합니다.To analyze large operational datasets while minimizing the impact on the performance of mission-critical transactional workloads, traditionally, the operational data in Azure Cosmos DB is extracted and processed by Extract-Transform-Load (ETL) pipelines. ETL 파이프라인에는 많은 레이어의 데이터 이동이 필요합니다. 이로 인해 작업이 많이 복잡해지고 트랜잭션 워크로드 성능에 영향이 있습니다.ETL pipelines require many layers of data movement resulting in much operational complexity, and performance impact on your transactional workloads. 또한 원본 시간에서 작동 데이터 분석을 위한 대기 시간이 늘어납니다.It also increases the latency to analyze the operational data from the time of origin.

기존 ETL 기반 솔루션과 비교하여 Microsoft Azure Cosmos DB용 Azure Synapse Link는 다음과 같은 몇 가지 이점을 제공합니다.When compared to the traditional ETL-based solutions, Azure Synapse Link for Azure Cosmos DB offers several advantages such as:

관리할 ETL 작업이 없어 복잡성 감소Reduced complexity with No ETL jobs to manage

Azure Synapse Link를 사용하면 복잡한 데이터 이동 없이 Azure Synapse Analytics를 사용하여 Microsoft Azure Cosmos DB 분석 저장소에 직접 액세스할 수 있습니다.Azure Synapse Link allows you to directly access Azure Cosmos DB analytical store using Azure Synapse Analytics without complex data movement. 작동 데이터의 모든 업데이트는 ETL 또는 변경 피드 작업 없이 거의 실시간으로 분석 저장소에 표시됩니다.Any updates made to the operational data are visible in the analytical store in near real-time with no ETL or change feed jobs. 추가 데이터 변환 없이 Synapse Analytics에서 분석 저장소에 대해 대규모 분석을 실행할 수 있습니다.You can run large scale analytics against analytical store, from Synapse Analytics, without additional data transformation.

작동 데이터에 대한 근 실시간 인사이트Near real-time insights into your operational data

이제 Azure Synapse Link를 사용하여 거의 실시간으로 작동 데이터에 대한 풍부한 인사이트를 얻을 수 있습니다.You can now get rich insights on your operational data in near real-time, using Azure Synapse Link. ETL 기반 시스템은 작동 데이터 추출, 변환 및 로드에 필요한 많은 레이어로 인해 작동 데이터 분석을 위한 대기 시간이 더 긴 경향이 있습니다.ETL-based systems tend to have higher latency for analyzing your operational data, due to many layers needed to extract, transform and load the operational data. Azure Synapse Analytics와 Microsoft Azure Cosmos DB 분석 저장소의 네이티브 통합을 통해 거의 실시간으로 작동 데이터를 분석하여 새로운 비즈니스 시나리오를 지원할 수 있습니다.With native integration of Azure Cosmos DB analytical store with Azure Synapse Analytics, you can analyze operational data in near real-time enabling new business scenarios.

운영 워크로드에 영향이 없음No impact on operational workloads

Azure Synapse Link를 사용하면 Microsoft Azure Cosmos DB 분석 저장소 (별도의 열 저장소)에 대해 분석 쿼리를 실행할 수 있지만 트랜잭션 작업은 트랜잭션 워크로드(행 기반 트랜잭션 저장소)에 대한 프로비저닝된 처리량을 사용하여 처리됩니다.With Azure Synapse Link, you can run analytical queries against an Azure Cosmos DB analytical store (a separate column store) while the transactional operations are processed using provisioned throughput for the transactional workload (a row-based transactional store). 분석 워크로드는 작동 데이터에 대해 프로비저닝된 처리량을 소비하지 않고 트랜잭션 워크로드 트래픽과 독립적으로 처리됩니다.The analytical workload is served independent of the transactional workload traffic without consuming any of the throughput provisioned for your operational data.

대규모 분석 워크로드에 최적화됨Optimized for large-scale analytics workloads

Microsoft Azure Cosmos DB 분석 저장소는 컴퓨팅 실행 시간에 종속되지 않고 분석 워크로드에 확장성, 탄력성 및 성능을 제공하도록 최적화되었습니다.Azure Cosmos DB analytical store is optimized to provide scalability, elasticity, and performance for analytical workloads without any dependency on the compute run-times. 스토리지 기술은 분석 워크로드를 최적화하기 위해 자체 관리됩니다.The storage technology is self-managed to optimize your analytics workloads. Azure Synapse Analytics에 대한 기본 제공 지원을 통해 이 스토리지 레이어에 액세스하면 간편하고 성능이 향상됩니다.With built-in support into Azure Synapse Analytics, accessing this storage layer provides simplicity and high performance.

비용 효율성Cost effective

Azure Synapse Link를 통해 운영 분석을 위한 비용에 최적화된 완전 관리형 솔루션을 사용할 수 있습니다.With Azure Synapse Link, you can get a cost-optimized, fully managed solution for operational analytics. 이 솔루션은 작동 데이터를 분석하기 위해 기존 ETL 파이프라인에 필요한 추가 스토리지 및 컴퓨팅 추가 레이어를 없앱니다.It eliminates the extra layers of storage and compute required in traditional ETL pipelines for analyzing operational data.

Microsoft Azure Cosmos DB 분석 저장소는 실행된 데이터 스토리지 및 분석 읽기/쓰기 작업과 쿼리를 기반으로 하는 소비 기반 가격 책정 모델을 따릅니다.Azure Cosmos DB analytical store follows a consumption-based pricing model, which is based on data storage and analytical read/write operations and queries executed . 오늘날의 트랜잭션 워크로드와 마찬가지로 처리량을 프로비저닝할 필요가 없습니다.It doesn’t require you to provision any throughput, as you do today for the transactional workloads. Azure Synapse Analytics의 매우 탄력적인 컴퓨팅 엔진으로 데이터에 액세스하면 스토리지와 컴퓨팅을 실행하는 데 드는 전체 비용을 매우 효율적으로 관리할 수 있습니다.Accessing your data with highly elastic compute engines from Azure Synapse Analytics makes the overall cost of running storage and compute very efficient.

로컬에서 사용할 수 있고 전 세계적으로 분산 되어 있는 다중 지역 쓰기에 대 한 분석Analytics for locally available, globally distributed, multi-region writes

Microsoft Azure Cosmos DB에서 데이터의 가장 가까운 지역 복사본을 대상으로 분석 쿼리를 효과적으로 실행할 수 있습니다.You can run analytical queries effectively against the nearest regional copy of the data in Azure Cosmos DB. Microsoft Azure Cosmos DB는 활성-활성 방식으로 트랜잭션 워크로드와 함께 전역적으로 분산된 분석 워크 로드를 실행하는 최신 기능을 제공합니다.Azure Cosmos DB provides the state-of-the-art capability to run the globally distributed analytical workloads along with transactional workloads in an active-active manner.

작동 데이터에 HTAP 시나리오 사용Enable HTAP scenarios for your operational data

Synapse Link는 Azure Synapse 분석 런타임 지원과 Microsoft Azure Cosmos DB 분석 저장소를 통합합니다.Synapse Link brings together Azure Cosmos DB analytical store with Azure Synapse analytics runtime support. 이러한 통합을 통해 대규모 데이터 세트에서 작동 데이터에 대한 실시간 업데이트를 기반으로 인사이트를 생성하는 클라우드 네이티브 HTAP(하이브리드 트랜잭션/분석 처리) 솔루션을 구축할 수 있습니다.This integration enables you to build cloud native HTAP (Hybrid transactional/analytical processing) solutions that generate insights based on real-time updates to your operational data over large datasets. 이는 실시간 추세를 기반으로 경고를 발생시키고, 근 실시간 대시보드를 구축하고, 사용자 동작을 기반으로 한 비즈니스 환경을 제공하는 새로운 비즈니스 시나리오를 지원합니다.It unlocks new business scenarios to raise alerts based on live trends, build near real-time dashboards, and business experiences based on user behavior.

Microsoft Azure Cosmos DB 분석 저장소Azure Cosmos DB analytical store

Microsoft Azure Cosmos DB 분석 저장소는 열을 기반으로 Microsoft Azure Cosmos DB의 작동 데이터를 표현한 것입니다.Azure Cosmos DB analytical store is a column-oriented representation of your operational data in Azure Cosmos DB. 이 분석 저장소는 데이터를 복사하지 않고 트랜잭션 워크로드의 성능에 영향을 주지 않으면서 대규모 작동 데이터 세트에 대한 빠르고 비용 효율적인 쿼리에 적합합니다.This analytical store is suitable for fast, cost effective queries on large operational data sets, without copying data and impacting the performance of your transactional workloads.

분석 저장소는 Microsoft Azure Cosmos DB의 완전 관리형 기능("자동 동기화")으로 트랜잭션 워크로드에서 잦은 삽입, 업데이트 및 삭제를 거의 실시간으로 자동 선택합니다.Analytical store automatically picks up high frequency inserts, updates, deletes in your transactional workloads in near real time, as a fully managed capability (“auto-sync”) of Azure Cosmos DB. 변경 피드 또는 ETL이 필요하지 않습니다.No change feed or ETL is required.

전역적으로 분산된 Microsoft Azure Cosmos DB 계정이 있는 경우 컨테이너에 분석 저장소를 사용하도록 설정하면 해당 계정의 모든 지역에서 이 계정을 사용할 수 있습니다.If you have a globally distributed Azure Cosmos DB account, after you enable analytical store for a container, it will be available in all regions for that account. 분석 저장소에 대한 자세한 내용은 Microsoft Azure Cosmos DB 분석 저장소 개요 문서를 참조하세요.For more information on the analytical store, see Azure Cosmos DB Analytical store overview article.

Azure Synapse Analytics와 통합Integration with Azure Synapse Analytics

이제 Synapse Link를 사용하여 Azure Synapse Analytics에서 Microsoft Azure Cosmos DB 컨테이너에 직접 연결하고 별도의 커넥터 없이 분석 저장소에 액세스할 수 있습니다.With Synapse Link, you can now directly connect to your Azure Cosmos DB containers from Azure Synapse Analytics and access the analytical store with no separate connectors. Azure Synapse Analytics는 현재 Synapse Apache SparkSynapse SQL server를 사용 하 여 Synapse 링크를 지원 합니다.Azure Synapse Analytics currently supports Synapse Link with Synapse Apache Spark and Synapse SQL serverless.

Azure Synapse Analytics에서 지원하는 여러 분석 런타임에서 interop를 사용하여 Microsoft Azure Cosmos DB 분석 저장소의 데이터를 동시에 쿼리할 수 ​​있습니다.You can query the data from Azure Cosmos DB analytical store simultaneously, with interop across different analytics run times supported by Azure Synapse Analytics. 작동 데이터 분석을 위한 추가 데이터 변환이 필요하지 않습니다.No additional data transformations are required to analyze the operational data. 다음을 사용하여 분석 저장소 데이터를 쿼리하고 분석할 수 있습니다.You can query and analyze the analytical store data using:

  • Scala, Python, SparkSQL 및 C#을 완벽하게 지원하는 Synapse Apache Spark.Synapse Apache Spark with full support for Scala, Python, SparkSQL, and C#. Synapse Spark는 데이터 엔지니어링 및 데이터 과학 시나리오의 중심입니다.Synapse Spark is central to data engineering and data science scenarios

  • T-SQL 언어 및 익숙한 BI 도구(예 : Power BI Premium 등) 지원이 포함된 SQL 서버리스.SQL serverless with T-SQL language and support for familiar BI tools (for example, Power BI Premium, etc.)

참고

Azure Synapse Analytics에서 Microsoft Azure Cosmos DB 컨테이너의 분석 및 트랜잭션 저장소에 모두 액세스할 수 있습니다.From Azure Synapse Analytics, you can access both analytical and transactional stores in your Azure Cosmos DB container. 그러나 작동 데이터에 대한 대규모 분석이나 검사를 실행하려는 경우 분석 저장소를 사용하여 트랜잭션 워크로드에 대한 성능 영향을 방지하는 것이 좋습니다.However, if you want to run large-scale analytics or scans on your operational data, we recommend that you use analytical store to avoid performance impact on transactional workloads.

참고

Microsoft Azure Cosmos DB 컨테이너를 해당 지역의 Synapse 런타임에 연결하여 Azure 지역에서 짧은 대기 시간으로 분석을 실행할 수 있습니다.You can run analytics with low latency in an Azure region by connecting your Azure Cosmos DB container to Synapse runtime in that region.

이러한 통합을 통해 여러 사용자에 대해 다음과 같은 HTAP 시나리오를 사용할 수 있습니다.This integration enables the following HTAP scenarios for different users:

  • Synapse SQL을 통해 직접 Azure Cosmos DB에서 라이브 작동 데이터에 액세스 하는 Power BI 보고서를 모델링 및 게시 하려는 BI 엔지니어입니다.A BI engineer who wants to model and publish a Power BI report to access the live operational data in Azure Cosmos DB directly through Synapse SQL.

  • Synapse SQL로 쿼리하여 Microsoft Azure Cosmos DB 컨테이너의 작동 데이터에서 인사이트를 얻고, 대규모로 데이터를 읽고, 이러한 결과를 다른 데이터 원본과 결합하려는 데이터 분석가A data analyst who wants to derive insights from the operational data in an Azure Cosmos DB container by querying it with Synapse SQL, read the data at scale and combine those findings with other data sources.

  • Synapse Spark를 사용하여 모델을 개선하고 복잡한 데이터 엔지니어링을 수행하지 않고 해당 모델을 학습하는 기능을 원하는 데이터 과학자.A data scientist who wants to use Synapse Spark to find a feature to improve their model and train that model without doing complex data engineering. Spark Synapse를 통해 데이터에 대한 실시간 채점을 위해 모델 사후 유추 결과를 Microsoft Azure Cosmos DB에 쓸 수도 있습니다.They can also write the results of the model post inference into Azure Cosmos DB for real-time scoring on the data through Spark Synapse.

  • 수동 ETL 프로세스 없이 Microsoft Azure Cosmos DB 컨테이너를 통해 SQL 또는 Spark 테이블을 만들어 소비자가 데이터에 액세스 할 수 있도록 하려는 데이터 엔지니어A data engineer who wants to make data accessible for consumers, by creating SQL or Spark tables over Azure Cosmos DB containers without manual ETL processes.

Microsoft Azure Cosmos DB에 대한 Azure Synapse Analytics 런타임 지원에 대한 자세한 내용 Cosmos DB에 대한 Azure Synapse Analytics 지원을 참조하세요.For more information on Azure Synapse Analytics runtime support for Azure Cosmos DB, see Azure Synapse Analytics for Cosmos DB support.

Synapse Link는 다음과 같은 경우에 권장됩니다.Synapse Link is recommended in the following cases:

  • Microsoft Azure Cosmos DB 고객이며 작동 데이터에 대한 분석, BI 및 기계 학습을 실행하려는 경우.If you are an Azure Cosmos DB customer and you want to run analytics, BI, and machine learning over your operational data. 이러한 경우 Synapse Link는 트랜잭션 저장소의 프로비저닝된 처리량에 영향을 주지 않고 보다 긴밀하게 통합된 분석 환경을 제공합니다.In such cases, Synapse Link provides a more integrated analytics experience without impacting your transactional store’s provisioned throughput. 다음은 그 예입니다.For example:

    • 현재 별도의 커넥터를 사용하여 Microsoft Azure Cosmos DB 작동 데이터에 대해 직접 분석 또는 BI를 실행하는 경우 또는If you are running analytics or BI on your Azure Cosmos DB operational data directly using separate connectors today, or

    • ETL 프로세스를 실행하여 별도의 분석 시스템으로 작동 데이터를 추출하는 경우If you are running ETL processes to extract operational data into a separate analytics system.

이러한 경우 Synapse Link는 트랜잭션 저장소의 프로비저닝된 처리량에 영향을 주지 않고 보다 긴밀하게 통합된 분석 환경을 제공합니다.In such cases, Synapse Link provides a more integrated analytics experience without impacting your transactional store’s provisioned throughput.

높은 동시성, 워크로드 관리 및 여러 데이터 원본의 집계 지속성과 같은 기존 데이터 웨어하우스 요구 사항을 찾고 있다면 Synapse Link는 권장되지 않습니다.Synapse Link is not recommended if you are looking for traditional data warehouse requirements such as high concurrency, workload management, and persistence of aggregates across multiple data sources. 자세한 내용은 Microsoft Azure Cosmos DB용 Azure Synapse Link로 강화할 수 있는 일반적인 시나리오를 참조하세요.For more information, see common scenarios that can be powered with Azure Synapse Link for Azure Cosmos DB.

제한 사항Limitations

  • 현재 Azure Cosmos DB용 Azure Synapse Link는 SQL API 및 Azure Cosmos DB API for MongoDB에 대해 지원됩니다.Today Azure Synapse Link for Azure Cosmos DB is supported for SQL API and Azure Cosmos DB API for MongoDB. Gremlin API 및 Table API에 대해 지원되지 않습니다.It is not supported for Gremlin API and Table API. Cassandra API에 대 한 지원은 비공개 미리 보기입니다. 자세한 내용은 Azure Synapse Link 팀에 문의 하세요.Support for Cassandra API is in private preview, for more information please contact the Azure Synapse Link team.

  • 현재 분석 저장소는 새 컨테이너에 대해서만 사용할 수 있습니다.Currently, the analytical store can only be enabled for new containers. 기존 컨테이너에 분석 저장소를 사용 하려면 Azure Cosmos DB 마이그레이션 도구를 사용 하 여 기존 컨테이너에서 새 컨테이너로 데이터를 마이그레이션합니다.To use analytical store for existing containers, migrate data from your existing containers to new containers using Azure Cosmos DB migration tools. 신규 및 기존 Azure Cosmos DB 계정에서 Synapse 링크를 사용 하도록 설정할 수 있습니다.You can enable Synapse Link on new and existing Azure Cosmos DB accounts.

  • 분석 저장소가 설정 된 컨테이너의 경우 지금은 분석 저장소에서 데이터의 자동 백업 및 복원이 지원 되지 않습니다.For the containers with analytical store turned on, automatic backup and restore of your data in the analytical store is not supported at this time. 데이터베이스 계정에서 Synapse 링크를 사용 하도록 설정 하면 Azure Cosmos DB는 항상으로 예약 된 백업 간격으로 컨테이너의 트랜잭션 저장소 (만)에 대 한 데이터 백업을 자동으로 수행 합니다.When Synapse Link is enabled on a database account, Azure Cosmos DB will continue to automatically take backups of your data in the transactional store (only) of containers at scheduled backup interval, as always. 분석 저장소가 설정 된 컨테이너가 새 계정으로 복원 되 면 컨테이너는 트랜잭션 저장소로만 복원 되 고 분석 저장소는 사용 하도록 설정 되지 않습니다.It is important to note that when a container with analytical store turned on is restored to a new account, the container will be restored with only transactional store and no analytical store enabled.

  • Synapse SQL 프로비저닝을 사용한 Microsoft Azure Cosmos DB 분석 저장소 액세스는 현재 제공되지 않습니다.Accessing the Azure Cosmos DB analytics store with Synapse SQL provisioned is currently not available.

가격 책정Pricing

Azure Synapse Link의 청구 모델은 Microsoft Azure Cosmos DB 분석 저장소와 Synapse 런타임을 사용하여 발생하는 비용을 포함합니다.The billing model of Azure Synapse Link includes the costs incurred by using the Azure Cosmos DB analytical store and the Synapse runtime. 자세한 내용은 Microsoft Azure Cosmos DB 분석 저장소 가격 책정Azure Synapse Analytics 가격 책정 문서를 참조하세요.To learn more, see the Azure Cosmos DB analytical store pricing and Azure Synapse Analytics pricing articles.

다음 단계Next steps

자세히 알아보려면 다음 문서를 참조하세요To learn more, see the following docs: