Apache Spark 2-OLTP-Connector von Azure Cosmos DB für die API für NoSQL: Versionshinweise und Ressourcen

GILT FÜR: NoSQL

Sie können Big Data-Analysen mit dem Apache Spark 2-OLTP-Connector von Azure Cosmos DB für NoSQL beschleunigen. Der Spark-Connector ermöglicht die Ausführung von Spark-Aufträgen für Daten, die in Azure Cosmos DB gespeichert sind. Batch- und Streamverarbeitung werden unterstützt.

Sie können den Connector mit Azure Databricks oder Azure HDInsight verwenden, die beide verwaltete Spark-Cluster in Azure bieten. Die folgende Tabelle zeigt die unterstützten Versionen:

Komponente Version
Apache Spark 2.4.x, 2.3.x, 2.2.x und 2.1.x
Scala 2.11
Azure Databricks (Laufzeitversion) Höher als 3.4

Warnung

Dieser Connector unterstützt die API für NoSQL von Azure Cosmos DB. Für Azure Cosmos DB for MongoDB verwenden Sie den MongoDB-Connector für Spark. Für Azure Cosmos DB for Apache Cassandra verwenden Sie den Cassandra Spark-Connector.

Ressourcen

Link
SDK-Download Herunterladen der neuesten JAR-Datei, Maven
Am SDK mitwirken Azure Cosmos DB-Connector für Apache Spark auf GitHub
Erste Schritte Beschleunigen von Big Data-Analysen mithilfe des Apache Spark-Zu-Azure Cosmos DB-Connectors - Verwenden von Apache Spark Structured Streaming mit Apache Kafka und Azure Cosmos DB