Azure Cosmos DB

Belangrijk

Deze documentatie is buiten gebruik gesteld en wordt mogelijk niet bijgewerkt. Bekijk de officiële Github-opslagplaats van de Cosmos DB Spark-connector.

Azure Cosmos DB is de wereldwijd gedistribueerde, multimodeldatabase van Microsoft. Met Azure Cosmos DB kunt u doorvoer en opslag elastisch en onafhankelijk schalen in een willekeurig aantal geografische regio's van Azure. Het biedt garanties voor doorvoer, latentie, beschikbaarheid en consistentie met uitgebreide serviceovereenkomsten (SLA's). Azure Cosmos DB biedt API's voor de volgende gegevensmodellen, met SDK's die beschikbaar zijn in meerdere talen:

  • SQL-API
  • MongoDB-API
  • Cassandra-API
  • Grafiek-API (Gremlin)
  • Tabel-API

In dit artikel wordt uitgelegd hoe u gegevens leest van en schrijft naar Azure Cosmos DB met behulp van Azure Databricks. Zie Big Data Analytics versnellen met behulp van de Apache Spark-connector naar Azure Cosmos DB voor meer actuele informatie over Azure Cosmos DB.

Bronnen:

Belangrijk

Deze connector ondersteunt de KERN-API (SQL) van Azure Cosmos DB. Gebruik de MongoDB Spark-connector voor de Cosmos DB voor MongoDB-API. Gebruik voor de Cassandra-API van Cosmos DB de Cassandra Spark-connector.

Vereiste bibliotheken maken en koppelen

  1. Download de nieuwste azure-cosmosdb-spark-bibliotheek voor de versie van Apache Spark die u uitvoert.
  2. Upload de gedownloade JAR-bestanden naar Databricks. Zie Bibliotheken.
  3. Installeer de geüploade bibliotheken in uw Databricks-cluster.