Azure Cosmos DB

Viktigt!

Den här dokumentationen har dragits tillbaka och kanske inte uppdateras. Se den officiella Github-lagringsplatsen för Cosmos DB Spark-anslutningsappen.

Azure Cosmos DB är Microsofts globalt distribuerade databas för flera datamodeller. Med Azure Cosmos DB kan du elastiskt och oberoende skala dataflöde och lagring i valfritt antal av Azures geografiska regioner. Den erbjuder garantier för dataflöde, svarstid, tillgänglighet och konsekvens med omfattande serviceavtal (SLA). Azure Cosmos DB tillhandahåller API:er för följande datamodeller, med SDK:er tillgängliga på flera språk:

  • API för SQL
  • MongoDB-API
  • Cassandra-API
  • Graph (Gremlin) API
  • Tabell-API

Den här artikeln beskriver hur du läser data från och skriver data till Azure Cosmos DB med hjälp av Azure Databricks. Mer aktuell information om Azure Cosmos DB finns i Accelerera analys av stordata med hjälp av Apache Spark till Azure Cosmos DB-anslutningsappen.

Resurser:

Viktigt!

Den här anslutningsappen stöder KÄRN-API:et (SQL) i Azure Cosmos DB. För Cosmos DB för MongoDB API använder du MongoDB Spark-anslutningsappen. Använd Cassandra Spark-anslutningsappen för Cosmos DB Cassandra-API:et.

Skapa och bifoga nödvändiga bibliotek

  1. Ladda ned det senaste azure-cosmosdb-spark-biblioteket för den version av Apache Spark som du kör.
  2. Ladda upp de nedladdade JAR-filerna till Databricks. Se Bibliotek.
  3. Installera de uppladdade biblioteken i Databricks-klustret.