Azure Cosmos DB
Viktigt!
Den här dokumentationen har dragits tillbaka och kanske inte uppdateras. Se den officiella Github-lagringsplatsen för Cosmos DB Spark-anslutningsappen.
Azure Cosmos DB är Microsofts globalt distribuerade databas för flera datamodeller. Med Azure Cosmos DB kan du elastiskt och oberoende skala dataflöde och lagring i valfritt antal av Azures geografiska regioner. Den erbjuder garantier för dataflöde, svarstid, tillgänglighet och konsekvens med omfattande serviceavtal (SLA). Azure Cosmos DB tillhandahåller API:er för följande datamodeller, med SDK:er tillgängliga på flera språk:
- API för SQL
- MongoDB-API
- Cassandra-API
- Graph (Gremlin) API
- Tabell-API
Den här artikeln beskriver hur du läser data från och skriver data till Azure Cosmos DB med hjälp av Azure Databricks. Mer aktuell information om Azure Cosmos DB finns i Accelerera analys av stordata med hjälp av Apache Spark till Azure Cosmos DB-anslutningsappen.
Resurser:
Viktigt!
Den här anslutningsappen stöder KÄRN-API:et (SQL) i Azure Cosmos DB. För Cosmos DB för MongoDB API använder du MongoDB Spark-anslutningsappen. Använd Cassandra Spark-anslutningsappen för Cosmos DB Cassandra-API:et.
Skapa och bifoga nödvändiga bibliotek
- Ladda ned det senaste azure-cosmosdb-spark-biblioteket för den version av Apache Spark som du kör.
- Ladda upp de nedladdade JAR-filerna till Databricks. Se Bibliotek.
- Installera de uppladdade biblioteken i Databricks-klustret.