Udostępnij za pośrednictwem


Azure Cosmos DB

Ważne

Ta dokumentacja została wycofana i może nie zostać zaktualizowana. Zobacz oficjalne repozytorium Github łącznika Spark usługi Cosmos DB.

Azure Cosmos DB to wielomodelowa, globalnie rozproszona baza danych firmy Microsoft. Usługa Azure Cosmos DB umożliwia elastyczne i niezależne skalowanie przepływności i magazynu w dowolnej liczbie regionów geograficznych platformy Azure. Oferuje ona gwarancje przepływności, opóźnienia, dostępności i spójności z kompleksowymi umowami dotyczącymi poziomu usług (SLA). Usługa Azure Cosmos DB udostępnia interfejsy API dla następujących modeli danych z zestawami SDK dostępnymi w wielu językach:

  • Interfejs API SQL
  • Interfejs API usługi MongoDB
  • Interfejs API rozwiązania Cassandra
  • Interfejs API programu Graph (Gremlin)
  • Interfejs API tabel

W tym artykule wyjaśniono, jak odczytywać dane z usługi Azure Cosmos DB i zapisywać je przy użyciu usługi Azure Databricks. Aby uzyskać więcej najnowszych informacji na temat usługi Azure Cosmos DB, zobacz Przyspieszanie analizy danych big data przy użyciu łącznika apache Spark do usługi Azure Cosmos DB.

Zasoby:

Ważne

Ten łącznik obsługuje podstawowy interfejs API (SQL) usługi Azure Cosmos DB. W przypadku interfejsu API usługi Cosmos DB dla bazy danych MongoDB użyj łącznika Platformy Spark bazy danych MongoDB. W przypadku interfejsu API Cassandra usługi Cosmos DB użyj łącznika Cassandra Spark.

Tworzenie i dołączanie wymaganych bibliotek

  1. Pobierz najnowszą bibliotekę azure-cosmosdb-spark dla uruchomionej wersji platformy Apache Spark.
  2. Przekaż pobrane pliki JAR do usługi Databricks. Zobacz Biblioteki.
  3. Zainstaluj przekazane biblioteki w klastrze usługi Databricks.