Azure Cosmos DB

Önemli

Bu belge kullanımdan kaldırılmıştır ve güncelleştirilmeyebilir. Resmi Cosmos DB Spark bağlayıcısı Github deposuna bakın.

Azure Cosmos DB, Microsoft’un global olarak dağıtılmış çok modelli veritabanıdır. Azure Cosmos DB, herhangi bir sayıda Azure coğrafi bölgesinde aktarım hızını ve depolamayı esnek ve bağımsız olarak ölçeklendirmenizi sağlar. Kapsamlı hizmet düzeyi sözleşmeleri (SLA) ile aktarım hızı, gecikme süresi, kullanılabilirlik ve tutarlılık garantileri sunar. Azure Cosmos DB, birden çok dilde kullanılabilen SDK'larla aşağıdaki veri modelleri için API'ler sağlar:

  • SQL API'si
  • MongoDB API’si
  • Cassandra API’si
  • Graph (Gremlin) API'si
  • Tablo API’si

Bu makalede, Azure Databricks kullanarak Azure Cosmos DB'den veri okuma ve Azure Cosmos DB'ye veri yazma işlemleri açıklanmaktadır. Azure Cosmos DB hakkında en güncel ayrıntılar için bkz . Apache Spark-Azure Cosmos DB bağlayıcısını kullanarak büyük veri analizini hızlandırma.

Kaynaklar:

Önemli

Bu bağlayıcı, Azure Cosmos DB'nin çekirdek (SQL) API'sini destekler. MongoDB için Cosmos DB API'sinde MongoDB Spark bağlayıcısını kullanın. Cosmos DB Cassandra API'sinde Cassandra Spark bağlayıcısını kullanın.

Gerekli kitaplıkları oluşturma ve ekleme

  1. Çalıştırdığınız Apache Spark sürümü için en son azure-cosmosdb-spark kitaplığını indirin.
  2. İndirilen JAR dosyalarını Databricks'e yükleyin. Bkz. Kitaplıklar.
  3. Databricks kümenize karşıya yüklenen kitaplıkları yükleyin.