Přehled knihovny Bulk Executor pro službu Azure Cosmos DB

PLATÍ PRO: ROZHRANÍ SQL API

Azure Cosmos DB je rychlá, flexibilní a globálně distribuovaná databázová služba navržená tak, aby elasticky škálovala na více instancí za účelem podpory následujících scénářů:

  • Velká propustnost čtení a zápisu (miliony operací za sekundu)
  • Ukládání velkých objemů (stovky terabajtů nebo ještě více) transakčních a provozních dat s předvídatelnou latencí v řádu milisekund

Knihovna Bulk Executor vám pomůže využít tuto obrovskou propustnost a úložiště. Knihovna Bulk Executor umožňuje provádět ve službě Azure Cosmos DB hromadné operace prostřednictvím rozhraní API pro hromadný import a hromadné aktualizace. Další informace o funkcích knihovny Bulk Executor najdete v následujících částech.

Poznámka

Knihovna bulk Executor v současné době podporuje operace importu a aktualizace a tato knihovna je podporována pouze účty rozhraní SQL API služby Azure Cosmos DB a rozhraní Gremlin API.

Důležité

Knihovna bulk executoru není v současné době podporována v bezserverových účtech. V .NET se doporučuje použít hromadnou podporu dostupnou ve verzi V3 sady SDK.

Klíčové funkce knihovny bulk executoru

  • Výrazně snižuje výpočetní prostředky na straně klienta potřebné k nasycení propustnosti přidělené kontejneru. Jedna aplikace s vlákny, která zapisuje data pomocí rozhraní API hromadného importu, dosahuje 10krát větší propustnost zápisu v porovnání s více vlákny aplikace, která zapisuje data paralelně a současně sytí procesoru klientského počítače.

  • Abstrahuje zdlouhavé úlohy psaní logiky aplikace pro zpracování omezování rychlosti požadavků, časových limitů požadavků a dalších přechodných výjimek efektivním zpracováním v rámci knihovny.

  • Poskytuje zjednodušený mechanismus pro aplikace provádějící hromadné operace pro horizontální navýšení kapacity. Jedna instance bulk executoru spuštěná na virtuálním počítači Azure může využívat více než 500 TISÍC RU/s a můžete dosáhnout vyšší propustnosti přidáním dalších instancí na jednotlivé klientské virtuální počítače.

  • Pomocí architektury horizontálního navýšení kapacity může hromadně importovat více než terabajt dat během jedné hodiny.

  • Může hromadně aktualizovat existující data v kontejnerech Azure Cosmos jako opravy.

Jak funguje hromadný exekutor?

Když se hromadná operace importu nebo aktualizace dokumentů aktivuje pomocí dávky entit, zpočátku se přehazují do kontejnerů odpovídajících rozsahu klíčů oddílů služby Azure Cosmos DB. V každém kontejneru, který odpovídá rozsahu klíčů oddílu, se rozdělí do mini dávek a každá mini-batch funguje jako datová část, která se potvrdí na straně serveru. Knihovna bulk executoru má integrovanou optimalizaci pro souběžné spouštění těchto minisáží jak v rozsahech klíčů oddílů, tak i napříč rozsahy klíčů oddílů. Následující obrázek znázorňuje, jak hromadný exekutor dávková data do různých klíčů oddílů:

Bulk executor architecture

Knihovna bulk executoru zajišťuje maximální využití propustnosti přidělené kolekci. Používá mechanismus řízení zahlcení ve stylu AIMD pro každý rozsah klíčů oddílů služby Azure Cosmos DB k efektivnímu zpracování omezování rychlosti a časových limitů.

Další kroky

  • Přečtěte si další informace o vyzkoušení ukázkových aplikací využívajících knihovnu bulk Executor v .NET a Javě.
  • Projděte si informace o sadě SDK hromadného exekutoru a poznámky k verzi v .NET a Javě.
  • Knihovna bulk executoru je integrovaná do konektoru Spark služby Cosmos DB, kde najdete další informace v článku o konektoru Spark služby Azure Cosmos DB .
  • Knihovna bulk executoru je také integrovaná do nové verze konektoru Azure Cosmos DB pro Azure Data Factory pro kopírování dat.