Doporučení k optimalizaci pro Azure Databricks

Azure Databricks poskytuje řadu optimalizací podporujících celou řadu úloh v lakehouse, od rozsáhlého zpracování ETL až po ad hoc interaktivní dotazy. Mnoho z těchto optimalizací probíhá automaticky. Jejich výhody získáte jednoduše pomocí Azure Databricks. Většina funkcí databricks Runtime navíc vyžaduje Delta Lake, výchozí vrstvu úložiště, která se používá k vytváření tabulek v Azure Databricks.

Azure Databricks konfiguruje výchozí hodnoty, které optimalizují většinu úloh. V některých případech ale změna nastavení konfigurace zvýší výkon.

Vylepšení výkonu databricks Runtime

Poznámka

Využijte nejnovější databricks Runtime k využití nejnovějších vylepšení výkonu. Všechna zde uvedená chování jsou ve výchozím nastavení povolená v Databricks Runtime 10.4 LTS a novějších verzích.

Doporučení Databricks pro vyšší výkon

Chování výslovného souhlasu

  • Azure Databricks ve výchozím nastavení poskytuje záruku serializovatelné izolace zápisu. Změna úrovně izolace na serializovatelnou může snížit propustnost pro souběžné operace, ale může být nutná, pokud je vyžadována serializovatelnost čtení.
  • Indexy filtru bloom můžete použít ke snížení pravděpodobnosti skenování datových souborů, které neobsahují záznamy odpovídající dané podmínce.