Clustery

Cluster Azure Databricks je sada výpočetních prostředků a konfigurací, na kterých se provozují úlohy přípravy dat, datových věd a analýzy dat, jako jsou produkční kanály extrakce, transformace a načítání, analýzy streamování, ad hoc analýzy a strojové učení.

Tyto úlohy se spouští jako sada příkazů v poznámkovém bloku nebo jako automatizovaná úloha. Azure Databricks rozlišuje mezi clustery pro obecné účely a clustery úlohy. Clustery pro obecné účely se používají ke spolupráci při analýze dat pomocí interaktivních poznámkových bloků. Clustery úlohy se používají k provozování rychlých a robustních automatizovaných úloh.

  • Cluster pro obecné účely můžete vytvořit pomocí uživatelského rozhraní, rozhraní příkazového řádku nebo rozhraní REST API. Cluster pro obecné účely můžete ručně ukončit a restartovat. Takové clustery mohou být sdíleny mezi několika uživateli, kteří spolupracují na interaktivní analýze.
  • Plánovač úloh Azure Databricks vytvoří cluster úlohy, když spustíte nějakou úlohu v novém clusteru úlohy, a ukončí ho, když je tato úloha hotová. Cluster úlohy nelze restartovat.

Tato část popisuje, jak pracovat s úlohami pomocí uživatelského rozhraní. Další metody najdete v článku Rozhraní příkazového řádku pro clustery a Rozhraní API pro clustery.

Tato část se zaměřuje spíše na clustery pro obecné účely než clustery úlohy, i když se mnohé z popsaných nástrojů pro konfiguraci a správu vztahují na oba typy clusterů. Další informace o vytváření clusterů úlohy najdete v článku Úlohy.

Důležité

Azure Databricks uchovává informace o konfiguraci clusteru až pro 70 clusterů pro obecné účely ukončených v posledních 30 dnech a až pro 30 clusterů úlohy nedávno ukončených plánovačem úloh. Pokud chcete konfiguraci clusteru pro obecné účely zachovat déle než 30 dnů po jeho ukončení, může správce připnout cluster do seznamu clusterů.

V této části: