Databricks 运行时

Databricks 运行时是在 Azure Databricks 群集上运行的核心组件集。 Azure Databricks 提供多种类型的运行时。

  • Databricks Runtime

    Databricks Runtime 包括 Apache Spark,但还添加了许多可以显著提高大数据分析可用性、性能和安全性的组件与更新。

  • 用于机器学习的 Databricks Runtime

    Databricks Runtime ML 是 Databricks Runtime 的变体,其中添加了多个常用机器学习库(包括 TensorFlow、Keras、PyTorch 和 XGBoost)。

  • Photon

    Photon 是 Azure Databricks 原生向量化查询引擎,可更快地运行 SQL 工作负载,并降低每个工作负载的总成本。

  • Databricks Light

    Databricks Light 为不需要由 Databricks Runtime 提供的高级性能、可靠性或自动缩放优势的作业提供了运行时选项。

  • 用于基因组学的 Databricks Runtime(已弃用)

    用于基因组学的 Databricks Runtime 是 Databricks Runtime 的变体,已针对处理基因组和生物医学数据而进行了优化。

创建群集时,可从受支持的运行时版本中进行选择。

有关每个运行时变体的内容的信息,请参阅发行说明