Entornos de ejecución de Databricks

Los entornos de ejecución de Databricks son el conjunto de componentes principales que se ejecutan en clústeres de Azure Databricks. Azure Databricks ofrece varios tipos de entornos de ejecución:

  • Databricks Runtime

    Databricks Runtime incluye Apache Spark, pero también agrega una serie de componentes y actualizaciones que mejoran considerablemente la facilidad de uso, el rendimiento y la seguridad en el análisis de macrodatos.

  • Databricks Runtime para Machine Learning

    Databricks Runtime ML es una variante de Databricks Runtime que agrega varias bibliotecas de aprendizaje automático populares, como TensorFlow, Keras, PyTorch y XGBoost.

  • Photon

    Photon es el motor nativo de consultas vectorizadas de Azure Databricks que ejecuta cargas de trabajo SQL de forma más rápida y reduce el costo total por carga de trabajo.

  • Databricks Light

    Databricks Light proporciona una opción de entorno de ejecución para los trabajos que no necesitan las ventajas de rendimiento avanzado, confiabilidad y escalado automático que proporciona Databricks Runtime.

  • Databricks Runtime para Genomics (en desuso)

    Databricks Runtime para Genomics es una variante de Databricks Runtime optimizada para trabajar con datos genómicos y biomédicos.

Puede elegir entre las distintas versiones admitidas del entorno de ejecución cuando cree un clúster.

Para obtener información sobre el contenido de cada versión del entorno de ejecución, consulte las notas de la versión.