Databricks Runtime 6.3 för ML (stöds inte)

Databricks släppte den här bilden i januari 2020.

Databricks Runtime 6.3 för Machine Learning tillhandahåller en färdig miljö för maskininlärning och datavetenskap baserat på Databricks Runtime 6.3 (stöds inte). Databricks Runtime ML innehåller många populära maskininlärningsbibliotek, inklusive TensorFlow, PyTorch, Keras och XGBoost. Den stöder även distribuerad djupinlärningsträning med Horovod.

Mer information, inklusive instruktioner för att skapa ett Databricks Runtime ML-kluster, finns i AI och Machine Learning på Databricks.

Nya funktioner

Databricks Runtime 6.3 ML bygger på Databricks Runtime 6.3. Information om nyheter i Databricks Runtime 6.3 finns i viktig information om Databricks Runtime 6.3 (stöds inte).


Uppgraderade maskininlärningsbibliotek

  • PyTorch: 1.3.0 till 1.3.1
  • torchvision: 0.4.1 till 0.4.2 – innehåller en optimerad serverdel för videoläsare
  • MLflow: 1.4.0 till 1.5.0
    • Innehåller stöd för LightGBM-, XGBoost- och Gluon-smaker.
    • Åtgärdade ett fel där MLflow-projekt inte kunde köras mot Databricks Runtime ML-kluster.
    • Mer information finns i versionen MLflow 1.5.0.
  • Hyperopt: 0.2.1 till 0.2.2 – Uppdateringar inkludera:
    • En bugg har åtgärdats i ATPE (Adaptiv-TPE), där algoritmen inte fungerade korrekt med hp.choice och hp.randint.

    • Vissa buggar har åtgärdats med hjälp av tqdm, en Python-modul för rapportering av förlopp. Förloppsindikatorn var till exempel ibland felaktig vid körning av parallell .fmin()

    • Varnar nu för spark-aktivitetsförsök för tidskrävande utvärderingsversioner. När återförsök är aktiverade och utvärderingskörningar går långsamt skrivs det här meddelandet ut:

      SparkTrials found that the Spark conf 'spark.task.maxFailures' is set to 4, which will make trials re-run automatically if they fail.
      If failures can occur from bad hyperparameter settings, or if trials are very long-running, then retries may not be a good idea.
      Consider setting spark.conf.set('spark.task.maxFailures', '1') to prevent retries.
    • Andra små korrigeringar. Mer information finns i Hyperopt 0.2.2-versionen.


Åtgärdade ett problem som orsakade att vissa klustermått saknades, vilket ofta inträffar i GPU-kluster med flera GPU-noder.


Systemmiljön i Databricks Runtime 6.3 ML skiljer sig från Databricks Runtime 6.3 på följande sätt:


I följande avsnitt visas de bibliotek som ingår i Databricks Runtime 6.3 ML som skiljer sig från de som ingår i Databricks Runtime 6.3.

I detta avsnitt:

Bibliotek på den översta nivån

Databricks Runtime 6.3 ML innehåller följande bibliotek på den översta nivån:


Databricks Runtime 6.3 ML använder Conda för Python-pakethantering och innehåller många populära ML-paket. I följande avsnitt beskrivs Conda-miljön för Databricks Runtime 6.3 ML.

Python på CPU-kluster

Python på GPU-kluster

Spark-paket som innehåller Python-moduler

Spark-paket Python-modul Version
graphframes graphframes 0.7.0-db1-spark2.4
spark-deep-learning sparkdl 1.5.0-db12-spark2.4
tensorframes tensorframes 0.8.2-s_2.11


R-biblioteken är identiska med R-biblioteken i Databricks Runtime 6.3.

Java- och Scala-bibliotek (Scala 2.11-kluster)

Förutom Java- och Scala-bibliotek i Databricks Runtime 6.3 innehåller Databricks Runtime 6.3 ML följande JAR:er:

Grupp-ID Artefakt-ID Version
com.databricks spark-deep-learning 1.5.0-db12-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.15.0
ml.dmlc xgboost4j 0.90
ml.dmlc xgboost4j-spark 0.90
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.mlflow mlflow-client 1.4.0
org.tensorflow libtensorflow 1.15.0
org.tensorflow libtensorflow_jni 1.15.0
org.tensorflow spark-tensorflow-connector_2.11 1.15.0
org.tensorflow tensorflow 1.15.0
org.tensorframes tensorframes 0.8.2-s_2.11