ML için Databricks Runtime 5.4 (desteklenmiyor)
Databricks bu görüntüyü Haziran 2019'da yayımladı.
Machine Learning için Databricks Runtime 5.4, Databricks Runtime 5.4 (desteklenmeyen) tabanlı makine öğrenmesi ve veri bilimi için kullanıma hazır bir ortam sağlar. Databricks Runtime ML, TensorFlow, PyTorch, Keras ve XGBoost gibi birçok popüler makine öğrenmesi kitaplığı içerir. Horovod kullanarak dağıtılmış derin öğrenme eğitimini de destekler.
Databricks Runtime ML kümesi oluşturma yönergeleri de dahil olmak üzere daha fazla bilgi için bkz . Databricks'te AI ve Machine Learning.
Yeni özellikler
Databricks Runtime 5.4 ML, Databricks Runtime 5.4'ün üzerine kurulmuştur. Databricks Runtime 5.4'teki yenilikler hakkında bilgi için bkz . Databricks Runtime 5.4 (desteklenmeyen) sürüm notları.
Databricks Runtime 5.4 ML, kitaplık güncelleştirmelerine ek olarak aşağıdaki yeni özellikleri de sunar:
Dağıtılmış Hyperopt + otomatik MLflow izleme
Databricks Runtime 5.4 ML, hiper parametre ayarlamasını ölçeklendirmek ve basitleştirmek için Apache Spark tarafından desteklenen yeni bir Hyperopt uygulaması sunar. Hyperopt deneme çalıştırmalarını Apache Spark kullanarak birden çok makine ve düğüm arasında dağıtmak için yeni Trials
bir sınıf SparkTrials
uygulanır. Ayrıca, ayarlanmış hiper parametreler ve hedeflenen ölçümlerle birlikte tüm ayarlama denemeleri otomatik olarak MLflow çalıştırmalarına kaydedilir. Bkz. scikit-learn ve MLflow ile hiper parametre ayarlamasını paralelleştirme.
Önemli
Bu özellik Genel Önizlemededir.
Apache Spark MLlib + otomatik MLflow izleme
Databricks Runtime 5.4 ML, PySpark ayarlama algoritmaları ve TrainValidationSplit
kullanılarak uygun modeller için MLflow çalıştırmalarının CrossValidator
otomatik olarak günlüğe kaydedilmesini destekler. Bkz. Apache Spark MLlib ve otomatik MLflow izleme. Bu özellik Databricks Runtime 5.4 ML'de varsayılan olarak açıktır ancak Databricks Runtime 5.3 ML'de varsayılan olarak kapalıdır.
Önemli
Bu özellik Genel Önizlemededir.
HorovodRunner geliştirmesi
Horovod'dan Spark sürücü düğümüne gönderilen çıkış artık not defteri hücrelerinde görünür.
XGBoost Python paket güncelleştirmesi
XGBoost Python paketi 0.80 yüklüdür.
Sistem ortamı
Databricks Runtime 5.4 ML'deki sistem ortamı, Databricks Runtime 5.4'ten aşağıdaki gibi farklıdır:
- Python: Python 2 kümeleri için 2.7.15 ve Python 3 kümeleri için 3.6.5.
- DBUtils: Databricks Runtime 5.4 ML, Kitaplık yardımcı programı (dbutils.library) (eski) içermez.
- GPU kümeleri için aşağıdaki NVIDIA GPU kitaplıkları:
- Tesla sürücüsü 396.44
- CUDA 9.2
- CUDNN 7.2.1
Kitaplık
Aşağıdaki bölümlerde Databricks Runtime 5.4 ML'de bulunan ve Databricks Runtime 5.4'teki kitaplıklardan farklı kitaplıklar listelenmiştir.
Üst katman kitaplıkları
Databricks Runtime 5.4 ML aşağıdaki üst katman kitaplıklarını içerir:
Python kitaplıkları
Databricks Runtime 5.4 ML, Python paket yönetimi için Conda kullanır. Sonuç olarak, yüklü Python kitaplıklarında Databricks Runtime ile karşılaştırıldığında önemli farklılıklar vardır. Conda paket yöneticisi kullanılarak yüklenen sağlanan Python paketlerinin ve sürümlerinin tam listesi aşağıda verilmiştir.
Kitaplık | Sürüm | Kitaplık | Sürüm | Kitaplık | Sürüm |
---|---|---|---|---|---|
absl-py | 0.7.1 | argparse | 1.4.0 | asn1crypto | 0.24.0 |
Astor | 0.7.1 | backports-abc | 0,5 | backports.functools-lru-cache | 1.5 |
backports.weakref | 1.0.post1 | bcrypt | 3.1.6 | Çamaşır suyu | 2.1.3 |
Boto | 2.48.0 | boto3 | 1.7.62 | botocore | 1.10.62 |
sertifikalı | 2018.04.16 | cffi | 1.11.5 | chardet | 3.0.4 |
cloudpickle | 0.5.3 | colorama | 0.3.9 | yapılandırmaparser | 3.5.0 |
Şifreleme | 2.2.2 | Cycler | 0.10.0 | Cython | 0.28.2 |
Dekoratör | 4.3.0 | docutils | 0,14 | Entrypoints | 0.2.3 |
enum34 | 1.1.6 | et-xmlfile | 1.0.1 | funcsigs | 1.0.2 |
functools32 | 3.2.3-2 | fusepy | 2.0.4 | Gelecek | 0.17.1 |
Vadeli | 3.2.0 | Gast | 0.2.2 | grpcio | 1.12.1 |
h5py | 2.8.0 | horovod | 0.16.0 | html5lib | 1.0.1 |
hyperopt | 0.1.2.db4 | ıdna | 2,6 | ıpaddress | 1.0.22 |
ipython | 5.7.0 | ipython_genutils | 0.2.0 | jdcal | 1.4 |
Jinja2 | 2.10 | jmespath | 0.9.4 | jsonschema | 2.6.0 |
jupyter-client | 5.2.3 | jupyter-core | 4.4.0 | Keras | 2.2.4 |
Keras Uygulamaları | 1.0.7 | Keras-Preprocessing | 1.0.9 | kiwisolver | 1.1.0 |
linecache2 | 1.0.0 | llvmlite | 0.23.1 | lxml | 4.2.1 |
Markdown | 3.1.1 | İşaretlemeyi Kasa | 1.0 | matplotlib | 2.2.2 |
yanlış | 0.8.3 | mkl-fft | 1.0.0 | mkl-random | 1.0.1 |
mleap | 0.8.1 | Sahte | 2.0.0 | msgpack | 0.5.6 |
nbconvert | 5.3.1 | nbformat | 4.4.0 | networkx | 2.2 |
Burun | 1.3.7 | burun dışlama | 0.5.0 | numba | 0.38.0+0.g2a2b772fc.dirty |
numpy | 1.14.3 | olefile | 0.45.1 | openpyxl | 2.5.3 |
pandas | 0.23.0 | pandocfilters | 1.4.2 | paramiko | 2.4.1 |
pathlib2 | 2.3.2 | Patsy | 0.5.0 | pbr | 5.1.3 |
pexpect | 4.5.0 | pickleshare | 0.7.4 | Yastık | 5.1.0 |
Pip | 10.0.1 | Kat | 3.11 | prompt-toolkit | 1.0.15 |
protobuf | 3.7.1 | psutil | 5.6.2 | psycopg2 | 2.7.5 |
ptyprocess | 0.5.2 | serçe | 0.12.1 | pyasn1 | 0.4.5 |
pycparser | 2.18 | Pygments | 2.2.0 | pymongo | 3.8.0 |
PyNaCl | 1.3.0 | pyOpenSSL | 18.0.0 | pyparsing | 2.2.0 |
PySocks | 1.6.8 | Python | 2.7.15 | python-dateutil | 2.7.3 |
pytz | 2018.4 | PyYAML | 5.1 | pyzmq | 17.0.0 |
istekler | 2.18.4 | s3transfer | 0.1.13 | scandir | 1.7 |
scikit-learn | 0.19.1 | scipy | 1.1.0 | Sinan | 0.8.1 |
kurulum araçları | 39.1.0 | simplegeneric | 0.8.1 | singledispatch | 3.4.0.3 |
Altı | 1.11.0 | statsmodeller | 0.9.0 | altişlem32 | 3.5.4 |
tensorboard | 1.12.2 | tensorboardX | 1.6 | tensorflow | 1.12.0 |
termcolor | 1.1.0 | test yolu | 0.3.1 | Meşale | 0.4.1 |
torchvision | 0.2.1 | Kasırga | 5.0.2 | tqdm | 4.32.1 |
traceback2 | 1.4.0 | traitlets | 4.3.2 | unittest2 | 1.1.0 |
urllib3 | 1.22 | virtualenv | 16.0.0 | wcwidth | 0.1.7 |
webencodings | 0.5.1 | Werkzeug | 0.14.1 | Tekerlek | 0.31.1 |
kaydırma | 1.10.11 | wsgiref | 0.1.2 |
Ayrıca, aşağıdaki Spark paketleri Python modüllerini içerir:
Spark Paketi | Python Modülü | Sürüm |
---|---|---|
graf çerçeveleri | graf çerçeveleri | 0.7.0-db1-spark2.4 |
spark-deep-learning | sparkdl | 1.5.0-db3-spark2.4 |
tensorframes | tensorframes | 0.6.0-s_2.11 |
R kitaplıkları
R kitaplıkları Databricks Runtime 5.4'teki R Kitaplıklarıyla aynıdır.
Java ve Scala kitaplıkları (Scala 2.11 kümesi)
Databricks Runtime 5.4'teki Java ve Scala kitaplıklarına ek olarak, Databricks Runtime 5.4 ML aşağıdaki JAR'leri içerir:
Grup Kimliği | Yapıt Kimliği | Sürüm |
---|---|---|
com.databricks | spark-deep-learning | 1.5.0-db3-spark2.4 |
com.typesafe.akka | akka-actor_2.11 | 2.3.11 |
ml.combust.mleap | mleap-databricks-runtime_2.11 | 0.13.0 |
ml.dmlc | xgboost4j | 0,81 |
ml.dmlc | xgboost4j-spark | 0,81 |
org.graphframes | graphframes_2.11 | 0.7.0-db1-spark2.4 |
org.tensorflow | libtensorflow | 1.12.0 |
org.tensorflow | libtensorflow_jni | 1.12.0 |
org.tensorflow | spark-tensorflow-connector_2.11 | 1.12.0 |
org.tensorflow | tensorflow | 1.12.0 |
org.tensorframes | tensorframes | 0.6.0-s_2.11 |