2019 juni

Dessa funktioner och förbättringar av Azure Databricks-plattformen släpptes i juni 2019.

Kommentar

Versioner mellanlagras. Ditt Azure Databricks-konto kanske inte uppdateras förrän upp till en vecka efter det första lanseringsdatumet.

Stöd för Lsv2-instanser är allmänt tillgängligt

24-26 juni 2019: Version 2.100

Azure Databricks har nu fullt stöd för Lsv2 VM-serien för hög dataflöde och hög IOPS-arbetsbelastning.

RStudio-integreringen är inte längre begränsad till kluster med hög samtidighet

6-11 juni 2019: Version 2.99

Nu kan du aktivera RStudio Server på standardkluster i Azure Databricks, utöver de kluster med hög samtidighet som redan stöds. Oavsett klusterläge fortsätter RStudio Server-integreringen att kräva att du inaktiverar alternativet för automatisk avslutning för klustret. Se RStudio på Azure Databricks.

MLflow 1.0

3 juni 2019

MLflow är en öppen källkod plattform för att hantera hela maskininlärningslivscykeln. Med MLflow kan dataexperter spåra och dela experiment lokalt eller i molnet, paketera och dela modeller mellan ramverk och distribuera modeller praktiskt taget var som helst.

Vi är glada över att kunna presentera lanseringen av MLflow 1.0 idag. 1.0-versionen markerar inte bara mognaden och stabiliteten för API:erna, utan lägger också till ett antal vanliga funktioner och förbättringar:

  • CLI omorganiserades och har nu dedikerade kommandon för artefakter, modeller, db (spårningsdatabasen) och server (spårningsservern).
  • Spårningsserversökning stöder en förenklad version av SQL WHERE -satsen. Förutom stöd för körningsmått och params har sökningen förbättrats för att stödja vissa körningsattribut och användar- och systemtaggar.
  • Lägger till stöd för x-koordinater i spårnings-API:et. Visualiseringskomponenterna för MLflow UI stöder nu även ritning av mått mot angivna x-koordinatvärden.
  • Lägger till en runs/log-batch REST API-slutpunkt samt Python-, R- och Java-metoder för loggning av flera mått, parametrar och taggar med en enda API-begäran.
  • För spårning stöds nu MLflow 1.0-klienten i Windows.
  • Lägger till stöd för HDFS som en backend för artefaktarkiv.
  • Lägger till ett kommando för att skapa en Docker-container vars standardinmatningspunkt hanterar den angivna MLflow Python-funktionsmodellen på port 8080 i containern.
  • Lägger till en experimentell ONNX-modellsmak .

Du kan visa den fullständiga listan över ändringar i MLflow-ändringsloggen.

Databricks Runtime 5.4 med Conda (Beta)

3 juni 2019

Viktigt!

Databricks Runtime med Conda finns i Beta. Innehållet i de miljöer som stöds kan ändras i kommande betaversioner. Ändringar kan inkludera listan över paket eller versioner av installerade paket. Databricks Runtime 5.4 med Conda bygger på Databricks Runtime 5.4 (stöds inte).

Vi är glada över att kunna introducera Databricks Runtime 5.4 med Conda, vilket gör att du kan dra nytta av Conda för att hantera Python-bibliotek och -miljöer. Den här körningen erbjuder två conda-rotmiljöalternativ när klustret skapas:

  • Databricks Standard-miljön innehåller uppdaterade versioner av många populära Python-paket. Den här miljön är avsedd som en drop-in ersättning för befintliga notebook-filer som körs på Databricks Runtime. Det här är standardmiljön för Databricks Conda-baserad körning.
  • Databricks Minimal miljö innehåller de minsta paket som krävs för PySpark- och Databricks Python Notebook-funktioner. Den här miljön är perfekt om du vill anpassa körningen med olika Python-paket.

Se fullständiga viktig information på Databricks Runtime 5.4 med Conda (stöds inte).

Databricks Runtime 5.4 for Machine Learning

3 juni 2019

Databricks Runtime 5.4 ML bygger på Databricks Runtime 5.4 (stöds inte). Den innehåller många populära maskininlärningsbibliotek, inklusive TensorFlow, PyTorch, Keras och XGBoost, och tillhandahåller distribuerad TensorFlow-utbildning med Horovod.

Den innehåller följande nya funktioner:

  • MLlib-integrering med MLflow (offentlig förhandsversion).
  • Hyperopt med den nya Klassen SparkTrials förinstallerad (offentlig förhandsversion).
  • HorovodRunner-utdata som skickas från Horovod till Spark-drivrutinsnoden visas nu i notebook-celler.
  • XGBoost Python-paketet är förinstallerat.

Mer information finns i Databricks Runtime 5.4 för ML (stöds inte).

Databricks Runtime 5.4

3 juni 2019

Databricks Runtime 5.4 är nu tillgängligt. Databricks Runtime 5.4 innehåller Apache Spark 2.4.2, uppgraderade Python-, R-, Java- och Scala-bibliotek och följande nya funktioner:

  • Delta Lake på Databricks lägger till Automatisk optimering (offentlig förhandsversion)
  • Använd din favoritserver för IDE och notebook-filer med Databricks Anslut
  • Biblioteksverktyg allmänt tillgängliga
  • Datakälla för binär fil

Mer information finns i Databricks Runtime 5.4 (stöds inte).