Februar 2019February 2019

Diese Features und Azure Databricks Plattform-Verbesserungen wurden im Februar 2019 veröffentlicht.These features and Azure Databricks platform improvements were released in February 2019.

Hinweis

Releases werden bereitgestellt.Releases are staged. Ihr Azure Databricks Konto wird möglicherweise erst bis zu einer Woche nach dem ersten Veröffentlichungsdatum aktualisiert.Your Azure Databricks account may not be updated until up to a week after the initial release date.

Databricks Light allgemein verfügbarDatabricks Light generally available

26. Februar-5. März, 2019: Version 2,92February 26 - March 5, 2019: Version 2.92

Databricks Light (auch als Data Engineering Light bezeichnet) ist jetzt verfügbar.Databricks Light (also known as Data Engineering Light) is now available. Databricks Light ist die databricks-Verpackung der Open Source-Apache Spark Laufzeit.Databricks Light is the Databricks packaging of the open source Apache Spark runtime. Es bietet eine Runtimeoption für Aufträge, die ohne die Vorteile der erweiterten Leistung, Zuverlässigkeit oder automatischen Skalierung auskommen, die Databricks Runtime bietet.It provides a runtime option for jobs that don’t need the advanced performance, reliability, or autoscaling benefits provided by Databricks Runtime. Databricks Light kann nur verwendet werden, wenn Sie einen Cluster zum Ausführen eines JAR-, Python- oder spark-submit-Auftrags erstellen. Für Cluster, in denen Sie Workloads für interaktive oder Notebookaufträge ausführen, steht diese Runtime nicht zur Verfügung.You can select Databricks Light only when you create a cluster to run a JAR, Python, or spark-submit job; you cannot select this runtime for clusters on which you run interactive or notebook job workloads. Siehe databricks Light.See Databricks Light.

Verwalteter MLflow für Azure Databricks (Public Preview)Managed MLflow on Azure Databricks Public Preview

26. Februar-5. März, 2019: Version 2,92February 26 - March 5, 2019: Version 2.92

MLflow ist eine Open-Source-Plattform für die Verwaltung des gesamten Machine Learning-Lebenszyklus.MLflow is an open source platform for managing the end-to-end machine learning lifecycle. Es behandelt drei primäre Funktionen:It tackles three primary functions:

  • Nachverfolgen von Experimenten, um Parameter und Ergebnisse aufzuzeichnen und zu vergleichen.Tracking experiments to record and compare parameters and results.
  • Verwalten und Bereitstellen von Modellen aus einer Vielzahl von ml-Bibliotheken für eine Vielzahl von Modell Bereitstellungs-und Inferenz-Plattformen.Managing and deploying models from a variety of ML libraries to a variety of model serving and inference platforms.
  • Verpacken von ml-Code in ein wiederverwendbares, reproduzierbares Formular, das gemeinsam mit anderen datenwissenschaftlern verwendet oder in die Produktion übertragen werdenPackaging ML code in a reusable, reproducible form to share with other data scientists or transfer to production.

Azure Databricks bietet nun eine vollständig verwaltete und gehostete Version von mlflow, die in Sicherheitsfeatures für Unternehmen, hohe Verfügbarkeit und andere Azure Databricks Arbeitsbereichs Funktionen wie Experiment Verwaltung, Lauf Zeitverwaltung und Notebook-Revisions Erfassung integriert ist.Azure Databricks now provides a fully managed and hosted version of MLflow integrated with enterprise security features, high availability, and other Azure Databricks workspace features such as experiment management, run management, and notebook revision capture. MLflow in Azure Databricks bietet eine integrierte Oberfläche, über die die Trainingsläufe von Machine Learning-Modellen in einer sicheren Umgebung nachverfolgt und Machine Learning-Projekte ausgeführt werden können.MLflow on Azure Databricks offers an integrated experience for tracking and securing machine learning model training runs and running machine learning projects. Durch die Verwendung von verwaltetem mlflow auf Azure Databricks erhalten Sie die Vorteile beider Plattformen, einschließlich der folgenden:By using managed MLflow on Azure Databricks, you get the advantages of both platforms, including:

  • Arbeitsbereiche: Überwachen und organisieren Sie Experimente und Ergebnisse in Azure Databricks Arbeitsbereichen zusammen mit einem gehosteten mlflow-Überwachungs Server und integrierter Experiment Oberfläche.Workspaces: Collaboratively track and organize experiments and results within Azure Databricks Workspaces with a hosted MLflow Tracking Server and integrated experiment UI. Wenn Sie mlflow in Notebooks verwenden, erfasst Azure Databricks automatisch Notebook Revisionen, sodass Sie denselben Code reproduzieren und später ausführen können.When you use MLflow in notebooks, Azure Databricks automatically captures notebook revisions so you can reproduce the same code and runs later.
  • Sicherheit: Profitieren Sie von einem gemeinsamen Sicherheitsmodell für den gesamten ml-Lebenszyklus über ACLs.Security: Take advantage of one common security model for the entire ML lifecycle via ACLs.
  • Aufträge: Führen Sie mlflow-Projekte als Azure Databricks Aufträge Remote und direkt aus Azure Databricks Notebooks aus.Jobs: Run MLflow projects as Azure Databricks jobs remotely and directly from Azure Databricks notebooks.

Im folgenden finden Sie ein Beispiel für einen nach Verfolgungs Workflow in einem Azure Databricks-Arbeitsbereich:Here’s a demo of a tracking workflow in an Azure Databricks Workspace:

Nachverfolgen von Ausführungen und organisieren des Experiment WorkflowsTrack runs and organize experiment workflow

Weitere Informationen finden Sie unter Experimente und Ausführen von mlflow-Projekten auf Azure Databricks.For details, see Experiments and Run MLflow Projects on Azure Databricks.

Azure Data Lake Storage Gen2-Connector allgemein verfügbarAzure Data Lake Storage Gen2 connector is generally available

15. Februar 2019February 15, 2019

Azure Data Lake Storage Gen2 (ADLS Gen2), die Data Lake-Lösung der nächsten Generation für Big Data Analytics, ist nun allgemein verfügbar, wie es der ADLS Gen2 Connector für Azure Databricks ist.Azure Data Lake Storage Gen2 (ADLS Gen2), the next-generation data lake solution for big data analytics, is now GA, as is the ADLS Gen2 connector for Azure Databricks. Wir freuen uns, Ihnen ankündigen zu können, dass ADLS Gen2 databricks-Delta unterstützt, wenn Sie Cluster auf Databricks Runtime 5,2 und höher ausführen.We are also pleased to announce that ADLS Gen2 supports Databricks Delta when you are running clusters on Databricks Runtime 5.2 and above.

Python 3 jetzt Standard bei der ClustererstellungPython 3 now the default when you create clusters

12-19, 2019. Februar: Version 2,91February 12-19, 2019: Version 2.91

Die Standard-Python-Version für Cluster, die über die Benutzeroberfläche erstellt wurden, wurde von Python 2 zu python 3 gewechselt.The default Python version for clusters created using the UI has switched from Python 2 to Python 3. Der Standardwert für Cluster, die mit der Rest-API erstellt wurden, ist weiterhin python 2.The default for clusters created using the REST API is still Python 2.

Vorhandene Cluster ändern ihre Python-Versionen nicht.Existing clusters will not change their Python versions. Wenn Sie jedoch die python 2-Standardeinstellung beim Erstellen neuer Cluster übernommen haben, müssen Sie auf die Auswahl Ihrer Python-Version achten.But if you’ve been in the habit of taking the Python 2 default when you create new clusters, you’ll need to start paying attention to your Python version selection.

Standard-Python-VersionDefault Python version

Siehe Python-Version.See Python version.

Delta Lake allgemein verfügbarDelta Lake generally available

1. Februar 2019February 1, 2019

Jetzt kann jeder Benutzer die Vorteile der leistungsfähigen Transaktions Speicher Ebene von databricks und der äußerst schnellen Lesevorgänge nutzen: ab dem 1. Februar ist Delta Lake allgemein verfügbar und für alle unterstützten Versionen von Databricks Runtime verfügbar.Now everyone can get the benefits of Databricks Delta’s powerful transactional storage layer and super-fast reads: as of February 1, Delta Lake is GA and available on all supported versions of Databricks Runtime. Weitere Informationen zu Delta finden Sie unter Delta Lake.For information about Delta, see the Delta Lake.