Juni 2021

Diese Features und Azure Databricks-Plattformverbesserungen wurden im Juni 2021 veröffentlicht.

Hinweis

Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung oder später aktualisiert.

Korrektur: Repos für Git ist in neuen und vorhandenen Arbeitsbereichen in einigen Regionen standardmäßig aktiviert.

30. Juni 2021

In einem Versionshinweis für den 2. Juni 2021hat Databricks angekündigt, dass Repos für Git in einigen Regionen in neuen Arbeitsbereichen standardmäßig aktiviert sind. Dabei wurde jedoch eine Information vergessen: Repos für Git werden auch in bestehenden Arbeitsbereichen aktiviert, wenn die Notebook Git-Versionsverwaltung bereits aktiviert ist. Der ursprüngliche Versionshinweis wurde aktualisiert.

Änderungen an Feature Store-Berechtigungen

28. Juni bis 6. Juli 2021: Version 3.49

Benutzer*innen mit der Berechtigung CAN_VIEW_METADATA in einer Featuretabelle können diese nun in Onlineshops veröffentlichen.

Verbesserter Zugriff auf Ergebnisse in der MLflow-Tabelle „Runs“

28. Juni bis 6. Juli 2021: Version 3.49

Änderungen an der MLflow-Ausführungstabelle ermöglichen einen schnelleren Zugriff auf Ergebnisse.

  • Die Metrikspalten werden nun vor den Parameterspalten angezeigt, sodass die beste Ausführung einfacher zu ermitteln ist.
  • In der Spalte Startzeit wird jetzt das Alter der Ausführung und nicht mehr die Startzeit angezeigt. Dadurch wird die Breite der Spalte reduziert, und es können weitere Informationen ohne horizontales Scrollen angezeigt werden. Zeigen Sie auf den Wert in der Spalte, um die Startzeit anzuzeigen.

Auf die Startzeit zeigen

Bessere Kostensichtbarkeit für Delta-Live-Tabellen

28. Juni bis 6. Juli 2021: Version 3.49

Wenn Sie eine neue Pipeline erstellen oder die Benutzeroberfläche für Pipelinedetails anzeigen, wird nun die DBU pro Stunde für den Delta Live Tables-Standardcluster angezeigt.

Erweiterte Datenqualitätseinschränkungen für Delta-Live-Tabellen

28. Juni bis 6. Juli 2021: Version 3.49

Ab jetzt können Sie die Python-APIs expect_all_or_fail, expect_all_or_drop und expect_all verwenden, um für Delta Live Tables-Datasets mehrere Datenqualitätseinschränkungen festzulegen. Diese APIs sind nützlich, wenn Sie eine Bibliothek allgemeiner Erwartungen auf ein oder mehrere Datasets in einer Pipeline anwenden. Weitere Informationen finden Sie unter Verwalten der Datenqualität mit Delta Live Tables.

API-Änderungen zum Aktualisieren und Ersetzen von IP-Adresslisten

28. Juni bis 6. Juli 2021: Version 3.49

Mit einem neuen PATCH-Vorgang für /ip-access-lists/<list-id> in der Databricks-REST-API 2.0 können die einzelnen Werte in einer vorhandenen IP-Adressliste programmgesteuert aktualisiert werden. Weitere Informationen finden Sie unter Aktualisieren einer IP-Zugriffsliste.

Mit dem vorhandenen PUT-Vorgang für /ip-access-lists/<list-id> in der Databricks-REST-API 2.0 kann nun der Inhalt einer vorhandenen IP-Adressliste programmgesteuert ersetzt und gleichzeitig die ursprüngliche interne ID der Liste beibehalten werden. Weitere Informationen finden Sie unter Ersetzen einer IP-Zugriffsliste.

Databricks-ODBC-Treiber 2.6.17

22. Juni 2021

Wir haben Version 2.6.17 des Databricks-ODBC-Treibers veröffentlicht (Download). Dieses Release bietet Unterstützung für Cloud Fetch, einen Mechanismus zum parallelen Abrufen von Daten über Cloudspeicher, mit dem Daten schneller in BI-Tools geladen werden. Mit diesem Release wird auch die Latenz verringert, da es keine unnötigen Roundtrips zwischen dem Client und Databricks Runtime mehr gibt. Weitere Informationen hierzu finden Sie unter How We Achieved High-bandwidth Connectivity With BI Tools (Erreichen von Konnektivität mit hoher Bandbreite bei BI-Tools).

Der Support für die Databricks Runtime 7.5-Serie läuft aus.

16. Juni 2021

Der Support für Databricks Runtime 7.5, Databricks Runtime 7.5 für Machine Learning und Databricks Runtime 7.5 für Genomics wurde am 16. Juni eingestellt. Weitere Informationen finden Sie unter Supportlebenszyklus für Databricks Runtime.

Optimieren der Leistung und Steuern der Kosten mit verschiedenen Pools für den Treiberknoten und Workerknoten

14. bis 21. Juni 2021: Version 3.48

Sie können ihren Cluster jetzt optimieren, indem Sie ihn an einen anderen Pool für den Treiberknoten und die Workerknoten anfügen. Beispielsweise können Sie einen computeoptimierten Pool für den Treiberknoten und einen speicheroptimierten Pool für Workerknoten verwenden. Dies hilft Ihnen auch bei der Kostenkontrolle, da den einzelnen Instanzpools unterschiedliche Tags zugewiesen werden können. Bei Bedarf können Sie denselben Pool für Treiber und Workerknoten verwenden.

Weitere Informationen finden Sie unter Poolkonfigurationsreferenz.

Registrierungsweite Berechtigungen für die Modellregistrierung

14. bis 21. Juni 2021: Version 3.48

Ab dieser Version können für alle Modelle in der Modellregistrierung eines Arbeitsbereichs Standardmodellberechtigungen festgelegt werden. Auf dieser Ebene festgelegte Berechtigungen gelten für alle neuen und vorhandenen Modelle, die in der Modellregistrierung in diesem Arbeitsbereich registriert sind. Weitere Informationen finden Sie unter MLFlow model ACLs.

Das Basisverzeichnis eines Benutzers ist nicht mehr geschützt, wenn Sie einen Benutzer mithilfe der SCIM-API löschen

14. bis 21. Juni 2021: Version 3.48

Wenn Sie einen Benutzer mithilfe der SCIM-API löschen, ist das Stammverzeichnis des Benutzers nicht mehr geschützt, und ein Arbeitsbereichsadministrator kann ihn löschen. Dieses Verhalten entspricht dem, was geschieht, wenn Sie einen Benutzer über die Verwaltungskonsole löschen.

Databricks Runtime 8.3 und 8.3 ML sind allgemein verfügbar; 8.3 Photon befindet sich in der Public Preview

8. Juni 2021

Databricks Runtime 8.3 und 8.3 ML sind jetzt allgemein verfügbar. 8.3 Photon befindet sich in der Phase der öffentlichen Vorschau.

Weitere Informationen finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 8.3 (nicht unterstützt) und Databricks Runtime 8.3 für ML (nicht unterstützt).

Zugriffssteuerung (GA) für Python und SQL-Tabellen

8. Juni 2021

Mit der Tabellenzugriffssteuerung können Sie den Zugriff auf Ihre Daten programmgesteuert mithilfe des auf Azure Databricks-Sichten basierenden Zugriffssteuerungsmodells erteilen und widerrufen. Die Tabellenzugriffssteuerung ist in zwei Versionen verfügbar: nur SQL und Python und SQL. Bisher war nur die Tabellenzugriffssteuerung „nur SQL“ allgemein verfügbar. Jetzt ist die Tabellenzugriffssteuerung „Python und SQL“ allgemein verfügbar. Weitere Informationen finden Sie unter Aktivieren der Hive-Metastore-Tabellenzugriffssteuerung für einen Cluster (Legacy).

Benutzeroberfläche und API von Aufträgen zeigen jetzt den Besitzer einer Auftragsausführung an

2. bis 7. Juni 2021: Version 3.47

Die Benutzeroberfläche und die API für Aufträge enthalten jetzt den Benutzer, unter dem der Auftrag ausgeführt wird, sodass die Berechtigungen für Aufträge einfacher zu verstehen, zu debuggen und zu überwachen sind. Dies ist ein schreibgeschützter Wert, der auf den Auftragsersteller festgelegt ist, wenn die Auftragszugriffssteuerung deaktiviert ist, oder auf die Berechtigung is_owner des Auftrags, wenn die Auftragszugriffssteuerung aktiviert ist. Weitere Informationen zum Verwalten von Auftragsberechtigungen finden Sie unter Zugriff für einen Auftrag steuern.

Schützen sensibler Spark-Konfigurationseigenschaften und Umgebungsvariablen mithilfe von Geheimnissen (Public Preview)

7. Juni 2021

Sie können sensible Spark-Konfigurationseigenschaften und Umgebungsvariablen mithilfe von Geheimnissen schützen. Die abgerufenen Geheimnisse werden in der Ausgabe des Notebooks und in den Protokollen von Spark-Treiber und -Executor unkenntlich gemacht. Weitere Informationen hierzu finden Sie unter Geheimnisse.

Wenn Sie derzeit Klartextkennwörter in einer Spark-Konfiguration verwenden, empfiehlt Databricks, Ihre Kennwörter zu rotieren und geheime Pfade in der Spark-Konfiguration zu verwenden.

Repos für Git ist in neuen und vorhandenen Arbeitsbereichen in einigen Regionen standardmäßig aktiviert

2. Juni 2021

Dieser Versionshinweis wurde am 30. Juni 2021 aktualisiert.

Für neue Arbeitsbereiche und für vorhandene Arbeitsbereiche mit aktivierter Notebook-Git-Versionierung ist Repos für Git jetzt in einigen Regionen standardmäßig aktiviert. Die standardmäßige Aktivierung von Repos wird in den kommenden Monaten in weiteren Regionen eingeführt. Informationen zum Aktivieren oder Deaktivieren von Repos und zum Überprüfen der Einstellungen für Ihren Arbeitsbereich finden Sie unter Git-Integration mit Databricks Git Ordnern.

Neu gestaltete Benutzeroberfläche für Arbeitsbereichseinstellungen

2. bis 7. Juni 2021: Version 3.47

Zur Optimierung der Arbeitsbereichskonfiguration wurden die Registerkarten Arbeitsbereichspeicher, Zugriffssteuerungslisten und Erweitert durch die neue Registerkarte Arbeitsbereichseinstellungen in der Verwaltungskonsole ersetzt.

Updates für und Datenbankabfragen von abgelaufenen Token

2. bis 7. Juni 2021: Version 3.47

Die Datenbankabfragen ListTokens bzw. ListAllTokens geben keine abgelaufenen Token mehr zurück. Stattdessen werden unbegrenzte Token (bei denen expiryTime auf -1 festgelegt ist) zurückgegeben.

Beim Erteilen oder Widerrufen von Administratorberechtigungen ist jetzt eine Bestätigung erforderlich

2. bis 7. Juni 2021: Version 3.47

Wenn ein Administratorbenutzer Administratorberechtigungen auf der Webbenutzeroberfläche erteilt oder widerruft, wird nun ein Bestätigungsdialogfeld angezeigt.

Änderungen an Tastenkombinationen in der Webbenutzeroberfläche

2. bis 7. Juni 2021: Version 3.47

In einem Notebook hat sich die Art und Weise geändert, wie die Liste der Tastenkombinationen geöffnet wird. Klicken Sie zum Öffnen der Liste auf das Symbol Tastatursymbol.