Februar 2020

Diese Features und Azure Databricks-Plattformverbesserungen wurden im Februar 2020 veröffentlicht.

Hinweis

Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung aktualisiert.

Allgemeine Verfügbarkeit von Databricks Runtime 6.4 für Genomics

26. Februar 2020

Databricks Runtime 6.4 für Genomics basiert auf Databricks Runtime 6.4. Darin sind viele Verbesserungen und Upgrades von Databricks Runtime 6.3 für Genomics enthalten.

Es folgen die wichtigsten Features:

  • Sie können die DNASeq Pipeline jetzt individuell anpassen. Benutzende können jede legitime Kombination der Phasen „Read Alignment“, „Variant Calling“ und „Variant Annotation“ selektiv deaktivieren. Benutzer können auch eine Single-End-Leseausrichtung vornehmen.
  • Die in Databricks Runtime 6.4 für Genomics enthaltene Version von Glow bietet jetzt Python- und Scala-APIs für Funktionen, die bisher nur über SQL-Ausdrücke verfügbar gemacht wurden. Diese Funktionen sind für DataFrame-Vorgänge verfügbar und bieten dadurch eine höhere Sicherheit zur Kompilierzeit.

Allgemeine Verfügbarkeit von Databricks Runtime 6.4 ML

26. Februar 2020

Die GA-Version von Databricks Runtime 6.4 ML bietet Bibliotheksupgrades, einschließlich der folgenden:

  • PyTorch: 1.3.1 auf 1.4.0
  • Horovod: 0.18.2 auf 1.19.0

Ausführliche Informationen finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 6.4 für ML (nicht unterstützt).

Allgemeine Verfügbarkeit von Databricks Runtime 6.4

26. Februar 2020

Die allgemeine verfügbare Version von Databricks Runtime 6.4 bietet neue Features, Verbesserungen und viele Fehlerbehebungen.

  • Inkrementelles Verarbeiten neuer Datendateien mit Autoloader (Public Preview). Mit Autoloader können Sie neue Datendateien inkrementell verarbeiten, sobald sie in der ETL-Phase in einem Blobspeicher in der Cloud eintreffen. Dies ist eine Verbesserung gegenüber dem dateibasierten strukturierten Streaming, bei dem neue Dateien durch wiederholte Auflistung des Cloudverzeichnisses und Nachverfolgung der gesichteten Dateien identifiziert werden, was sehr ineffizient sein kann, wenn das Verzeichnis größer wird.
  • Laden von Daten in Delta Lake mit idempotenten Wiederholungen (Public Preview). Mit dem SQL-Befehl COPY INTO können Sie Daten in Delta Lake mit idempotenten Wiederholungen laden (Public Preview). Um Daten in Delta Lake zu laden, müssen Sie derzeit Apache Spark-DataFrame-APIs verwenden. Wenn es bei Ladevorgängen zu Fehlern kommt, müssen Sie diese effektiv behandeln.
  • Metriken für alle Schreib-, Aktualisierungs- und Löschvorgänge in einer Delta-Tabelle werden jetzt im Tabellenverlauf aufgeführt.
  • Matplotlib-Inline-Abbildungen sind jetzt standardmäßig in Azure Databricks-Notebooks aktiviert (Public Preview).

Einzelheiten finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 6.4 (nicht unterstützt).

Neue interaktive Diagramme bieten umfangreiche clientseitige Interaktionen.

25. Februar bis 3. März 2019: Version 3.14

Mit diesem Release werden zwei neue interaktive Diagrammtypen eingeführt, die die Implementierungen von Balken- und Liniendiagrammen ersetzen. Zusätzlich zu den vorhandenen Diagrammfunktionen verfügt das Liniendiagramm über einige neue benutzerdefinierte Darstellungsoptionen: Festlegen eines Y-Achsenbereichs, Ein- und Ausblenden von Markierungen und Zuweisen einer logarithmischen Skala zur Y-Achse. Beide Diagramme verfügen über eine integrierte Symbolleiste, die zahlreiche clientseitige Interaktionen unterstützt.

Chart toolbar

Wenn Sie die vorhandenen Diagrammimplementierungen verwenden möchten, können Sie sie im Dropdownmenü Legacy-Diagramme auswählen. Für bestehende Diagramme werden weiterhin die bisher verfügbaren Implementierungen verwendet.

Legacy chart types

Neues Datenerfassungsnetzwerk fügt Partnerintegrationen mit Delta Lake (Public Preview) hinzu.

24. Februar 2020

Jetzt können Sie ganz einfach Ihr „Lakehouse“ – Ihren Data Lake, der durch die Arten von Datenstrukturen und Datenverwaltungsfeatures unterstützt wird, die Sie in der Regel mit einem Data Warehouse erhalten – aus Hunderten von Datenquellen in Delta Lake auffüllen. Das Kernelement dieses Netzwerks ist der neue Katalog für Partnerintegrationen, auf den Sie in Ihrem Arbeitsbereich zugreifen können und der Ihnen über unsere Partner Fivetran, Qlik, Infoworks, StreamSets und Syncsort Zugriff auf ein riesiges Netzwerk von Datenquellen bietet.

Partner integrations portal

Eine Übersicht finden Sie in unserem Blog. Weitere Informationen finden Sie unter Technologiepartner.

Der Ersteller des Arbeitsbereichs wird automatisch als Azure Databricks-Administrator hinzugefügt.

24. Februar 2020

Vor dem 24. Februar 2020 wurde der Benutzer, der einen Azure Databricks-Arbeitsbereich erstellt hat, nur als Administratorbenutzer für den Arbeitsbereich hinzugefügt, wenn er auch im Azure-Portal auf die Schaltfläche Arbeitsbereich starten geklickt hat oder als Administrator von einem Benutzer hinzugefügt wurde, der bereits Administratorbenutzer im Arbeitsbereich war (jeder Azure-Mitwirkende für das Abonnement, der auf die Schaltfläche Arbeitsbereich starten geklickt hat, würde als Administratorbenutzer im Arbeitsbereich erstellt werden). Jetzt wird der Benutzer, der den Arbeitsbereich erstellt, automatisch als Arbeitsbereichsadministrator hinzugefügt.

Weitere Informationen zum Erstellen und Starten von Arbeitsbereichen finden Sie unter Verwalten Ihres Abonnements.

Flags zum Verwalten der Arbeitsbereichssicherheit und Notebookfeatures jetzt verfügbar

4. bis 11. Februar 2020: Version 3.12

In dieser Version gibt es neue Flags für die Verwaltung der Sicherheitsheader, die gesendet werden, um Angriffe auf Ihren Arbeitsbereich zu verhindern. Außerdem haben Sie Zugriff nun auf die Downloads von Notebookergebnissen und die Git-Versionsverwaltung. Alle diese Verwaltungsoptionen sind standardmäßig aktiviert.