Juli 2020

Artikel
05/03/2024

Dessa funktioner och förbättringar av Azure Databricks-plattformen släpptes i juli 2020.

Kommentar

Versioner mellanlagras. Ditt Azure Databricks-konto kanske inte uppdateras förrän upp till en vecka efter det första lanseringsdatumet.

Webbterminal (allmänt tillgänglig förhandsversion)

29 juli-4 augusti 2020: Version 3.25

Webbterminalen är ett praktiskt och mycket interaktivt sätt för användare med can attach to-behörighet i ett kluster att köra gränssnittskommandon, inklusive redigeringsprogram som Vim eller Emacs. Exempel på användning av webbterminalen är övervakning av resursanvändning och installation av Linux-paket.

Mer information finns i Köra gränssnittskommandon i Azure Databricks-webbterminalen.

Nytt, säkrare ramverk för globalt init-skript (allmänt tillgänglig förhandsversion)

29 juli - 4 augusti 2020: Version 3.25

Det nya globala init-skriptramverket ger betydande förbättringar jämfört med äldre globala init-skript:

Init-skript är säkrare, vilket kräver administratörsbehörighet för att skapa, visa och ta bort.
Skriptrelaterade startfel loggas.
Du kan ange körningsordningen för flera init-skript.
Init-skript kan referera till klusterrelaterade miljövariabler.
Init-skript kan skapas och hanteras med hjälp av sidan för administratörsinställningar eller det nya REST-API:et för globala Init-skript.

Databricks rekommenderar att du migrerar befintliga äldre globala init-skript till det nya ramverket för att dra nytta av dessa förbättringar.

Mer information finns i Använda globala init-skript.

IP-åtkomstlistor är nu allmänt tillgängliga

29 juli - 4 augusti 2020: Version 3.25

API:et för IP-åtkomstlista är nu allmänt tillgängligt.

Ga-versionen innehåller en ändring, vilket är att byta namn på list_type värdena:

WHITELIST till ALLOW
BLACKLIST till BLOCK

Använd API:et för IP-åtkomstlista för att konfigurera dina Azure Databricks-arbetsytor så att användarna endast ansluter till tjänsten via befintliga företagsnätverk med en säker perimeter. Azure Databricks-administratörer kan använda API:et för IP-åtkomstlista för att definiera en uppsättning godkända IP-adresser, inklusive listan över tillåtna och blockerade. All inkommande åtkomst till webbappen och REST-API:er kräver att användaren ansluter från en auktoriserad IP-adress, vilket garanterar att arbetsytor inte kan nås från ett offentligt nätverk som ett kafé eller en flygplats om inte användarna använder VPN.

Den här funktionen kräver Premium-planen.

Mer information finns i Konfigurera IP-åtkomstlistor för arbetsytor.

Ny dialogruta för filuppladdning

29 juli - 4 augusti 2020: Version 3.25

Nu kan du ladda upp små tabelldatafiler (till exempel CSV:er) och komma åt dem från en notebook-fil genom att välja Lägg till data från notebook-menyn Arkiv . Genererad kod visar hur du läser in data i Pandas eller DataFrames. Administratörer kan inaktivera den här funktionen på fliken Avancerat i administrationskonsolen.

Mer information finns i Bläddra bland filer i DBFS.

Förbättrad filtrering och sortering för SCIM API

29 juli - 4 aug 2020: Version 3.25

SCIM-API:et innehåller nu dessa förbättringar för filtrering och sortering:

Administratörsanvändare kan filtrera användare på attributet active.
Alla användare kan sortera resultat med hjälp av sortBy frågeparametrarna och sortOrder. Standardvärdet är att sortera efter ID.

Azure Government-regioner har lagts till

den 25 juli 2020

Azure Databricks blev nyligen tillgängligt i regionerna US Gov Arizona och US Gov Virginia för amerikanska myndigheter och deras partner.

Databricks Runtime 7.1 GA

den 21 juli 2020

Databricks Runtime 7.1 innehåller många ytterligare funktioner och förbättringar jämfört med Databricks Runtime 7.0, inklusive:

Google BigQuery-anslutningsprogram
%pip kommandon för att hantera Python-bibliotek som installerats i en notebook-session
Koalas installerat
Många Förbättringar av Delta Lake, inklusive:
- Ange användardefinierade incheckningsmetadata
- Hämta versionen av den senaste incheckningen som skrivits av den aktuella SparkSession
- Konvertera Parquet-tabeller som skapats av Structured Streaming med hjälp av transaktionsloggen _spark_metadata
- MERGE INTO Prestandaförbättringar

Mer information finns i fullständiga viktig information om Databricks Runtime 7.1 (stöds inte).

Databricks Runtime 7.1 ML GA

den 21 juli 2020

Databricks Runtime 7.1 för Machine Learning bygger på Databricks Runtime 7.1 och innehåller följande nya funktioner och biblioteksändringar:

pip- och conda magic-kommandon aktiverade som standard
spark-tensorflow-distributor: 0.1.0
kudde 7.0.0 -> 7.1.0
pytorch 1.5.0 -> 1.5.1
torchvision 0.6.0 -> 0.6.1
horovod 0.19.1 -> 0.19.5
mlflow 1.8.0 -> 1.9.1

Mer information finns i fullständiga viktig information om Databricks Runtime 7.1 för ML (stöds inte).

Databricks Runtime 7.1 Genomics GA

den 21 juli 2020

Databricks Runtime 7.1 för Genomics bygger på Databricks Runtime 7.1 och innehåller följande nya funktioner:

LOCO-omvandling
GloWGR-utdataomformningsfunktion
RNASeq matar ut omålade justeringar