Augusti 2020

Dessa funktioner och förbättringar av Azure Databricks-plattformen släpptes i augusti 2020.

Kommentar

Versioner mellanlagras. Ditt Azure Databricks-konto kanske inte uppdateras förrän upp till en vecka efter det första lanseringsdatumet.

Viktigt!

Version 3.26 har endast släppts till kunder i regionerna Kanada, centrala och Centrala Indien. Alla andra regioner får 3.26-funktionerna samtidigt som 3.27 släpps.

API:et för tokenhantering är allmänt tillgängligt och administratörer kan använda administrationskonsolen till att bevilja och återkalla användaråtkomst till tokens

26 augusti - 1 september 2020: Version 3.27

Tokenhantering är nu allmänt tillgängligt. Azure Databricks-administratörer kan använda API:et för tokenhantering och administratörskonsolen för att hantera användarnas personliga åtkomsttoken för Azure Databricks. Som administratör kan du:

  • Övervaka och återkalla användarnas personliga åtkomsttoken.
  • Kontrollera livslängden för framtida token på din arbetsyta.
  • Kontrollera vilka användare som kan skapa och använda token via API:et Behörigheter eller i administratörskonsolen.

I övergången från offentlig förhandsversion till GA ändrades api-parametern created_by för tokenhantering till och en ny parameter created_by_username lades tillcreated_by_id.

Mer information finns i Övervaka och hantera personliga åtkomsttoken.

Storleksgränsen för meddelanden i Shiny-appar har ökats

26 augusti - 1 september 2020: Version 3.27

Den maximala programstorleken för Shiny-appar har ökats från 10 MB till 20 MB. Om programmets totala storlek överskrider den här gränsen kan du läsa rekommendationerna i Vanliga frågor och svar om Shiny.

Förbättrade anvisningar för att konfigurera ett kluster i lokalt läge

26 augusti - 1 september 2020: Version 3.27

I klustrets användargränssnitt:

  • Om du skapar ett kluster med 0 arbetare visas ett verktygstips som rekommenderar att du använder lokalt läge och visar den associerade konfigurationsinställningen (spark.master local[*]).
  • Du kan inte längre ange spark.master local[*] för ett kluster, såvida inte klustret har 0 arbetare.

Visa versionen av den notebook-fil som är associerad med en körning

26 augusti - 1 september 2020: Version 3.27

Från sidofältet Experiment kan du nu visa versionen av en notebook-fil som är associerad med en körning. Mer information finns i Visa notebook-experiment.

Databricks Runtime 7.2 GA

den 20 augusti 2020

Databricks Runtime 7.2 innehåller många ytterligare funktioner och förbättringar jämfört med Databricks Runtime 7.1, inklusive:

  • Automatisk inläsning är allmänt tillgänglig: Automatisk inläsning är en effektiv metod för inkrementell inmatning av ett stort antal filer i Delta Lake. Det är nu GA och lägger till följande funktioner:
    • Alternativ för kataloglistningsläge: Automatisk inläsning lägger till ett nytt kataloglistningsläge, utöver det befintliga filmeddelandeläget, för att avgöra när det finns nya filer.
    • API för hantering av molnresurser: Nu kan du använda vårt Scala API för att hantera molnresurser som skapats av Auto Loader. Du kan lista meddelandetjänster och ta ned specifika meddelandetjänster med hjälp av det här API:et.
    • Alternativ för hastighetsbegränsning: Du kan nu använda cloudFiles.maxBytesPerTrigger alternativet för att begränsa mängden data som bearbetas i varje mikrobatch.
    • Alternativvalidering: Automatisk inläsning validerar nu de alternativ som du anger.validation kommer att misslyckas. Om du vill hoppa över alternativvalidering anger du cloudFiles.validateOptions till false.
  • Kopiera effektivt en Delta-tabell med klon.
  • Förbättringar:
    • Snowflake-anslutningsappen har uppgraderats till version 2.8.1, som innehåller Stöd för Spark 3.0.
    • Förbättringar av genomströmning för autentiseringsuppgifter
    • TensorBoard-förbättringar
    • Uppgraderade Python- och R-bibliotek

Mer information finns i fullständiga viktig information om Databricks Runtime 7.2 (stöds inte).

Databricks Runtime 7.2 ML GA

den 20 augusti 2020

Databricks Runtime 7.2 för Machine Learning bygger på Databricks Runtime 7.2 och ger nya och förbättrade Python- och systembibliotek. Mer information finns i fullständiga viktig information om Databricks Runtime 7.2 (stöds inte).

Databricks Runtime 7.2 Genomics GA

den 20 augusti 2020

Databricks Runtime 7.2 för Genomics bygger på Databricks Runtime 7.2 och påskyndar avsevärt konverteringen av literal numpy 1D och 2D float-typed ndarrays till Java-matriser. Dokumentationen för Glow genome-wide association study (Glow genome-wide association study) återspeglar användningen.

API för behörigheter (offentlig förhandsversion)

18 augusti 2020

Databricks är glada över att kunna presentera den offentliga förhandsversionen av behörighets-API:et, vilket gör att du kan hantera behörigheter för:

  • Token
  • Kluster
  • Pooler
  • Projekt
  • Notebook-filer
  • Mappar (kataloger)
  • MLflow-registrerade modeller

Mer information finns i Behörighets-API.

Databricks Connect 7.1 (allmänt tillgänglig)

12 augusti 2020

Databricks Anslut stöder nu Databricks Runtime 7.1.

I Databricks Runtime 7.1 rekommenderar Databricks att du alltid använder den senaste versionen av Databricks Anslut.

Repeterbar installationsordning för klusterbibliotek

12-25 augusti 2020: Version 3.26

I ett kluster som kör Databricks Runtime 7.2 eller senare bearbetar Azure Databricks nu alla klusterbibliotek i den ordning de installerades.

Skapa modell från sidan för registrerade modeller i MLflow (offentlig förhandsversion)

12-25 augusti 2020: Version 3.26

Nu kan du skapa en ny modell från sidan MLflow-registrerade modeller. Mer information finns i Skapa en ny registrerad modell och tilldela en loggad modell till den.

Databricks-containertjänster har stöd för GPU-avbildningar

12-25 augusti 2020: Version 3.26

Nu kan du använda Databricks Container Services i kluster med GPU:er för att skapa portabla djupinlärningsmiljöer med anpassade bibliotek.

Mer information finns i Databricks Container Services på GPU-beräkning.