Februari 2020

Dessa funktioner och förbättringar av Azure Databricks-plattformen släpptes i februari 2020.

Kommentar

Versioner mellanlagras. Ditt Azure Databricks-konto kanske inte uppdateras förrän upp till en vecka efter det första lanseringsdatumet.

Databricks Runtime 6.4 for Genomics GA

den 26 februari 2020

Databricks Runtime 6.4 för Genomics bygger på Databricks Runtime 6.4. Den innehåller många förbättringar och uppgraderingar från Databricks Runtime 6.3 för Genomics.

De viktigaste funktionerna är:

  • Nu kan du anpassa DNASeq Pipeline-användare kan selektivt inaktivera alla legitima kombinationer av läsjustering, variantanrop och variantanteckningssteg. Användare kan också utföra skrivjustering med en enda slutpunkt.
  • Versionen av Glow som ingår i Databricks Runtime 6.4 for Genomics tillhandahåller nu Python- och Scala-API:er för funktioner som tidigare endast exponerats via SQL-uttryck. Dessa funktioner är tillgängliga för DataFrame-åtgärder, vilket ger bättre kompileringstidssäkerhet.

Databricks Runtime 6.4 ML GA

den 26 februari 2020

Databricks Runtime 6.4 ML GA ger biblioteksuppgraderingar, inklusive:

  • PyTorch: 1.3.1 till 1.4.0
  • Horovod: 0.18.2 till 1.19.0

Mer information finns i fullständiga viktig information om Databricks Runtime 6.4 för ML (stöds inte).

Databricks Runtime 6.4 GA

den 26 februari 2020

Databricks Runtime 6.4 GA ger nya funktioner, förbättringar och många felkorrigeringar.

  • Bearbeta nya datafiler stegvis med Auto Loader (offentlig förhandsversion). Automatisk inläsning ger dig ett effektivare sätt att bearbeta nya datafiler stegvis när de kommer till ett molnbloblager under ETL. Detta är en förbättring jämfört med filbaserad strukturerad direktuppspelning, som identifierar nya filer genom att upprepade gånger lista molnkatalogen och spåra de filer som har setts och kan vara mycket ineffektiv när katalogen växer.
  • Läs in data i Delta Lake med idempotenta återförsök (offentlig förhandsversion). Med COPY INTO SQL-kommandot kan du läsa in data i Delta Lake med idempotenta återförsök (offentlig förhandsversion). Om du vill läsa in data i Delta Lake idag måste du använda Apache Spark DataFrame-API:er. Om det uppstår fel vid belastningar måste du hantera dem effektivt.
  • Åtgärdsmått för alla skrivningar, uppdateringar och borttagningar i en Delta-tabell som nu visas i tabellhistoriken.
  • Infogade Matplotlib-siffror är nu aktiverade som standard i Azure Databricks-notebook-filer (offentlig förhandsversion).

Mer information finns i fullständiga viktig information om Databricks Runtime 6.4 (stöds inte).

Nya interaktiva diagram ger omfattande interaktion på klientsidan

25 feb - 3 mars 2019: Version 3.14

Den här versionen introducerar två nya interaktiva diagramtyper som ersätter implementeringar av stapeldiagram och linjediagram. Förutom befintliga diagramfunktioner har linjediagrammet några nya anpassade ritningsalternativ: ange ett Y-axelintervall, visa eller dölja markörer och tillämpa loggskala på Y-axeln. Båda diagrammen har ett inbyggt verktygsfält som stöder en omfattande uppsättning interaktioner på klientsidan.

Verktygsfältet Diagram

Om du vill använda de befintliga diagramimplementeringarna kan du välja dem i listrutan Äldre diagram . Befintliga diagram fortsätter att använda de tidigare tillgängliga implementeringarna.

Äldre diagramtyper

Nytt datainmatningsnätverk lägger till partnerintegreringar med Delta Lake (allmänt tillgänglig förhandsversion)

den 24 februari 2020

Nu kan du enkelt fylla i ditt "lakehouse" – din datasjö som underlättas av de typer av datastrukturer och datahanteringsfunktioner som du vanligtvis får med ett informationslager – från hundratals datakällor till Delta Lake. Kärnan i det här nätverket är det nya partnerintegreringsgalleriet, som är tillgängligt från din arbetsyta och ger åtkomst till ett stort nätverk av datakällor via våra partner Fivetran, Qlik, Infoworks, StreamSets och Syncsort.

Portalen för partnerintegrering

En översikt finns i vår blogg. Mer information finns i Teknikpartners.

Arbetsytans skapare läggs automatiskt till som en Azure Databricks-administratör

den 24 februari 2020

Före den 24 februari 2020 skulle användaren som skapade en Azure Databricks-arbetsyta bara läggas till som administratörsanvändare för arbetsytan om hon också klickade på knappen Starta arbetsyta i Azure-portalen eller lades till som administratör av en användare som redan var administratörsanvändare på arbetsytan (alla Azure-deltagare för prenumerationen som klickade på knappen Starta arbetsyta skulle skapas som administratörsanvändare på arbetsytan). Nu läggs användaren som skapar arbetsytan till automatiskt som arbetsyteadministratör.

Mer information om hur du skapar och startar arbetsytor finns i Hantera din prenumeration

Flaggor för att hantera arbetsytans säkerhet och notebook-funktioner är nu tillgängliga

4-11 februari 2020: Version 3.12

Den här versionen introducerar nya flaggor för att hantera säkerhetshuvuden som skickas för att förhindra attacker på din arbetsyta, samt åtkomst till nedladdningar av notebook-resultat och Git-versionshantering. Alla dessa administrativa alternativ är aktiverade som standard.