Februari 2020

Dessa funktioner och Azure Databricks plattformsförbättringar släpptes i februari 2020.

Anteckning

Versioner mellanfasas. Ditt Azure Databricks kanske inte uppdateras förrän upp till en vecka efter det första lanseringsdatumet.

Databricks Runtime 6.4 for Genomics GA

Den 26 februari 2020

Databricks Runtime 6.4 for Genomics bygger på Databricks Runtime 6.4. Den innehåller många förbättringar och uppgraderingar från Databricks Runtime 6.3 för Genomics.

De viktigaste funktionerna är:

  • Nu kan du anpassa DNASeq. Pipelineanvändare kan selektivt inaktivera alla legitima kombinationer av steg för läsjustering, variantanrop och variantanteckningar. Användare kan också utföra läsjustering för en enda end.
  • Versionen av Glow som ingår i Databricks Runtime 6.4 för Genomics tillhandahåller nu Python- och Scala-API:er för funktioner som tidigare endast exponerats via SQL uttryck. Dessa funktioner är tillgängliga för DataFrame-åtgärder, vilket ger förbättrad säkerhet vid kompileringstid.

Mer information finns i den fullständiga Databricks Runtime 6.4 för Genomics (stöds inte).

Databricks Runtime 6.4 ML GA

Den 26 februari 2020

Databricks Runtime 6.4 ML GA innehåller biblioteksuppgraderingar, inklusive:

  • PyTorch: 1.3.1 till 1.4.0
  • Horovod: 0.18.2 till 1.19.0

Mer information finns i den fullständiga Databricks Runtime 6.4 Machine Learning (stöds inte).

Databricks Runtime 6.4 GA

Den 26 februari 2020

Databricks Runtime 6.4 GA innehåller nya funktioner, förbättringar och många felkorrigeringar.

  • Bearbeta nya datafiler inkrementellt med Auto Loader (offentlig förhandsversion). Auto Loader ger dig ett mer effektivt sätt att bearbeta nya datafiler inkrementellt när de tas emot i ett molnbloblager under ETL. Detta är en förbättring jämfört med filbaserad strukturerad direktuppspelning, som identifierar nya filer genom att upprepade gånger visa molnkatalogen och spåra de filer som har setts, och kan vara mycket ineffektivt när katalogen växer.
  • Läs in data till Delta Lake med idempotenta återförsök (offentlig förhandsversion). Med COPY INTO SQL kan du läsa in data i Delta Lake med idempotenta återförsök (offentlig förhandsversion). För att läsa in data till Delta Lake i dag måste du använda Apache Spark DataFrame-API:er. Om det uppstår fel under belastningen måste du hantera dem effektivt.
  • Åtgärdsmått för alla skrivningar, uppdateringar och borttagningar i en Delta-tabell visas nu i tabellhistoriken.
  • Infogade Matplotlib-figurer är nu aktiverade som standard Azure Databricks notebook-datorer (offentlig förhandsversion).

Mer information finns i den fullständiga Databricks Runtime 6.4 (stöds inte).

Nya interaktiva diagram ger omfattande interaktion på klientsidan

25 feb – 3 mars 2019: Version 3.14

Den här versionen introducerar två nya interaktiva diagramtyper som ersätter implementeringarna av stapeldiagram och linjediagram. Förutom befintliga diagramfunktioner har linjediagrammet några nya anpassade ritalternativ: ange ett Y-axelintervall, visa eller dölja markörer och tillämpa loggskala på Y-axeln. Båda diagrammen har ett inbyggt verktygsfält som stöder en omfattande uppsättning interaktioner på klientsidan.

Chart toolbar

Om du vill använda de befintliga diagramimplementeringarna kan du välja dem från listrutan Äldre diagram. Befintliga diagram fortsätter att använda de tidigare tillgängliga implementeringarna.

Legacy chart types

Nytt datainmatningsnätverk lägger till partnerintegreringar med Delta Lake (allmänt tillgänglig förhandsversion)

Den 24 februari 2020

Nu kan du enkelt fylla i din "lakehouse"– din datasjö med hjälp av de typer av datastrukturer och datahanteringsfunktioner som du vanligtvis får med ett informationslager – från hundratals datakällor till Delta Lake. I hjärtat av det här nätverket finns det nya partnerintegreringsgalleriet som är tillgängligt från din arbetsyta och ger åtkomst till ett stort nätverk av datakällor via våra partners Fivetran, Qlik, Infoworks, StreamSets och Syncsort.

Partner integrations portal

En översikt finns i vår blogg. Mer information finns i Databricks integrationsguide.

Arbetsytans skapare läggs automatiskt till som en Azure Databricks-administratör

Den 24 februari 2020

Före den 24 februari 2020 skulle användaren som skapade en Azure Databricks-arbetsyta endast läggas till som administratör för arbetsytan om hon också klickade på knappen Starta arbetsyta i Azure-portalen eller lades till som administratör av en användare som redan var administratörsanvändare i arbetsytan (alla Azure-deltagare för prenumerationen som klickade på knappen Starta arbetsyta skulle skapas som administratörsanvändare i arbetsytan). Nu läggs den användare som skapar arbetsytan till automatiskt som administratör för arbetsytan.

Mer information om hur du skapar och startar arbetsytor finns i Hantera din prenumeration

Flaggor för att hantera arbetsytans säkerhet och notebook-funktioner är nu tillgängliga

4–11 februari 2020: Version 3.12

Den här versionen introducerar nya flaggor för att hantera de säkerhetshuvuden som skickas för att förhindra attacker på din arbetsyta, samt åtkomst till nedladdning av notebook-resultat och Git-versionshantering. Se Hantera arbetsytesäkerhetsrubrikeroch Hantera åtkomst till notebook-funktioner. Alla dessa administrativa alternativ är aktiverade som standard.