Novembre 2020

Ces fonctionnalités et Azure Databricks améliorations de la plateforme ont été publiées en novembre 2020.

Notes

Les mises en production sont intermédiaires. Votre compte de Azure Databricks ne peut pas être mis à jour avant une semaine ou plus après la date de publication initiale.

Fin du support de la série Databricks Runtime 6.6

26 novembre 2020

la prise en charge de Databricks Runtime 6,6, Databricks Runtime 6,6 pour Machine Learning et Databricks Runtime 6,6 pour génomique a pris fin le 26 novembre. Consultez cycle de vie du support Databricks Runtime.

Registre de modèles MLflow en GA

18 novembre-1er décembre 2020 : version 3,33

Le Registre du modèle MLflow est désormais GA. Plusieurs améliorations ont été apportées depuis la publication du registre de modèle pour la version préliminaire publique :

  • Journalisation des diagnostics pour les actions sur les objets de registre de modèle. Les actions du Registre du modèle sont désormais capturées dans les journaux de diagnostic. Consultez les événements du journal de diagnostic pour les actions et les paramètres journalisés.

  • Commentaires pour les versions de modèle. Vous pouvez maintenant ajouter des commentaires aux versions de modèle, ce qui vous permet d’utiliser le registre de modèles pour les discussions d’équipe afin de faciliter la gestion de votre pipeline de production de modèle.

  • Étiquettes sur les modèles et les versions de modèle. Vous pouvez créer des balises pour les modèles et les versions de modèle, et les Rechercher à l’aide de l’API.

  • Améliorations apportées à l’URL de la page modèles inscrits. L’URL de cette page conserve maintenant son historique. vous pouvez donc naviguer avec les boutons précédent et suivant du navigateur à mesure que vous effectuez des requêtes et que vous affichez des modèles à partir de cette page. Vous pouvez également partager l’URL avec des collègues qui verront la même vue.

Exécutions des essais de filtre selon qu’un modèle inscrit est associé ou non

18 novembre-1er décembre 2020 : version 3,33

Lorsque vous affichez des exécutions pour une expérience, vous pouvez désormais filtrer les exécutions selon qu’elles ont créé ou non une version de modèle. Pour plus d’informations, consultez exécutions de filtres.

18 novembre-1er décembre 2020 : version 3,33

La Galerie d’intégrations de partenaires a été déplacée du menu compte vers l’onglet Ajouter des données . Pour plus d’informations, consultez le Guide d’intégration Databricks.

Les stratégies de cluster utilisent désormais allowlist et blocklist comme noms de type de stratégie

18 novembre-1er décembre 2020 : version 3,33

Les stratégies de cluster utilisent désormais « allowlist » et « liste de blocage » comme types de stratégie, en remplaçant « liste verte » et « liste rouge ». Consultez définitions de stratégie de cluster. Notez que cela a été annoncé à l’origine en tant que fonctionnalité version 3,31, qui était incorrecte.

Nouvelles tentatives automatiques lors de l’échec de la création d’un cluster de travaux

Important

Cette mise à jour a été annulée après la publication de la version 3,33.

18 novembre-1er décembre 2020 : version 3,33

Azure Databricks réessaie désormais automatiquement de créer des clusters de travail lorsque des erreurs récupérables se produisent. Les exécutions de travaux restent dans RunLifeCycleState : en attente jusqu’au lancement réussi du cluster. Chaque tentative a un cluster_id nom et un nom différents. Lorsque la création du cluster est réussie, l’exécution passe à RunLifeCycleState : Running.

18 novembre-1er décembre 2020 : version 3,33

Vous pouvez désormais afficher une table des matières pour vos blocs-notes et les utiliser pour naviguer rapidement dans un Notebook. La table des matières du bloc-notes est créée automatiquement en fonction des en-têtes de démarque. Pour plus d’informations, consultez afficher la table des matières.

Databricks SQL (préversion publique)

18 novembre 2020

Databricks est heureux d’introduire Databricks SQL, un environnement intuitif pour l’exécution de requêtes ad hoc et la création de tableaux de bord sur des données stockées dans votre data lake. Databricks SQL permet à votre organisation d’utiliser une architecture lakehouse multicloud qui fournit des performances d’entreposage des données avec data lake, tout en fournissant une expérience utilisateur d’analyse des SQL. Databricks SQL :

  • S’intègre aux outils décisionnels que vous utilisez aujourd’hui, comme Tableau et Microsoft Power BI, pour interroger les données les plus complètes et les plus récentes de votre lac de données.
  • Complète les outils décisionnels existants à l’aide d’une interface SQL native qui permet aux analystes de données et aux scientifiques des données d’interroger les données de lac de données directement depuis Azure Databricks.
  • Vous permet de partager des insights de requête par le biais de visualisations riches et de faire glisser des tableaux de bord avec des alertes automatiques concernant des modifications de données importantes.
  • Utilise des points de terminaison SQL pour apporter fiabilité, qualité, mise à l’échelle, sécurité et performances à votre lac de données. Vous pouvez alors exécuter des charges de travail analytiques traditionnelles à l’aide des données les plus récentes et complètes.

Pour plus d’informations, consultez le guide Databricks SQL. Contactez votre représentant Azure Databricks pour demander un accès.

ters mononœuds prennent maintenant en charge Databricks Container Services

4-10 novembre, 2020 : version 3,32

Vous pouvez maintenant utiliser les services de conteneur Databricks sur des clusters à nœud unique. Pour plus d’informations, consultez clusters à nœud unique et personnaliser les conteneurs avec les services de conteneur Databricks.

Databricks Runtime 7.4 GA

3 novembre 2020

Databricks Runtime 7,4, Databricks Runtime 7,4 ML et Databricks Runtime 7,4 pour génomique sont désormais mis à la disposition générale.

pour plus d’informations, consultez les notes de publication complètes à l’adresse Databricks Runtime 7,4 (non prise en charge), Databricks Runtime 7,4 pour Machine Learning (non prise en charge)et Databricks Runtime 7,4 pour la génomique (non prise en charge).

Mise à jour du pilote JDBC Databricks

3 novembre 2020

Une nouvelle version du pilote JDBC Databricks a été publiée. La nouvelle version contient un certain nombre de correctifs de bogues, le plus particulièrement, le pilote retourne maintenant le nombre correct de lignes modifiées à partir des opérations DML lorsqu’il est fourni par Databricks Runtime.

Databricks Connect 7.3 (bêta)

3 novembre 2020

Databricks Connecter 7,3 est désormais disponible en version bêta.

Databricks Connecter 7,3 vous permet d’utiliser Azure Active Directory jetons pour vous authentifier auprès d’Azure Databricks et prend en charge Azure Active Directory relais d’informations d’identification. Cela vous permet de vous authentifier automatiquement pour Azure Data Lake Storage Gen1 et Azure Data Lake Storage Gen2 depuis Databricks Connect en utilisant la même identité Azure Active Directory que celle que vous utilisez pour vous authentifier auprès d’Azure Databricks.

pour plus d’informations, consultez les notes de publication de Databricks Connecter et Databricks Connecter.