Novembre 2020

Ces fonctionnalités et améliorations de la plateforme Azure Databricks ont été publiées en novembre 2020.

Notes

Les publications se font par étapes. Votre compte Azure Databricks ne peut pas être mis à jour jusqu’à une semaine ou plus après la date de publication initiale.

Fin du support de la série Databricks Runtime 6.6

26 novembre 2020

La prise en charge de Databricks Runtime 6.6, Databricks Runtime 6.6 pour Machine Learning et de Databricks Runtime 6.6 pour Genomics a pris fin le 26 novembre. Consultez Cycles de vie du support de Databricks Runtime.

Registre de modèles MLflow en GA

18 novembre - 1er décembre 2020 : version 3.33

Le registre de modèles MLflow est désormais en GA. Plusieurs améliorations ont été apportées depuis la publication du registre de modèles pour la préversion publique :

  • Journal d’audit pour les actions sur les objets de registre de modèles. Les actions du registre du modèle sont désormais capturées dans les journaux d’audit. Consultez l’entrée modelRegistry dans la référence du journal d’audit pour connaître les actions journalisées et les paramètres.
  • Commentaires pour les versions de modèle. Vous pouvez désormais ajouter des commentaires aux versions de modèle, ce qui vous permet d’utiliser le registre de modèles pour les discussions d’équipe afin de faciliter la gestion de votre pipeline de production de modèle.
  • Étiquettes sur les modèles et les versions de modèle. Vous pouvez créer des étiquettes pour les modèles et les versions de modèle, et les rechercher à l’aide de l’API.
  • Améliorations apportées à l’URL de la page des modèles inscrits. L’URL de cette page conserve désormais son historique. Vous pouvez donc naviguer avec les boutons précédent et suivant du navigateur à mesure que vous effectuez des requêtes et que vous affichez des modèles à partir de cette page. Vous pouvez également partager l’URL avec des collègues qui verront la même vue.

Exécutions des essais de filtre selon qu’un modèle inscrit est associé ou non

18 novembre - 1er décembre 2020 : version 3.33

Lorsque vous affichez des exécutions pour une expérience, vous pouvez désormais filtrer les exécutions selon qu’elles ont créé ou non une version de modèle. Pour plus d’informations, consultez Filtrer les exécutions.

18 novembre - 1er décembre 2020 : version 3.33

La galerie d’intégrations de partenaires a été déplacée du menu Compte vers l’onglet Ajouter des données. Pour plus d’informations, consultez partenaires technologique.

Les stratégies de cluster utilisent désormais allowlist et blocklist comme noms de type de stratégie

18 novembre - 1er décembre 2020 : version 3.33

Les stratégies de cluster utilisent désormais « allowlist » et « blocklist » comme types de stratégies, qui remplacent « whitelist » et « blacklist ». Consultez Informations de référence sur les stratégies de calcul. Notez que, à l’origine, cela a été annoncé comme une fonctionnalité de version 3.31, ce qui était incorrect.

Nouvelles tentatives automatiques lors de l’échec de la création d’un cluster de travaux

Important

Cette mise à jour a été annulée après la publication de la version 3.33.

18 novembre - 1er décembre 2020 : version 3.33

Azure Databricks réessaie désormais automatiquement de créer des clusters de travail lorsque des erreurs récupérables se produisent. Les exécutions de travaux restent à l’état RunLifeCycleState: PENDING jusqu’à ce que le lancement du cluster réussisse. Chaque tentative a un cluster_id et un nom différents. Lorsque la création du cluster réussit, l’exécution passe à l’état RunLifeCycleState: RUNNING.

18 novembre - 1er décembre 2020 : version 3.33

Vous pouvez désormais afficher une table des matières pour vos notebooks et l’utiliser pour naviguer rapidement dans un notebook. La table des matières du notebook est créée automatiquement en fonction des en-têtes Markdown. Pour plus d’informations, consultez Table des matières Notebook.

Databricks SQL (préversion publique)

18 novembre 2020

Databricks est heureux de présenter Databricks SQL, environnement intuitif qui permet d’exécuter des requêtes ad hoc et de créer des tableaux de bord sur des données stockées dans votre lac de données. Databricks SQL permet à votre organisation d’utiliser une architecture de lakehouse multicloud qui offre les performances de l’entreposage des données avec la rentabilité d’un lac de données tout en proposant une agréable expérience utilisateur d’analytique SQL. Databricks SQL :

  • S’intègre aux outils décisionnels que vous utilisez aujourd’hui, comme Tableau et Microsoft Power BI, pour interroger les données les plus complètes et les plus récentes de votre lac de données.
  • Complète les outils décisionnels existants à l’aide d’une interface SQL native qui permet aux analystes de données et aux scientifiques des données d’interroger les données de lac de données directement depuis Azure Databricks.
  • Vous permet de partager des insights de requête par le biais de visualisations riches et de faire glisser des tableaux de bord avec des alertes automatiques concernant des modifications de données importantes.
  • Utilise Créer un entrepôt SQL pour apporter fiabilité, qualité, mise à l’échelle, sécurité et performances à votre lac de données ; vous pouvez alors exécuter des charges de travail analytiques traditionnelles en utilisant vos données les plus récentes et les plus complètes.

Pour plus d’informations, consultez Qu’est-ce que l’entrepôt de données sur Azure Databricks ?.

Les groupes mono nœuds prennent maintenant en charge Databricks Container Services

4-10 novembre 2020 : version 3.32

Vous pouvez désormais utiliser des services conteneur Databricks sur des clusters à nœud unique. Pour plus d’informations, consultez Calcul à nœud unique ou à nœuds multiples et Personnaliser des conteneurs avec Databricks Container Services.

Databricks Runtime 7.4 GA

3 novembre 2020

Databricks Runtime 7.4, Databricks Runtime 7.4 ML et Databricks Runtime 7.4 pour Genomics sont désormais mis à la disposition générale.

Pour plus d’informations, consultez les notes de publication complètes dans Databricks Runtime 7.4 (non pris en charge) et Databricks Runtime 7.4 pour Machine Learning (non pris en charge).

Mise à jour du pilote JDBC Databricks

3 novembre 2020

Une nouvelle version du pilote JDBC Databricks a été publiée. La nouvelle version contient un certain nombre de correctifs de bogues. Plus significativement, le pilote retourne désormais le nombre correct de lignes modifiées à partir d’opérations DML lorsqu’il est fourni par Databricks Runtime.

Databricks Connect 7.3 (bêta)

3 novembre 2020

Databricks Connect 7.3 est désormais disponible en version bêta.

Databricks Connecter 7.3 vous permet d’utiliser des jetons Microsoft Entra ID pour vous authentifier auprès d’Azure Databricks et prend en charge le passage d’informations d'identification Microsoft Entra ID. Cela vous permet de vous authentifier automatiquement à Azure Data Lake Storage Gen1 et Azure Data Lake Storage Gen2 à partir de Databricks Connect en utilisant la même identité Microsoft Entra ID que celle que vous utilisez pour vous authentifier auprès d’Azure Databricks.

Pour plus d’informations, consultez Databricks Connect et les notes de publication de Databricks Connect.