Décembre 2019

Ces fonctionnalités et améliorations de la plateforme Azure Databricks ont été publiées en décembre 2019.

Notes

Les publications se font par étapes. Votre compte Azure Databricks ne peut pas être mis à jour jusqu’à une semaine ou plus après la date de publication initiale.

Databricks Connect prend désormais en charge Databricks Runtime 6.2

17 décembre 2019

Databricks Connect prend désormais en charge Databricks Runtime 6.2.

Configurer des clusters avec votre propre image conteneur à l’aide des services de conteneur Databricks (Disponibilité générale)

16 décembre 2019 : version 3.7

En disponibilité générale dans Databricks Runtime 6.1 et la plateforme Azure Databricks version 3.7, les services de conteneur Databricks vous permettent de configurer un cluster avec votre propre image de conteneur. Vous pouvez pré-empaqueter des environnements complexes dans un conteneur, publier celui-ci sur un registre de conteneurs populaire comme ACR, ECR ou Docker Hub, puis faire en sorte qu’Azure Databricks tire (pull) l’image pour créer un cluster. Voici quelques exemples de cas d’usage :

  • Personnalisation de bibliothèque : vous avez un contrôle total sur les bibliothèques système que vous souhaitez installer
  • Environnement de conteneur final : votre image Docker est un environnement verrouillé qui ne changera jamais
  • Intégration CI/CD avec Docker : vous pouvez intégrer Azure Databricks à vos pipelines d’intégration et de déploiement continus Docker

Il existe de nombreux autres cas d’usage, de la spécification de configuration à l’installation de packages Machine Learning.

Pour plus d’informations, consultez Personnaliser des conteneurs avec Databricks Container Services.

Databricks Runtime 6.2 pour Genomics GA

3 décembre 2019

Databricks Runtime 6.2 pour Genomics est basé sur Databricks Runtime 6.2. La version comprend de nombreuses améliorations et mises à niveau de Databricks Runtime 6.1 pour Genomics, notamment :

  • Régression logistique Firth
  • Métriques définies par l’utilisateur de contrôle qualité des échantillons
  • Amélioration des performances du transformateur de canal
  • Génotypage collectif plus robuste
  • Intégration simplifiée à LOFTEE
  • Hail 0.26.0
  • Samtools 1.9

3 décembre 2019

Maintenant que le connecteur d’approvisionnement SCIM Azure Databricks est disponible dans la galerie d’applications Microsoft Entra ID (anciennement connu comme Azure Active Directory), il est plus facile de configurer l’approvisionnement des utilisateurs et des groupes de Microsoft Entra ID vers Azure Databricks. Pour obtenir plus d’informations, consultez Configurer l’approvisionnement de SCIM en utilisant Microsoft Entra ID (Azure Active Directory).

Fin du support de Databricks Runtime 5.3 et 5.4

3 décembre 2019

Le support de 5.3 et 5.4 a pris fin le 3 décembre. Consultez Cycles de vie du support de Databricks Runtime.

Databricks Runtime 6.2 ML GA

3 décembre 2019

Databricks Runtime 6.2 ML en disponibilité générale apporte de nombreuses mises à niveau de bibliothèque, notamment :

  • TensorFlow et TensorBoard : 1.14.0 à 1.15.0.
  • PyTorch : 1.2.0 à 1.3.0.
  • tensorboardX : 1.8 à 1.9.
  • MLflow : 1.3.0 à 1.4.0.
  • Hyperopt : 0,2-DB1 avec intégrations MLflow Azure Databricks.
  • mleap-databricks-Runtime à 0.15.0 et comprend mleap-xgboost-Runtime.

Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 6.2 pour ML (non pris en charge).

Databricks Runtime 6.2 GA

3 décembre 2019

Databricks Runtime 6.2 en disponibilité générale apporte de nouvelles fonctionnalités, des améliorations et de nombreux correctifs de bogues, notamment :

  • Fusion en insertion seule Delta Lake optimisée

Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 6.2 (non pris en charge).

Databricks Connect prend désormais en charge Databricks Runtime 6.1

3 décembre 2019

Databricks Connect prend désormais en charge Databricks Runtime 6.1. Databricks Connect vous permet de connecter votre environnement IDE favori (IntelliJ, Eclipse, PyCharm, RStudio, Visual Studio), votre serveur de notebook (Zeppelin, Jupyter) et d’autres applications personnalisées à des clusters Azure Databricks et d’exécuter du code Apache Spark.