Utiliser l’Assistant Databricks

Important

Cette fonctionnalité est actuellement en préversion publique. L’utilisation de la fonctionnalité pendant la préversion est gratuite. La tarification finale sera établie et communiquée avant la disponibilité générale (GA).

L’Assistant Databricks est un assistant IA prenant en charge le contexte disponible dans les notebooks Databricks, l’éditeur SQL et l’éditeur de fichiers. L’Assistant Databricks vous permet d’interroger des données à l’aide d’une interface conversationnelle, ce qui vous rend plus productif dans Databricks. Vous pouvez décrire votre tâche en anglais et laisser l’Assistant générer du code Python ou des requêtes SQL, expliquer le code complexe et corriger automatiquement les erreurs. L’Assistant utilise les métadonnées Unity Catalog pour comprendre vos tables, colonnes, descriptions et ressources de données populaires au sein de votre entreprise pour fournir des réponses personnalisées.

L’Assistant Databricks peut effectuer les tâches suivantes :

  • Générer du code.
  • Déboguer du code, y compris identifier et suggérer des correctifs pour les erreurs.
  • Transformer et optimiser le code.
  • Expliquer le code.
  • Vous aider à trouver des informations pertinentes dans la documentation Azure Databricks.

L’Assistant Databricks est activé par défaut. Un administrateur peut désactiver ou activer l’Assistant Databricks pour tous les espaces de travail d’un compte. Si un administrateur a autorisé les remplacements de paramètre d’espace de travail, les administrateurs d’espace de travail peuvent activer ou désactiver l’Assistant Databricks pour des espaces de travail spécifiques. Pour plus d’informations, consultez Activer ou désactiver l’Assistant Databricks.

L’activation de l’Assistant Databricks pour votre compte est capturée en tant qu’événement de compte dans vos journaux d’audit, consultez Événements de compte au niveau du compte.

Informations supplémentaires

Les articles suivants contiennent des informations supplémentaires sur l’utilisation de l’Assistant Databricks :

Utilisation de l’Assistant Databricks

L’Assistant Databricks est disponible dans les notebooks, l’éditeur SQL, l’éditeur de fichiers et les tableaux de bord. Ce document se concentre sur les notebooks. L’utilisation dans les autres produits est similaire. Pour plus d’informations sur l’utilisation de l’Assistant Databricks pour créer des visualisations pour les tableaux de bord Lakeview, consultez Créer des visualisations avec l’Assistant Databricks.

Dans un notebook, l’Assistant Databricks est disponible dans le volet Assistant ou en ligne dans une cellule de code.

Utiliser l’Assistant Databricks dans une cellule de notebook

Pour utiliser l’Assistant Databricks directement dans une cellule de code, appuyez sur Cmd + i pour MacOS ou sur Ctrl + i pour Windows. Une zone de texte apparaît dans la cellule. Vous pouvez taper une question ou un commentaire en anglais, puis appuyer sur Entrée (et non Maj+Entrée, comme vous le feriez pour exécuter une cellule) pour que l’Assistant génère une réponse.

capture d’écran de l’Assistant en ligne en cours d’utilisation

Vous pouvez également taper / pour afficher une liste de commandes courantes, telles que /explain pour expliquer du code dans une cellule, /fix pour proposer un correctif si le code a une erreur et /doc pour suggérer des commentaires de documentation pour votre code.

Lorsque vous utilisez /fix ou /doc, l’Assistant affiche les modifications proposées dans une fenêtre différente. Sélectionnez Accepter pour accepter les modifications proposées ou Rejeter pour conserver le code d’origine. Si vous acceptez le code proposé, le code ne s’exécute pas automatiquement. Vous pouvez passer en revue le code avant de l’exécuter. Si le code généré n’est pas ce que vous souhaitez, réessayez en ajoutant plus de détails ou d’informations à votre commentaire. Consultez Conseils pour utiliser l’Assistant Databricks.

Pour la saisie semi-automatique du code, les performances peuvent être meilleures à l’aide du volet Assistant que dans une cellule de notebook.

Pour quitter l’Assistant dans une cellule de notebook, cliquez sur fermer l’Assistant dans le coin supérieur droit de la cellule. L’Assistant se ferme automatiquement si vous acceptez ou refusez le code qu’il a généré.

Utiliser le volet Assistant

Pour ouvrir le volet Assistant, cliquez sur icône de l’Assistant Databricks dans la barre latérale gauche.

capture d’écran du volet Assistant en cours d’utilisation

Tapez des questions dans la zone de texte en bas du volet Assistant, puis appuyez sur Entrée ou cliquez sur entrer le texte de l’Assistant à droite de la zone de texte. L’Assistant affiche sa réponse. La capture d’écran suivante montre les actions que vous pouvez effectuer une fois que l’Assistant a généré du code dans le volet Assistant.

icônes en haut de la zone de code dans le volet Assistant

Vous pouvez réexécuter la même requête pour générer une autre réponse. Pour ce faire, pointez votre curseur sur la réponse, puis cliquez sur régénérer l’icône de requête.

Pour fermer le volet, cliquez à nouveau sur l’icône ou cliquez sur fermer l’Assistant dans le coin supérieur droit de la cellule. Vous pouvez développer le volet en pleine largeur en cliquant sur ouvrir l’icône pleine largeur ; cliquez sur fermer l’icône pleine largeur pour rétablir le volet à sa largeur par défaut.

icônes situées en haut du volet Assistant

Le volet Assistant effectue le suivi de vos conversations même si vous fermez le volet ou le notebook. Pour effacer les conversations précédentes, cliquez sur clear-assistant en haut à droite du volet Assistant.

Autocomplétion basée sur l’IA

Important

Cette fonctionnalité est disponible en préversion publique.

L’autocomplétion basée sur l’IA fournit des suggestions de code inline lorsque vous tapez dans des notebooks Databricks, dans l’éditeur SQL et dans l’éditeur de fichiers. Les suggestions de code inline sont disponibles pour Python et SQL.

Activer et désactiver les suggestions de code inline

La fonctionnalité doit être activée pour chaque utilisateur de la manière suivante :

  1. Cliquez sur Icône Paramètres utilisateurParamètres.
  2. Sous Fonctionnalités expérimentales, activez Autocomplétion Assistant Databricks.

Remarque

  • Pour désactiver cette fonctionnalité pour votre espace de travail, contactez Databricks.
  • Les suggestions de code inline ne sont pas disponibles dans les régions ou espaces de travail Azure Government avec la conformité FedRAMP.

Utiliser des suggestions de code inline

Lorsque vous tapez, les suggestions s’affichent automatiquement. Appuyez sur la touche Tab pour accepter une suggestion. Pour déclencher manuellement une suggestion, appuyez sur Option + Maj + Espace (sur macOS) ou Ctrl + Maj + Espace (sur Windows).

code terminé SQL

code terminé Python

L’autocomplétion basée sur l’IA peut également générer du code à partir de commentaires :

code terminé à partir d’un commentaire

Déboguer du code

Pour utiliser l’Assistant Databricks pour corriger le code, posez une question dans le volet Assistant ou cliquez sur le bouton Diagnostiquer une erreur qui apparaît dans les résultats de la cellule en cas d’erreur. Les onglets ci-dessous présentent des exemples de code Python et SQL.

Python

exemple de débogage de l’Assistant

Sql

exemple de débogage de l’Assistant

Expliquer le code

L’Assistant Databricks peut fournir des explications détaillées sur les extraits de code. Dans l’invite que vous fournissez, vous pouvez inclure des termes tels que « be concise » ou « explain code line-by-line » pour demander le niveau de détail de l’explication fournie. Vous pouvez également demander à l’Assistant Databricks d’ajouter des commentaires au code.

Rechercher des informations pertinentes dans la documentation Azure Databricks

L’Assistant Databricks peut vous aider à répondre à des questions basées sur la documentation Databricks directement à partir de l’éditeur de notebook.

répondre à une question en fonction de la documentation Databricks

Conseils pour l’utilisation de l’Assistant Databricks

Cette section contient des conseils généraux et des meilleures pratiques lors de l’utilisation de l’Assistant Databricks.

L’Assistant Databricks utilise le contexte pour fournir de meilleures réponses

L’Assistant Databricks a accès au schéma et aux métadonnées de table et de colonne. Cela vous permet d’utiliser le langage naturel et de générer des requêtes plus précises. Par exemple, si une table a une colonne État, vous pouvez demander à l’Assistant Databricks de générer une liste d’utilisateurs qui vivent dans l’État du Michigan.

L’Assistant Databricks utilise le contexte suivant :

  • Code ou requêtes dans la cellule de notebook ou l’onglet de l’éditeur Databricks SQL actuels.
  • Noms et descriptions des tables et des colonnes.
  • Questions d’invite précédentes.
  • Tables favorites et actives.
  • Pour la fonctionnalité de Diagnostiquer une erreur, la trace de pile de la sortie d’erreur.

Lorsque vous sélectionnez des colonnes à partir d’un DataFrame, vous pouvez obtenir des résultats plus précis en fournissant une requête de démarrage. Par exemple, fournissez une instruction telle que SELECT * FROM <table_name>. Cela permet à l’Assistant Databricks d’obtenir les noms de colonnes et de ne pas avoir à deviner.

Étant donné que l’Assistant Databricks utilise votre historique des conversations pour fournir des réponses meilleures et plus précises, vous pouvez demander à l’Assistant Databricks de modifier la sortie d’une réponse précédente sans avoir à réécrire toute l’invite. Vous pouvez utiliser l’historique des discussions de l’Assistant pour nettoyer, explorer, filtrer et découper de manière itérative les DataFrames dans le volet Assistant.

Être précis

La structure et les détails que l’Assistant Databricks fournit varient de temps en temps, même pour la même invite. Essayez de fournir à l’Assistant autant de conseils que vous pouvez pour l’aider à renvoyer les informations souhaitées dans le format souhaité, le niveau de détail, et ainsi de suite. Par exemple :

  • “Expliquez ce code en quelques phrases” ou “expliquez cette ligne de code par ligne”.
  • “Créez une visualisation à l’aide de MatPlotLib” ou “créez une visualisation à l’aide de Seaborn”.

Donnez des exemples de valeurs de données au niveau des lignes

Étant donné que l’Assistant Databricks n’utilise pas de données au niveau des lignes, vous devrez peut-être fournir plus de détails aux invites pour obtenir la réponse la plus précise. Utilisez des commentaires de table ou de colonne dans l’Explorateur de catalogues pour ajouter une ligne d’exemples de données. Par exemple, supposons que votre colonne de hauteur soit au format feet-inches. Pour aider l’Assistant à interpréter les données, ajoutez un commentaire tel que “la colonne de hauteur au format chaîne et est séparé par un trait d’union. Exemple : ‘6-2’.” Pour plus d'informations sur les commentaires de table et de colonne, consultez Documenter les données dans l'Explorateur de catalogue à l'aide de commentaires markdown.

Vous devrez peut-être également fournir des détails si des conversions de type de données de colonne sont nécessaires pour effectuer une opération. Par exemple : « convertissez ce code de pandas en PySpark, y compris le code nécessaire pour convertir le DataFrame pandas en un PySpark DataFrame et en changeant le type de données de désabonnement des colonnes de booléen à entier ».

Utiliser Maj+Entrée pour ajouter une nouvelle ligne dans la zone de texte de conversation

Vous pouvez utiliser Maj+Entrée pour ajouter une nouvelle ligne dans la zone de texte de conversation de l’Assistant. Cela facilite la mise en forme et l’organisation de vos messages dans l’Assistant Databricks.

Modifier et exécuter du code dans le volet de conversation de l’Assistant Databricks

Vous pouvez exécuter du code dans le volet Assistant pour le valider ou l’utiliser comme bloc-notes. Pour exécuter du code, cliquez sur icône exécuter le code dans le coin supérieur gauche de la zone de code dans le volet Assistant. Les onglets ci-dessous présentent des exemples de code Python et SQL.

Python

exécuter le code dans le volet Assistant

Sql

exécuter le code dans le volet Assistant

Lorsque vous exécutez du code dans le volet Assistant, la sortie s’affiche et les variables deviennent utilisables dans le notebook.

Vous pouvez également modifier le code généré par l’Assistant Databricks directement dans la zone de conversation de l’Assistant avant de déplacer le code vers le notebook.