Share via


Qu’est-ce que l’Assistant Databricks ?

Important

Cette fonctionnalité est actuellement en préversion publique. L’utilisation de la fonctionnalité pendant la préversion est gratuite. La tarification finale sera établie et communiquée avant la disponibilité générale (GA).

L’Assistant Databricks fonctionne en tant que programmeur-paire complémentaire basé sur l’IA pour vous rendre plus productif lorsque vous créez des notebooks, des requêtes et des fichiers. Il peut vous aider à répondre rapidement aux questions en générant, en optimisant, en complétant, en expliquant et en corrigeant le code et les requêtes.

Cette page fournit des informations générales sur l’Assistant sous la forme de questions fréquemment posées. Pour toute question sur la confidentialité et la sécurité, consultez Confidentialité et sécurité.

Activer ou désactiver l’Assistant Databricks

L’Assistant Databricks est activé par défaut.

Pour activer ou désactiver tous les espaces de travail dans un compte pour l’assistant Databricks, suivez ces instructions :

  1. En tant qu’administrateur de compte, connectez-vous à la console de compte.

    Important

    Si aucun utilisateur de votre locataire Microsoft Entra ID (anciennement Azure Active Directory) n’est encore connecté à la console de compte, vous ou un autre utilisateur de votre locataire devez vous connecter comme premier administrateur de compte. Pour ce faire, vous devez être Administrateur général Microsoft Entra ID, mais uniquement quand vous vous connectez pour la première fois à la console de compte Azure Databricks. Dès la première connexion, vous devenez administrateur de compte Azure Databricks et n’avez plus besoin du rôle Administrateur général Microsoft Entra ID pour accéder au compte Azure Databricks. En tant que premier administrateur de compte, vous pouvez attribuer des utilisateurs dans le locataire Microsoft Entra ID comme administrateurs de compte supplémentaires (qui peuvent eux-mêmes attribuer davantage d’administrateurs de compte). Les administrateurs de compte supplémentaires ne nécessitent pas de rôles spécifiques dans Microsoft Entra ID. Consultez Gérer les utilisateurs, les principaux de service et les groupes.

  2. Cliquez sur ParamètresIcône Paramètres.

  3. Cliquez sur l’onglet Activation des fonctionnalités.

  4. Dans la section Fonctionnalités d’assistance IA optimisées par Azure AI services, sélectionnez Activé ou Désactivé, puis cliquez sur Enregistrer. Vous pouvez empêcher les remplacements des paramètres de l’espace de travail pour cette fonctionnalité en activant le paramètre Appliquer.

Si le paramètre de compte autorise les remplacements des paramètres de l’espace de travail, les administrateurs de l’espace de travail peuvent activer ou désactiver des espaces de travail spécifiques. Pour ce faire, utilisez un paramètre d’espace de travail pour remplacer le paramètre par défaut dans la console de compte comme suit :

  1. Accédez à la page des paramètres d’administration de l’espace de travail.
  2. Cliquez sur l’onglet Avancé.
  3. Utilisez le menu déroulant Fonctionnalités d'assistance à IA optimisées par Azure AI services pour faire votre sélection.
  4. Cliquez sur Enregistrer.

Utiliser l’Assistant Databricks pour une aide et des suggestions de codage

Pour accéder à l’Assistant Databricks, cliquez sur l’icône d’Assistant icône de l’Assistant Databricks dans la barre latérale gauche du notebook, de l’éditeur de fichiers, de l’éditeur SQL ou de l’onglet Données du tableau de bord.

Emplacement de l’icône de l’Assistant Databricks

Le panneau Assistant s’ouvre sur le côté gauche de l’écran.

Panneau de l’Assistant Databricks

Certaines fonctionnalités de l’Assistant Databricks sont les suivantes :

  • Générer : utilisez le langage naturel pour générer une requête SQL.
  • Expliquer : mettez en surbrillance une requête ou un bloc de code et faites en sorte que l’Assistant Databricks parcoure la logique en anglais clair et concis.
  • Correctif : expliquez et corrigez les erreurs de syntaxe et de runtime en un seul clic.
  • Transformer et optimiser : convertissez du code Pandas en PySpark pour une exécution plus rapide.

Tout code généré par l’Assistant Databricks est destiné à être exécuté dans un environnement de calcul Databricks. Il est optimisé pour créer du code dans les langages de programmation, les infrastructures et les dialectes pris en charge par Databricks. Il n’est pas destiné à être un assistant de programmation à usage général. L’Assistant utilise souvent des informations provenant des bases de connaissances Databricks, telles que la documentation, afin de mieux répondre aux requêtes des utilisateurs. Il est plus performant lorsque la question de l’utilisateur est liée aux questions qui peuvent être répondues à l’aide des connaissances de la documentation Databricks, du catalogue Unity et du code utilisateur dans l’espace de travail.

Les utilisateurs doivent toujours vérifier le code généré par l’Assistant avant l’exécution, car il peut parfois commettre des erreurs.

Créer des visualisations en utilisant l’Assistant Databricks pour des tableaux de bord

Vous pouvez utiliser l’Assistant Databricks lors de l’élaboration de tableaux de bord. Quand vous créez des visualisations sur un jeu de données de tableau de bord existant, interrogez l’Assistant avec des questions à répondre sous forme de graphiques générés. Pour utiliser l’Assistant dans un tableau de bord, créez d’abord un ou plusieurs jeux de données, puis ajoutez un widget de visualisation dans le canevas. Le widget de visualisation comprend une invite pour décrire votre nouveau graphique. Tapez la description du graphique que vous souhaitez voir pour que l’assistant le génère. Vous pouvez approuver ou refuser le graphique, ou modifier la description pour générer quelque chose de nouveau. Si vous souhaitez obtenir des informations et des exemples sur l’utilisation de l’Assistant avec des tableaux de bord, consultez Créer des visualisations avec l’Assistant Databricks.

Services utilisés par l’Assistant Databricks

L’assistant Databricks utilise les services Azure OpenAI pour fournir des réponses. Le service Azure OpenAI est géré par Microsoft, pas OpenAI, et est soumis à leurs stratégies de gestion des données respectives. Les données envoyées à ce service ne sont pas utilisées pour l’apprentissage de modèle. Pour Azure OpenAI, Azure Databricks a choisi de ne pas utiliser la surveillance des abus, donc aucune invite ou réponse n’est stockée avec Azure OpenAI. Pour obtenir plus de détails, consultez la stratégie de gestion des données Azure.

Conseils pour améliorer la précision des résultats retournés

  • Soyez aussi précis que possible. Spécifiez des tables et des exemples de ce à quoi ressemblent les données.
  • L’Assistant Databricks connaît votre schéma et vos métadonnées de table et de colonne. Cela vous permet d’utiliser le langage naturel et de générer des requêtes assez précises. Par exemple, si votre table comporte des colonnes userID et State, vous pouvez demander à l’Assistant Databricks de générer une liste d’utilisateurs qui vivent à Washington.
  • L’Assistant Databricks a uniquement accès aux métadonnées de table et de colonne et n’a pas accès aux données au niveau des lignes. Par conséquent, il se peut qu’il n’écrive pas correctement des requêtes si les données réelles ont des formes uniques. Par exemple, si vous avez une colonne Priceet que chaque valeur ajoute une dénomination de pays (par exemple, 10,99 $ USD, 5,99 $ CA), la requête retournée peut avoir des difficultés à additionner cette colonne, car il ne s’agit pas d’une valeur DECIMAL. Essayez de fournir des instructions spécifiques à l’Assistant Databricks pour analyser cette colonne. Par exemple : « Somme du revenu total des craqueurs. Price est une colonne de chaîne qui a une dénomination de pays ajoutée à chaque valeur monétaire comme « 10,99 $ USD ».

L’Assistant Databricks prend en compte l’historique de la conversation afin que vous puissiez affiner vos questions au fur et à mesure.

Envoyer des commentaires

La meilleure façon d’envoyer des commentaires consiste à utiliser les liens « Fournir des commentaires » dans le notebook et l’éditeur SQL. Vous pouvez également envoyer un e-mail à assistant-feedback@databricks.com ou à votre équipe de compte.

Nous sommes principalement intéressés par les suggestions d’amélioration des produits et les problèmes d’expérience utilisateur plutôt que par la précision rapide. Si vous recevez une suggestion inutile de l’Assistant, cliquez sur le bouton « Non utile » pour nous permettre de capturer ces commentaires.

Confidentialité et sécurité

Q : Quelles données sont envoyées aux modèles ?

L’Assistant Databricks envoie du code et des métadonnées aux modèles sur chaque requête d’API. Cela permet de retourner des résultats plus pertinents pour vos données. Voici quelques exemples :

  • Code/requêtes dans la cellule de notebook active ou l’onglet Éditeur SQL
  • Noms et descriptions des tables et des colonnes
  • Questions précédentes
  • Tables favorites

Q : Les métadonnées envoyées aux modèles respectent-elles les autorisations du catalogue Unity de l’utilisateur ?

Oui, toutes les données envoyées au modèle respectent les autorisations du catalogue Unity de l’utilisateur. Aucune métadonnée relative aux tables pour lesquelles l’utilisateur n’est pas autorisé n’est envoyée.

Q : Si j’exécute une requête avec des résultats, puis que je pose une question, les résultats de ma requête sont-ils envoyés au modèle ?

Non, seul le contenu du code dans les cellules, les métadonnées relatives aux tables et le texte entré par l’utilisateur sont partagés avec le modèle. Pour la fonctionnalité « corriger l’erreur », Databricks partage également l’arborescence des appels de procédure à partir de la sortie de l’erreur.

Q : L’Assistant Databricks exécutera-t-il du code dangereux ?

Nombre L’Assistant Databricks n’exécute pas automatiquement le code en votre nom. Les modèles IA peuvent faire des erreurs, mal comprendre l’intention et halluciner ou donner des réponses incorrectes. Veillez à évaluer le code généré par l’IA avant de l’exécuter.

Q : Databricks a-t-il effectué une évaluation pour évaluer la précision et l’adéquation des réponses de l’Assistant ?

Oui. Databricks dispose d’atténuations pour empêcher l’Assistant de générer des réponses dangereuses telles qu’un discours haineux, du code non sécurisé, des jailbreaks d’invite et du contenu de droits d’auteur tiers. Databricks a effectué des tests approfondis de toutes nos fonctionnalités d’assistance IA avec des milliers d’entrées utilisateur simulées pour évaluer la robustesse des atténuations. Ces évaluations se sont concentrées sur les cas d’usage attendus pour l’Assistant, comme la génération de code dans les langages Python, Databricks SQL, R et Scala.

Q : Puis-je utiliser l’Assistant Databricks avec des tables qui traitent des données réglementées (PHI, PCI, IRAP, FedRAMP) ?

Oui. Pour cela, vous devez respecter les exigences, telles que l’activation du profil de sécurité de conformité, et ajouter la norme de conformité appropriée dans le cadre de la configuration du profil de sécurité de conformité.