Interface et contrôles du notebook Databricks
La barre d’outils du notebook inclut des menus et des icônes que vous pouvez utiliser pour gérer et modifier le notebook.
En regard du nom du notebook se trouvent des boutons qui vous permettent de modifier la langue par défaut du notebook et, si le notebook est inclus dans un dossier Git Databricks, ouvrez la boîte de dialogue Git.
Pour afficher les versions précédentes du notebook, cliquez sur le message « Dernière modification... » à droite des menus.
Mise à jour de la conception des cellules
Important
Cette fonctionnalité est disponible en préversion publique.
Une conception mise à jour de cellule est disponible. Cette page contient des informations sur l’utilisation des deux versions de la conception de la cellule. Pour obtenir une orientation concernant la nouvelle interface utilisateur et des réponses aux questions courantes, consultez Orientation sur la nouvelle interface utilisateur de cellule.
Pour activer ou désactiver la nouvelle conception de la cellule, ouvrez la page des paramètres de l’éditeur dans l’espace de travail. Dans la barre latérale, cliquez sur Développeur. Sous Fonctionnalités expérimentales, basculez vers IU de nouvelle cellule.
Cellules du notebook
Les notebooks comportent une collection de deux types de cellules : les cellules de code et les cellules Markdown. Les cellules de code contiennent un code exécutable. Les cellules Markdown contiennent du code Markdown qui s’affiche en texte et en graphiques lorsque la cellule est exécutée et peut être utilisé pour documenter ou illustrer votre code. Vous pouvez ajouter ou supprimer des cellules à votre notebook pour structurer votre travail.
Vous pouvez exécuter une seule cellule, un groupe de cellules ou exécuter le bloc-notes entier en même temps. Une cellule de notebook peut contenir au plus 10 Mo. La sortie des cellules de notebook est limitée à 20 Mo.
Icônes et boutons de la barre d’outils Notebook
Les icônes et boutons situés à droite de la barre d’outils sont présentés dans le tableau suivant :
Icône | Description |
---|---|
Exécutez toutes les cellules ou arrêtez l’exécution. Le nom de ce bouton change en fonction de l’état du notebook. | |
Ouvrez le sélecteur de calcul. Lorsque le notebook est connecté à un cluster ou à un entrepôt SQL, ce bouton affiche le nom de la ressource de calcul. | |
Ouvrir planificateur de travaux. | |
Ouvrir Delta Live Tables. Ce bouton s’affiche uniquement si le notebook fait partie d’un pipeline Delta Live Tables. | |
Ouvrez le dialogue de permissions. |
Actions de la barre latérale droite
Plusieurs actions sont disponibles dans la barre latérale droite du notebook, comme décrit dans le tableau suivant :
Icône | Description |
---|---|
Ouvrez commentaires notebook. | |
Ouvrez expérience notebook MLflow. | |
Ouvrez l’historique des versions du notebook. | |
Ouvrir Explorateur de variables. (Disponible pour les variables Python avec Databricks Runtime 12.2 LTS et versions ultérieures.) | |
Ouvrez le panneau de l’environnement Python. Ce panneau affiche toutes les bibliothèques Python disponibles pour le notebook, notamment les bibliothèques étendues au notebook, les bibliothèques de cluster et les bibliothèques incluses dans Databricks Runtime. Disponible uniquement lorsque le notebook est attaché à un cluster. |
Parcourir des données
Important
Cette fonctionnalité est disponible en préversion publique.
Pour explorer les tables et les volumes pouvant être utilisés dans le notebook, cliquez sur l’ à gauche du notebook pour ouvrir le navigateur de schémas. Consultez Parcourir des données pour plus d’informations.
Menu actions de cellule
Le menu Actions de la cellule vous permet de couper et copier des cellules, de déplacer des cellules dans le notebook et de masquer le code ou les résultats. Le menu a une apparence différente dans l’interface utilisateur d’origine et dans la nouvelle interface utilisateur. Cette section contient des instructions pour les deux versions.
Si l’Assistant Databricks est activé dans votre espace de travail, vous pouvez l’utiliser dans une cellule de code pour obtenir de l’aide ou des suggestions concernant votre code. Pour ouvrir une zone de texte de l’Assistant Databricks dans une cellule, cliquez sur l’icône de l’Assistant Databricks dans le coin supérieur droit de la cellule.
Vous pouvez facilement modifier une cellule entre le code et Markdown, ou modifier le langage d’une cellule de code, à l’aide du bouton de langage de la cellule en haut à droite de la cellule.
Menu Actions de la cellule (IU d’origine)
Depuis ce menu, vous pouvez également exécuter des cellules de code :
Le menu Action de la cellule inclut également des boutons pour masquer une cellule ou supprimer une cellule .
Pour les cellules Markdown, il existe également une option permettant d’ajouter la cellule à un tableau de bord. Pour plus d’informations, consultez Tableaux de bord dans Notebook.
Utiliser des cellules dans la nouvelle interface utilisateur
La capture d’écran suivante décrit les icônes qui s’affichent en haut à droite d’une cellule du notebook :
Sélecteur de langage : sélectionnez le langage de la cellule.
Assistant Databricks : activez ou désactivez l’Assistant Databricks pour les suggestions de code dans la cellule.
Focus sur la cellule : agrandissez la cellule pour en faciliter la modification.
Afficher le menu Actions de la cellule : ouvrez le menu Actions de la cellule. Les options de ce menu sont légèrement différentes pour les cellules de code et Markdown.
Pour exécuter des cellules de code dans la nouvelle interface utilisateur, cliquez sur la flèche pointant vers le bas dans le coin supérieur gauche de la cellule de code.
Une fois une cellule exécutée, un avis s’affiche à droite du menu d’exécution de la cellule, montrant la date et la durée de la dernière exécution de la cellule. Placez le curseur sur l’avis pour en savoir plus.
Pour ajouter une cellule Markdown ou une cellule avec des résultats tabulaires à un tableau de bord, sélectionnez Ajouter au tableau de bord dans le menu Actions de la cellule. Pour plus d’informations, consultez Tableaux de bord dans Notebook.
Pour supprimer une cellule, cliquez sur l’icône de la corbeille à droite de la cellule. Cette icône s’affiche uniquement lorsque vous pointez votre curseur sur la cellule.
Pour ajouter un commentaire au code d’une cellule, mettez en surbrillance le code. À droite de la cellule, une icône de commentaire s’affiche. Cliquez sur l’icône pour ouvrir la zone de commentaire.
Pour déplacer une cellule vers le haut ou le bas, cliquez et maintenez sur le coin supérieur gauche de la cellule, puis faites glisser la cellule vers le nouvel emplacement. Vous pouvez également sélectionner Déplacer vers le haut ou Déplacer vers le bas dans le menu Actions de la cellule.
Créer des cellules
Les notebooks disposent de deux types de cellules : les cellules de code et les cellules Markdown. Le contenu des cellules Markdown est rendu au format HTML. Par exemple, cet extrait de code contient un balisage pour un titre de niveau un :
%md ### Libraries
Import the necessary libraries.
s’affiche comme suit :
Créer une cellule (IU d’origine)
Pour créer une cellule dans l’interface utilisateur d’origine, survolez une cellule en haut ou en bas, puis cliquez sur l’icône . Vous pouvez également utiliser le menu de cellule du notebook : cliquez sur et sélectionnez Ajouter une cellule au-dessus ou Ajouter une cellule en-dessous.
Pour une cellule de code, tapez simplement du code dans la cellule. Pour créer une cellule Markdown, sélectionnez Markdown dans le bouton langage de la cellule ou tapez %md
en haut de la cellule.
Créer une cellule (nouvelle IU)
Pour créer une cellule dans la nouvelle interface utilisateur, survolez une cellule en haut ou en bas. Cliquez sur Code ou Texte pour respectivement créer un code ou une cellule Markdown.
Couper, copier et coller des cellules
Il existe plusieurs options pour couper et copier des cellules. Si vous utilisez le navigateur Safari, seuls les raccourcis clavier sont disponibles.
- Dans le menu Actions de la cellule de l’interface utilisateur d’origine ou dans la nouvelle interface utilisateur, sélectionnezCouper la cellule ou Copier la cellule.
- Utilisez les raccourcis clavier :
Command-X
ouCtrl-X
pour couper, etCommand-C
ouCtrl-C
pour copier. - Utilisez le menu Modifier situé en haut du notebook. Sélectionnez Couper ou Copier.
Après avoir coupé ou copié des cellules, vous pouvez coller ces cellules ailleurs dans le notebook, dans un autre notebook ou dans un notebook présent dans un autre onglet ou une autre fenêtre de navigateur. Pour coller des cellules, utilisez le raccourci clavier Command-V
ou Ctrl-V
. Les cellules sont collées sous la cellule active.
Pour annuler les actions couper ou coller, vous pouvez utiliser le raccourci clavier Command-Z
, Ctrl-Z
ou les options de menu Modifier > Annuler l’action couper les cellules ou Modifier > Annuler l’action coller les cellules.
Pour sélectionner les cellules adjacentes, cliquez dans une cellule Markdown, puis utilisez Déplacer + Vers le haut ou Vers le bas pour sélectionner les cellules situées au-dessus ou en dessous. Utilisez le menu d’édition pour copier, couper, coller ou supprimer les cellules sélectionnées en tant que groupe. Pour sélectionner toutes les cellules, sélectionnez Modifier > Sélectionner toutes les cellules ou utilisez le raccourci du mode de commande Cmd+A.
Table des matières du bloc-notes
Pour afficher une table des matières générée automatiquement, cliquez sur l’icône située en haut à gauche du notebook (entre la barre latérale gauche et la cellule supérieure). La table des matières est générée à partir des en-têtes Markdown utilisés dans le notebook. Si vous utilisez la nouvelle interface utilisateur, les cellules avec des titres apparaissent également dans le sommaire.
Options d’affichage des cellules
Il existe trois options d’affichage pour les notebooks. Utilisez le menu Affichage pour modifier l’option d’affichage.
- Vue standard : les résultats s’affichent immédiatement après les cellules de code.
- Résultats uniquement : seuls les résultats sont affichés.
- Côte-à-côte : le code et les cellules de résultats sont affichés côte à côte.
Dans la nouvelle interface utilisateur, les actions sont disponibles à partir d’icônes à la marge de la cellule (la zone à droite et à gauche de la cellule). Par exemple, pour déplacer une cellule vers le haut ou vers le bas, utilisez les points d’accroche dans la marge gauche. Pour supprimer une cellule, utilisez l’icône de la corbeille dans la marge droite.
Pour faciliter la modification, cliquez sur l’icône du mode focus afin d’afficher la cellule à pleine largeur. Pour quitter le mode Focus, cliquez sur . Vous pouvez également agrandir la largeur affichée d’une cellule en désactivant Affichage > Disposition centrée.
Pour mettre automatiquement en forme toutes les cellules du notebook sur les longueurs et des espacements de ligne standard, sélectionnez Modifier Mettre en forme un notebook>.
Numéros de ligne et de commande
Pour afficher ou masquer les numéros de ligne ou les numéros de commande, sélectionnez Numéros de ligne ou Numéros de commande dans le menu Affichage. Pour les numéros de ligne, vous pouvez également utiliser le raccourci clavier Control + L.
Si vous activez les numéros de ligne ou de commande, Databricks enregistre votre préférence et les affiche dans tous les autres notebooks pour ce navigateur.
Numéros de ligne et de commande (IU d’origine)
Les numéros de commande situés au-dessus des cellules sont liés à cette commande spécifique. Si vous cliquez sur le numéro de commande d’une cellule, il met à jour votre URL pour être ancrée à cette commande. Pour obtenir un lien URL vers une commande spécifique dans votre notebook, cliquez avec le bouton droit sur le numéro de commande, puis choisissez Copier l’adresse du lien.
Numéros de ligne et de commande (Nouvelle IU)
Les numéros de ligne sont désactivés par défaut dans la nouvelle interface utilisateur. Pour les activer, sélectionnez Affichage > Numéros de ligne. Lorsqu’une cellule est dans un état d’erreur, les numéros de ligne sont affichés indépendamment de la sélection.
Pour activer/désactiver les numéros de commande, sélectionnez Afficher > Numéros de commande.
La nouvelle interface utilisateur ne contient aucun lien de numéro de commande de la cellule. Pour obtenir un lien d’URL vers une commande spécifique dans votre notebook, cliquez sur pour ouvrir le mode Focus et copiez l’URL depuis la barre d’adresses du navigateur. Pour quitter le mode Focus, cliquez sur .
Ajouter un titre de cellule
Pour ajouter un titre à une cellule à l’aide de l’interface utilisateur d’origine, sélectionnez Afficher le titre dans le menu Actions de la cellule.
Pour ajouter un titre à une cellule à l’aide de la nouvelle interface utilisateur, effectuez l’une des actions suivantes :
- Cliquez sur le numéro de cellule affiché au centre de la cellule en haut de la cellule et tapez le titre.
- Sélectionnez Ajouter un titre dans le menu Actions de cellule.
Avec la nouvelle interface utilisateur, les cellules avec des titres apparaissent dans le Sommaire du notebook.
Afficher les notebook en mode sombre
Vous pouvez choisir d’afficher les notebooks en mode sombre. Pour activer ou désactiver le mode sombre, sélectionnez Affichage > Thème et sélectionnez Thème clair ou Thème sombre.
Masquer et afficher le contenu de la cellule
Le contenu de la cellule comprend un code de cellule et le résultat générés en exécutant la cellule. Vous pouvez masquer ou afficher le résultat et le code de la cellule à l’aide du menu Actions de la cellule en haut à droite de la cellule.
Pour connaître les fonctionnalités associées, consultez Titres réductibles.
Masquer et afficher le contenu de la cellule (IU d’origine)
Pour masquer le code de la cellule ou les résultats, cliquez sur et sélectionnez Masquer le code ou Masquer le résultat. Vous pouvez également sélectionner pour afficher uniquement la première ligne d’une cellule.
Pour afficher le code ou les résultats de la cellule masquée, cliquez sur les liens Afficher :
Masquer et afficher le contenu de la cellule (Nouvelle IU)
Pour masquer le code de la cellule ou les résultats, cliquez sur le menu kebab en haut à droite de la cellule, puis sélectionnez Masquer le code ou Masquer le résultat. Vous pouvez également sélectionner Réduire la cellule pour afficher uniquement la première ligne d’une cellule. Pour développer une cellule réduite, sélectionnez Développer la cellule.
Pour afficher le code ou les résultats de la cellule masquée, cliquez sur l’icône d’affichage : .
Titres réductibles
Les cellules qui apparaissent après les cellules contenant des en-têtes Markdown maintenant être réduites dans la cellule d’en-tête. Dans le notebook, pour développer ou réduire des cellules, après des cellules contenant des titres Markdown, sélectionnez Réduire tous les titres depuis le menu Affichage. Le reste de cette section décrit comment développer ou réduire un sous-ensemble de cellules.
Pour les fonctionnalités associées, consultez Masquer et afficher le contenu d’une cellule.
Développer et réduire les titres (IU d’origine)
L’image montre un titre de niveau deux Configuration Mlflow avec les deux cellules suivantes qui y sont réduites.
Pour développer et réduire les titres, cliquez sur + et -.
Développer et réduire les titres (Nouvelle IU)
L’image montre un titre de niveau deux Configuration Mlflow avec les deux cellules suivantes qui y sont réduites.
Pour développer et réduire les titres, placez le curseur sur la cellule Markdown. Cliquez sur la flèche apparaissant à gauche de la cellule.
Ressources de calcul pour les notebooks
Cette section décrit les options pour les ressources de calcul de notebook. Vous pouvez exécuter un notebook sur un cluster Databricks ou, pour les commandes SQL, vous avez également la possibilité d’utiliser un entrepôt SQL, un type de calcul optimisé pour l’analytique SQL.
Attacher un notebook à votre cluster
Pour attacher un notebook à un cluster, vous devez disposer de l’autorisation PEUT JOINDRE À au niveau du cluster.
Important
Tant qu’un notebook est attaché à un cluster, tout utilisateur disposant de l’autorisation PEUT EXÉCUTER sur le Notebook a des autorisations implicites pour accéder au cluster.
Pour attacher un notebook à un cluster, cliquez sur le sélecteur de cluster dans la barre d’outils du notebook et sélectionnez un cluster dans le menu déroulant.
Le menu affiche une sélection de clusters que vous avez utilisés récemment ou qui sont actuellement en cours d’exécution.
Pour sélectionner parmi tous les clusters disponibles, cliquez sur Plus.... Cliquez sur le nom du cluster pour afficher un menu déroulant, puis sélectionnez un cluster existant.
Vous pouvez également créer un nouveau cluster en sélectionnant Créer une nouvelle ressource... dans le menu déroulant.
Important
Les variables Apache Spark suivantes sont définies pour un notebook attaché.
Classe | Nom de la variable |
---|---|
SparkContext |
sc |
SQLContext /HiveContext |
sqlContext |
SparkSession (Spark 2.x) |
spark |
Ne créez pas de SparkSession
, SparkContext
ou SQLContext
. Cela entraînera un comportement incohérent.
Utiliser un notebook avec un entrepôt SQL
Lorsqu’un notebook est attaché à un entrepôt SQL, vous pouvez exécuter des cellules SQL et Markdown. L’exécution d’une cellule dans n’importe quel autre langage (comme Python ou R) génère une erreur. Les cellules SQL exécutées sur un entrepôt SQL apparaissent dans l’historique des requêtes de l’entrepôt SQL. L’utilisateur qui a exécuté une requête peut afficher le profil de requête à partir du notebook en cliquant sur la durée écoulée en bas de la sortie.
L’exécution d’un notebook nécessite un entrepôt SQL Pro ou Serverless. Vous devez avoir accès à l’espace de travail et à l’entrepôt SQL.
Les widgets fonctionnent différemment lorsqu’un notebook est attaché à un entrepôt SQL. Pour plus d’informations, consultez Utiliser des widgets Databricks sur un SQL Warehouse.
Pour attacher un notebook à un entrepôt SQL, procédez comme suit :
Cliquez sur le sélecteur de calcul dans la barre d’outils du notebook. Le menu déroulant affiche les ressources de calcul en cours d’exécution ou que vous avez utilisées récemment. Les entrepôts SQL sont marqués de l’.
Dans le menu, sélectionnez un entrepôt SQL.
Pour afficher tous les entrepôts SQL disponibles, sélectionnez Plus... dans le menu déroulant. Une boîte de dialogue indique les ressources de calcul disponibles pour le notebook. Sélectionnez Entrepôt SQL, choisissez l’entrepôt que vous souhaitez utiliser, puis cliquez sur Joindre.
Vous pouvez également sélectionner un entrepôt SQL comme ressource de calcul, pour un notebook SQL, à la création d’un workflow ou d’un travail planifié.
Les limitations des entrepôts SQL sont les suivantes :
- Lorsqu’ils sont attachés à un entrepôt SQL, les contextes d’exécution ont un délai d’inactivité de 8 heures.
- La taille maximale des résultats retournés est de 10 000 lignes ou 2 Mo, selon la taille la plus petite.
Détacher un notebook
Pour détacher un notebook d’une ressource de calcul, cliquez sur le sélecteur de calcul dans la barre d’outils du notebook et survolez le cluster ou l’entrepôt SQL attaché dans la liste pour afficher un menu latéral. Depuis le menu latéral, sélectionnez Détacher.
Vous pouvez également détacher des notebooks d’un cluster à l’aide de l’onglet Notebooks de la page de détails du cluster.
Lorsque vous détachez un notebook, le contexte d’exécution est supprimé et toutes les valeurs des variables calculées sont effacées du notebook.
Conseil
Azure Databricks vous recommande de détacher des notebooks inutilisés des clusters. Cela libère de l’espace mémoire sur le pilote.
Utiliser le terminal web et l’interface CLI Databricks
Pour ouvrir le terminal web dans un notebook, cliquez sur en bas de la barre latérale droite.
Utiliser l’interface CLI Databricks dans un terminal web
À compter de Databricks Runtime 15.0, vous pouvez utiliser l’interface CLI Databricks à partir du terminal web dans le notebook.
Spécifications
- Le notebook doit être attaché à un cluster en mode d’accès Un seul utilisateur ou Aucun isolement partagé.
- L’interface CLI n’est pas disponible dans les espaces de travail activés pour Private Link.
L’interface CLI installée est toujours la dernière version. L’authentification est basée sur l’utilisateur actuel.
Vous ne pouvez pas utiliser l’interface CLI à partir d’une cellule de notebook. Les commandes comme %sh databricks ...
dans un notebook ne fonctionnent pas avec Databricks Runtime 15.0 ou version ultérieure.