Utiliser des notebooks

Un notebook est une collection de cellules exécutables (commandes). Lorsque vous utilisez un notebook, vous développez et exécutez principalement des cellules.

Toutes les tâches du bloc-notes sont prises en charge par les actions de l’interface utilisateur, mais vous pouvez également effectuer de nombreuses tâches à l’aide des raccourcis clavier. Basculez l’affichage du raccourci en cliquant sur l’icône icône de clavier .

Développer des blocs-notes

Cette section décrit comment développer des cellules de bloc-notes et naviguer dans un bloc-notes.

Dans cette section :

À propos des blocs-notes

Un bloc-notes comporte une barre d’outils qui vous permet de gérer le bloc-notes et d’effectuer des actions dans le bloc-notes :

Barre d’outils du bloc-notes

et une ou plusieurs cellules (ou commandes) que vous pouvez exécuter :

Cellules du bloc-notes

À l’extrême droite d’une cellule, les actions de celluleactions de cellule contiennent trois menus : exécuter, tableau de bordet modifier:

Icône d’exécutiontableau de bordmodifier

et deux actions : masquer les icônesréduire et supprimer les cellules .

Ajouter une cellule

Pour ajouter une cellule, pointez avec la souris sur une cellule en haut ou en bas, cliquez sur l’icône Ajouter une cellule ou accédez au menu de la cellule du bloc-notes à l’extrême droite, cliquez sur le signe insertion vers le bas, puis sélectionnez Ajouter une cellule au-dessus ou Ajouter une cellule en dessous.

Supprimer une cellule

Accédez aux actions des cellules du menu actions de la cellule à l’extrême droite, puis cliquez sur l' icône Supprimer (supprimer).

Lorsque vous supprimez une cellule, une boîte de dialogue de confirmation de suppression s’affiche par défaut. Pour désactiver les boîtes de dialogue de confirmation ultérieures, activez la case à cocher ne plus afficher cette boîte de dialogue, puis cliquez sur confirmer. vous pouvez également activer/désactiver la boîte de dialogue de confirmation avec l’option activer la confirmation de la commande supprimer de l' utilisateur Paramètres icône utilisateur Paramètres User Settings Icon bloc-notes Paramètres.

Pour restaurer des cellules supprimées, sélectionnez modifier annuler supprimer les cellules ou utilisez le Z raccourci clavier ().

Couper une cellule

Accédez aux actions des cellules du menu actions de la cellule à l’extrême droite, cliquez sur le signe insertion vers le haut, puis sélectionnez couper la cellule.

Vous pouvez également utiliser le X raccourci clavier ().

Pour restaurer des cellules supprimées, sélectionnez modifier Annuler couper les cellules ou utilisez le Z raccourci clavier ().

Sélectionner plusieurs cellules ou toutes les cellules

Vous pouvez sélectionner des cellules de bloc-notes adjacentes en utilisant MAJvers le haut ou vers lehaut pour la cellule précédente et suivante, respectivement. Les cellules à sélection multiple peuvent être copiées, coupées, supprimées et collées.

Pour sélectionner toutes les cellules, sélectionnez modifier Sélectionner toutes les cellules ou utilisez le raccourci de mode de commande cmd + A.

Langue par défaut

La langue par défaut du bloc-notes est indiquée par un bouton en regard du nom du bloc-notes. Dans le bloc-notes suivant, la langue par défaut est SQL.

Langue par défaut du bloc-notes

Pour modifier la langue par défaut :

  1. Cliquez sur le bouton langue. La boîte de dialogue Modifier la langue par défaut s’affiche.

    Modifier la langue par défaut

  2. Sélectionnez la nouvelle langue dans la liste déroulante langue par défaut .

  3. Cliquez sur Modifier.

  4. Pour vous assurer que les commandes existantes continuent de fonctionner, les commandes de la langue par défaut précédente sont automatiquement précédées d’une commande Magic Language.

Mélanger les langues

Par défaut, les cellules utilisent la langue par défaut du bloc-notes. Vous pouvez remplacer la langue par défaut dans une cellule en cliquant sur le bouton langue et en sélectionnant une langue dans la liste déroulante.

Liste déroulante des langues des cellules

Vous pouvez également utiliser la commande Magic Language %<language> au début d’une cellule. Les commandes Magic prises en charge sont les suivantes : %python ,, %r%scala et %sql .

Notes

Lorsque vous appelez une commande Magic de langue, la commande est distribuée à la valeur REPL dans le contexte d’exécution du bloc-notes. Les variables définies dans une langue (et par conséquent dans le REPL pour cette langue) ne sont pas disponibles dans la REPL d’une autre langue. Loop peut partager l’état uniquement via des ressources externes telles que des fichiers dans DBFS ou des objets dans le stockage d’objets.

Les notebooks prennent également en charge quelques commandes magic auxiliaires :

  • %sh: Vous permet d’exécuter du code Shell dans votre bloc-notes. Pour faire échouer la cellule si la commande de l’interpréteur de commandes a un état de sortie différent de zéro, ajoutez l' -e option. Cette commande s’exécute uniquement sur le pilote Apache Spark, et non sur les threads de travail. Pour exécuter une commande shell sur tous les nœuds, utilisez un script init.
  • %fs: Vous permet d’utiliser des dbutils commandes FileSystem. Par exemple, pour exécuter la dbutils.fs.ls commande pour répertorier les fichiers, vous pouvez spécifier à la %fs ls place. Pour plus d’informations, consultez utiliser les commandes magiques% FS.
  • %md : Vous permet d’inclure différents types de documentation, notamment du texte, des images, des formules mathématiques et des équations. Voir la section suivante.

Inclure la documentation

Pour inclure la documentation dans un bloc-notes, vous pouvez créer une cellule de démarque, soit en sélectionnant démarque à partir du bouton de langue de la cellule, soit en utilisant la commande Magic. Le contenu de la cellule est rendu au format HTML. Par exemple, cet extrait de code contient un balisage pour un titre de niveau un :

%md # Hello This is a Title

Elle est rendue sous la forme d’un titre HTML :

Titre HTML du bloc-notes

Titres réductibles

Les cellules qui apparaissent après les cellules contenant des en-têtes de démarque peuvent être réduites dans la cellule d’en-tête. L’illustration suivante montre un titre de niveau un, appelé titre 1 , avec les deux cellules suivantes réduites.

Cellules réduites

Pour développer et réduire les en-têtes, cliquez sur + et - .

Voir aussi masquer et afficher le contenu de la cellule.

Pour développer ou réduire des cellules après des cellules contenant des en-têtes de démarque dans le bloc-notes, sélectionnez tous les en-têtes ou réduire tous les en-têtes dans le menu affichage .

développer-réduire tout dans le menu Affichage

Vous pouvez créer un lien vers d’autres blocs-notes ou dossiers dans des cellules de démarque en utilisant des chemins d’accès relatifs. Spécifiez l' href attribut d’une balise d’ancrage en tant que chemin d’accès relatif, en commençant par un, $ puis suivez le même modèle que dans les systèmes de fichiers UNIX :

%md
<a href="$./myNotebook">Link to notebook in same folder as current notebook</a>
<a href="$../myFolder">Link to folder in parent folder of current notebook</a>
<a href="$./myFolder2/myNotebook2">Link to nested notebook</a>

Afficher les images

Pour afficher les images stockées dans le cachede stockage, utilisez la syntaxe suivante :

%md
![test](files/image.png)

Supposons, par exemple, que vous disposiez du fichier image du logo Databricks dans le fichier de fichiers :

dbfs ls dbfs:/FileStore/
databricks-logo-mobile.png

Lorsque vous incluez le code suivant dans une cellule de marque :

Image dans la cellule de la marque

l’image est rendue dans la cellule :

Image rendue

Afficher les équations mathématiques

Les blocs-notes prennent en charge KaTeX pour l’affichage des formules mathématiques et des équations. Par exemple,

%md
\\(c = \\pm\\sqrt{a^2 + b^2} \\)

\\(A{_i}{_j}=B{_i}{_j}\\)

$$c = \\pm\\sqrt{a^2 + b^2}$$

\\[A{_i}{_j}=B{_i}{_j}\\]

devient :

Équation rendue 1

et

%md
\\( f(\beta)= -Y_t^T X_t \beta + \sum log( 1+{e}^{X_t\bullet\beta}) + \frac{1}{2}\delta^t S_t^{-1}\delta\\)

where \\(\delta=(\beta - \mu_{t-1})\\)

devient :

Équation affichée 2

Inclure HTML

Vous pouvez inclure du code HTML dans un bloc-notes à l’aide de la fonction displayHTML . Pour obtenir un exemple de la procédure à suivre , consultez HTML, D3 et SVG dans les blocs-notes .

Notes

L' displayHTML IFRAME est servi à partir du domaine databricksusercontent.com et le bac à sable (sandbox) iframe comprend l' allow-same-origin attribut. databricksusercontent.com doit être accessible à partir de votre navigateur. S’il est bloqué par votre réseau d’entreprise, il doit être ajouter dans une liste verte.

Commentaires sur les commandes

Vous pouvez avoir des discussions avec les collaborateurs à l’aide de commentaires de commande.

Pour activer/désactiver la barre latérale des commentaires, cliquez sur le bouton Commentaires en haut à droite d’un bloc-notes.

Activer/désactiver les commentaires du Notebook

Pour ajouter un commentaire à une commande :

  1. Mettez en surbrillance le texte de la commande, puis cliquez sur la bulle de commentaire :

    Ouvrir les commentaires

  2. Ajoutez votre commentaire, puis cliquez sur Commentaire.

    Ajouter un commentaire

Pour modifier, supprimer ou répondre à un commentaire, cliquez sur le commentaire et choisissez une action.

Modifier le commentaire

Modifier l’affichage des cellules

Il existe trois options d’affichage pour les blocs-notes :

  • Vue standard : les résultats s’affichent immédiatement après les cellules de code
  • Résultats uniquement : seuls les résultats sont affichés
  • Côte à côte : le code et les cellules de résultats sont affichés côte à côte, avec les résultats à droite

Accédez au menu affichage du menu Affichage pour sélectionner votre option d’affichage.

vue côte à côte

Afficher les numéros de ligne et de commande

Pour afficher les numéros de ligne ou les numéros de commande, accédez au menu affichage du menu Affichage et sélectionnez afficher les numéros de ligne ou afficher les numéros de commande. Une fois qu’ils sont affichés, vous pouvez les masquer à nouveau dans le même menu. Vous pouvez également activer les numéros de ligne à l’aide du raccourci clavier Ctrl + L.

Afficher les numéros de ligne ou de commande via le menu Affichage

Numéros de ligne et de commande activés dans le bloc-notes

Si vous activez les numéros de ligne ou de commande, Databricks enregistre votre préférence et les affiche dans tous les autres blocs-notes pour ce navigateur.

Les numéros de commande situés au-dessus des cellules sont liés à cette commande spécifique. Si vous cliquez sur le numéro de commande d’une cellule, il met à jour votre URL pour être ancrée à cette commande. Si vous souhaitez créer un lien vers une commande spécifique dans votre bloc-notes, cliquez avec le bouton droit sur le numéro de commande, puis choisissez copier l’adresse du lien.

Rechercher et remplacer du texte

Pour rechercher et remplacer du texte dans un bloc-notes, sélectionnez modifier Rechercher et remplacer. La correspondance actuelle est mise en surbrillance en orange et toutes les autres correspondances sont mises en surbrillance en jaune.

Texte correspondant

Pour remplacer la correspondance actuelle, cliquez sur remplacer. Pour remplacer toutes les correspondances dans le bloc-notes, cliquez sur remplacer tout.

Pour vous déplacer entre les correspondances, cliquez sur les boutons précédent et suivant . Vous pouvez également appuyer sur MAJ + entrée et sur entrée pour accéder aux correspondances précédentes et suivantes, respectivement.

Pour fermer l’outil Rechercher et remplacer, cliquez sur l' icône Supprimer ou appuyez sur Échap.

Autocomplétion

Vous pouvez utiliser Azure Databricks la saisie semi-automatique pour compléter automatiquement les segments de code au fur et à mesure que vous les tapez. Azure Databricks prend en charge deux types de saisie semi-automatique : local et serveur.

La saisie semi-automatique locale complète les mots définis dans le bloc-notes. la saisie semi-automatique du serveur accède au cluster pour les types, les classes et les objets définis, ainsi que les noms des bases de données et des tables SQL. Pour activer la saisie semi-automatique du serveur, attachez votre bloc-notes à un cluster et Exécutez toutes les cellules qui définissent des objets pouvant être mis à la valeur.

Important

La saisie semi-automatique du serveur dans les blocs-notes R est bloquée pendant l’exécution de la commande.

Pour déclencher la saisie semi-automatique, appuyez sur Tab après avoir entré un objet complet. Par exemple, une fois que vous avez défini et exécuté les cellules qui contiennent les définitions de MyClass et instance , les méthodes de instance peuvent être validées, et une liste des saisies semi-automatiques valides s’affiche lorsque vous appuyez sur la touche MyClass.

Saisie semi-automatique des déclencheurs

la saisie semi-automatique de Type et le fonctionnement de la SQL de la base de données et du nom de table sont identiques.

saisie semi-automatique : — SQL achèvement

Dans Databricks Runtime 7,4 et versions ultérieures, vous pouvez afficher les indicateurs python DocString en appuyant sur MAJ + TAB après avoir entré un objet python complet. Le docstrings contient les mêmes informations que la help() fonction pour un objet.

DocString python

SQL de format

Azure Databricks fournit des outils qui vous permettent de mettre en forme des SQL du code dans des cellules de bloc-notes rapidement et facilement. Ces outils réduisent l’effort de mise en forme de votre code et d’application des mêmes normes de codage dans vos blocs-notes.

Vous pouvez déclencher le formateur des manières suivantes :

  • Cellules uniques

    • Raccourci clavier : Appuyez sur cmd + Maj + F.

    • menu contextuel de la commande : sélectionnez Format SQL dans le menu déroulant du contexte de commande d’une cellule SQL. cet élément est visible uniquement dans SQL cellules de bloc-notes et celles avec une %sql%sql.

      mise en forme des SQL à partir du contexte de commande

  • Cellules multiples

    sélectionnez plusieurs cellules SQL , puis sélectionnez modifier le Format SQL cellules. si vous sélectionnez des cellules de plusieurs langues, seules les cellules SQL sont mises en forme. Cela comprend ceux qui utilisent %sql .

    mise en forme des SQL à partir du Menu edition

Voici la première cellule de l’exemple précédent après une mise en forme :

Après la mise en forme SQL

Afficher la table des matières

Pour afficher une table des matières générée automatiquement, cliquez sur la flèche située en haut à gauche du bloc-notes (entre la barre latérale et la cellule supérieure). La table des matières est générée à partir des en-têtes de démarque utilisés dans le bloc-notes.

Ouvrir la table des matières

Pour fermer la table des matières, cliquez sur la flèche orientée vers la gauche.

Fermer la table des matières

Afficher les blocs-notes en mode sombre

Vous pouvez choisir d’afficher les blocs-notes en mode sombre. Pour activer ou désactiver le mode sombre, sélectionnez afficher le thème du bloc-notes et sélectionnez thème clair ou thème foncé.

Mode Light ou Dark du bloc-notes

Exécuter des blocs-notes

Cette section décrit comment exécuter une ou plusieurs cellules de bloc-notes.

Dans cette section :

Spécifications

Le bloc-notes doit être attaché à un cluster. Si le cluster n’est pas en cours d’exécution, le cluster est démarré lorsque vous exécutez une ou plusieurs cellules.

Exécuter une cellule

Dans le menu actions de la cellule actions de cellule à l’extrême droite, cliquez sur l' icône exécuter et sélectionnez exécuter la cellule, ou appuyez sur MAJ + entrée.

Important

La taille maximale d’une cellule de bloc-notes, du contenu et de la sortie, est de 16 Mo.

Par exemple, essayez d’exécuter cet extrait de code Python qui fait référence à la variable prédéfinie sparkspark.

spark

puis, exécutez du code réel :

1+1 # => 2

Notes

Les blocs-notes ont un certain nombre de paramètres par défaut :

  • Lorsque vous exécutez une cellule, le bloc-notes est automatiquement attaché à un cluster en cours d’exécution sans invite.
  • Lorsque vous appuyez sur MAJ + entrée, le bloc-notes défile automatiquement vers la cellule suivante si la cellule n’est pas visible.

pour modifier ces paramètres, sélectionnez utilisateur Paramètres icôneUser Settings Icon utilisateur Paramètres bloc-notes Paramètres et configurez les cases à cocher correspondantes.

Exécuter tout au-dessus ou en dessous

Pour exécuter toutes les cellules avant ou après une cellule, accédez aux actions des cellules du menu actions de la cellule à l’extrême droite, cliquez sur le menu exécuter, puis sélectionnez exécuter tout ci-dessus ou exécuter tousles éléments ci-dessous.

Exécuter tout ci-dessous comprend la cellule dans laquelle vous vous trouvez. Exécuter tout ce qui précède ne le fait pas.

Exécuter toutes les cellules

Pour exécuter toutes les cellules d’un bloc-notes, sélectionnez exécuter tout dans la barre d’outils du bloc-notes.

Important

N’exécutez pas l’opération exécuter tout si les étapes de montage et de démontage se trouvent dans le même bloc-notes. Cela peut entraîner une condition de concurrence et éventuellement corrompre les points de montage.

Afficher plusieurs sorties par cellule

Les blocs-notes et les %python cellules python dans les blocs-notes non-python prennent en charge plusieurs sorties par cellule.

Plusieurs sorties dans une même cellule

Cette fonctionnalité requiert Databricks Runtime 7,1 ou version ultérieure et peut être activée dans Databricks Runtime 7,1-Databricks Runtime 7,3 en définissant spark.databricks.workspace.multipleResults.enabled true . Il est activé par défaut dans Databricks Runtime 7,4 et versions ultérieures.

Mise en surbrillance des erreurs Python et Scala

Les blocs-notes Python et Scala prennent en charge la mise en surbrillance des erreurs. Autrement dit, la ligne de code qui lève l’erreur est mise en surbrillance dans la cellule. En outre, si la sortie d’erreur est un StackTrace, la cellule dans laquelle l’erreur est générée est affichée dans le StackTrace sous la forme d’un lien vers la cellule. Vous pouvez cliquer sur ce lien pour accéder au code incriminé.

Mise en surbrillance des erreurs python

Mise en surbrillance des erreurs Scala

Notifications

Les notifications vous alertent pour certains événements, tels que la commande qui est en cours d’exécution pendant l' exécution de toutes les cellules et les commandes en état d’erreur. Lorsque votre Notebook affiche plusieurs notifications d’erreur, la première dispose d’un lien qui vous permet de supprimer toutes les notifications.

Notifications du Notebook

Les notifications de bloc-notes sont activées par défaut. vous pouvez les désactiver sous utilisateur Paramètres icôneUser Settings Icon utilisateur Paramètres bloc-notes Paramètres.

Databricks Advisor

Databricks Advisor analyse automatiquement les commandes chaque fois qu’elles sont exécutées et affiche les conseils appropriés dans les blocs-notes. Les avis de Conseil fournissent des informations qui peuvent vous aider à améliorer les performances des charges de travail, à réduire les coûts et à éviter les erreurs courantes.

Afficher les conseils

Une zone bleue avec une icône d’ampoule signale que des conseils sont disponibles pour une commande. La zone affiche le nombre d’éléments de Conseil distincts.

Conseil Databricks

Cliquez sur l’ampoule pour développer la zone et afficher les conseils. Un ou plusieurs conseils seront visibles.

Afficher les conseils

Cliquez sur le lien en savoir plus pour afficher la documentation qui fournit plus d’informations relatives aux conseils.

Cliquez sur le lien ne plus afficher ce message pour masquer le Conseil. Les conseils de ce type ne seront plus affichés. cette action peut être inversée dans le Paramètres du bloc-notes.

Cliquez à nouveau sur ampoule pour réduire la boîte de Conseil.

Paramètres de Conseil

accédez à la page Paramètres du bloc-notes en sélectionnant utilisateur Paramètres icôneUser Settings Icon utilisateur Paramètres bloc-notes Paramètres ou en cliquant sur l’icône d’engrenage dans la boîte de conseil développée.

Paramètres du Notebook

Activez ou désactivez l’option activer Databricks Advisor pour activer ou désactiver les conseils.

Le lien Réinitialiser les avis masqués s’affiche si un ou plusieurs types de conseils sont actuellement masqués. Cliquez sur le lien pour rendre ce type de Conseil à nouveau visible.

Exécuter un bloc-notes à partir d’un autre bloc-notes

Vous pouvez exécuter un bloc-notes à partir d’un autre bloc-notes à l’aide de la %run <notebook> commande Magic. C’est à peu près équivalent à une :load commande dans une boucle Scala sur votre ordinateur local ou une import instruction dans Python. Toutes les variables définies dans <notebook> deviennent disponibles dans votre bloc-notes actuel.

%run doit se trouver dans une cellule %run, car il exécute l’intégralité du bloc-notes en ligne.

Notes

Vous ne pouvez pas utiliser pour exécuter un fichier Python et import les entités définies dans ce fichier dans un bloc-notes. Pour importer à partir d’un fichier Python, vous devez empaqueter le fichier dans une bibliothèque Python, créer une bibliothèque de Azure Databricks à partir de cette bibliothèque Python et installer la bibliothèque dans le cluster que vous utilisez pour exécuter votre bloc-notes.

Exemple

Supposons que vous disposez notebookA de et de notebookB . notebookA contient une cellule qui contient le code python suivant :

x = 5

Même si vous n’avez pas défini x dans notebookB , vous pouvez accéder x à dans notebookB après avoir exécuté %run notebookA .

%run /Users/path/to/notebookA

print(x) # => 5

Pour spécifier un chemin d’accès relatif, faites-le précéder de ./ ou ../ . Par exemple, si notebookA et notebookB sont dans le même répertoire, vous pouvez également les exécuter à partir d’un chemin d’accès relatif.

%run ./notebookA

print(x) # => 5
%run ../someDirectory/notebookA # up a directory and into another

print(x) # => 5

Pour obtenir des interactions plus complexes entre les blocs-notes, consultez flux de travail de bloc-notes.

Gérer l’État et les résultats du bloc-notes

Une fois que vous avez attaché un bloc-notes à un cluster et exécuté une ou plusieurs cellules, votre bloc-notes a l’État et affiche les résultats. Cette section décrit comment gérer l’État et les résultats d’un bloc-notes.

Dans cette section :

Effacer l’État et les résultats des blocs-notes

Pour effacer l’État et les résultats du bloc-notes, cliquez sur Effacer dans la barre d’outils du bloc-notes, puis sélectionnez l’action :

Effacer l’État et les résultats

Télécharger les résultats

Par défaut, le téléchargement des résultats est activé. Pour activer/désactiver ce paramètre, consultez gérer la possibilité de télécharger des résultats à partir de blocs-notes. Si le téléchargement des résultats est désactivé, le bouton Télécharger le résultat n’est pas visible.

Télécharger un résultat de cellule

Vous pouvez télécharger un résultat de cellule qui contient une sortie tabulaire sur votre ordinateur local. Cliquez sur le bouton Télécharger le résultat en bas d’une cellule.

Télécharger les résultats des cellules

Un fichier CSV nommé export.csv est téléchargé dans votre répertoire de téléchargement par défaut.

Télécharger les résultats complets

Par défaut Azure Databricks retourne 1000 lignes d’un tableau. Lorsqu’il y a plus de 1000 lignes, une option semble réexécuter la requête et afficher jusqu’à 10 000 lignes.

Option de réexécution

Quand une requête retourne plus de 1000 lignes, une flèche vers le bas est ajoutée au bouton de résultat du Téléchargement . Pour télécharger tous les résultats d’une requête :

  1. Cliquez sur la flèche vers le bas en regard de Télécharger le résultat , puis sélectionnez Télécharger les résultats complets.

    Télécharger les résultats complets

  2. Sélectionnez ré-exécuter et télécharger.

    Ré-exécuter et télécharger les résultats

    Une fois que vous avez téléchargé les résultats complets, un fichier CSV nommé export.csv est téléchargé sur votre ordinateur local et le /databricks-results dossier contient un dossier généré contenant les résultats de la requête.

    Résultats téléchargés

Masquer et afficher le contenu de la cellule

Le contenu de la cellule est constitué d’un code de cellule et du résultat de l’exécution de la cellule. Vous pouvez masquer et afficher le code de cellule et le résultat à l’aide des actions de cellule de menu actions de cellule en haut à droite de la cellule.

Pour masquer le code de cellule :

  • Cliquez sur le signe insertion et sélectionnez masquer le code

Pour masquer et afficher le résultat de la cellule, effectuez l’une des opérations suivantes :

  • Cliquez sur le signe insertion vers le dessous et sélectionnez masquer le résultat
  • Sélectionner la réduction des cellules
  • Tapez ESC MAJ + o

Pour afficher le code ou les résultats de la cellule masquée, cliquez sur le lien Afficher les liens :

Afficher le code masqué et les résultats

Voir aussi en-têtes réductibles.

Isolation des Notebooks

L’isolation du Notebook fait référence à la visibilité des variables et des classes entre les blocs-notes. Azure Databricks prend en charge deux types d’isolation :

  • Isolation des variables et des classes
  • Isolation de la session Spark

Notes

Étant donné que tous les blocs-notes attachés au même cluster s’exécutent sur les mêmes machines virtuelles de cluster, même si l’isolation de session Spark est activée, l’isolation des utilisateurs n’est pas garantie au sein d’un cluster.

Isolation des variables et des classes

Les variables et les classes ne sont disponibles que dans le bloc-notes actuel. Par exemple, deux blocs-notes attachés au même cluster peuvent définir des variables et des classes portant le même nom, mais ces objets sont distincts.

Pour définir une classe qui est visible pour tous les blocs-notes attachés au même cluster, définissez la classe dans une cellule de package. Vous pouvez ensuite accéder à la classe en utilisant son nom complet, ce qui revient à accéder à une classe dans une bibliothèque Scala ou Java attachée.

Isolation de la session Spark

Chaque bloc-notes attaché à un cluster exécutant Apache Spark 2.0.0 et versions ultérieures possède une variable prédéfinie appelée qui représente un SparkSession . SparkSession est le point d’entrée pour l’utilisation des API Spark et la définition des configurations d’exécution.

L’isolation de la session Spark est activée par défaut. Vous pouvez également utiliser des affichages temporaires globaux pour partager des affichages temporaires entre les blocs-notes. Consultez Create View ou Create View. Pour désactiver l’isolation de session Spark, définissez spark.databricks.session.share sur true dans la spark.databricks.session.share.

Important

spark.databricks.session.shareLa valeur true interrompt le monitoring utilisé par les flux de travail en continu et les cellules du bloc-notes. Plus précisément :

  • Les graphiques des cellules de streaming ne sont pas affichés.
  • Les travaux ne sont pas bloqués tant qu’un flux est en cours d’exécution (ils se terminent simplement « correctement », arrêtant le flux).
  • les Flux dans les travaux ne sont pas surveillés pour l’arrêt. Au lieu de cela, vous devez appeler manuellement awaitTermination() .
  • L’appel de la fonction d’affichage sur la diffusion en continu trames ne fonctionne pas.

Les cellules qui déclenchent des commandes dans d’autres langues (c’est-à-dire, des cellules utilisant %scala , %python , %r et %sql ) et des cellules qui incluent d’autres blocs-notes (c’est-à-dire des cellules utilisant %run ) font partie du bloc-notes actuel. Par conséquent, ces cellules se trouvent dans la même session que les autres cellules du bloc-notes. En revanche, un flux de travail de bloc-notes exécute un bloc-notes avec un isolé , ce qui signifie que les affichages temporaires définis dans ce bloc-notes ne sont pas visibles dans les autres blocs-notes.

Gestion de versions

Azure Databricks dispose d’un contrôle de version de base pour les blocs-notes. Vous pouvez effectuer les actions suivantes sur les révisions : ajouter des commentaires, restaurer et supprimer des révisions et effacer l’historique des révisions.

Pour accéder aux révisions du bloc-notes, cliquez sur historique des révisions en haut à droite de la barre d’outils du bloc-notes.

Historique des révisions

Dans cette section :

Ajouter un commentaire

Pour ajouter un commentaire à la révision la plus récente :

  1. Cliquez sur la révision.

  2. Cliquez sur le lien Enregistrer maintenant .

    Enregistrer le commentaire

  3. Dans la boîte de dialogue Enregistrer la révision du bloc-notes, entrez un commentaire.

  4. Cliquez sur Enregistrer. La révision du bloc-notes est enregistrée avec le commentaire entré.

Restaurer une révision

Pour restaurer une révision :

  1. Cliquez sur la révision.

  2. Cliquez sur restaurer cette révision.

    Restaurer la révision

  3. Cliquez sur Confirmer. La révision sélectionnée devient la dernière révision du bloc-notes.

Supprimer une révision

Pour supprimer l’entrée de révision d’un bloc-notes :

  1. Cliquez sur la révision.

  2. Cliquez sur l’icône de la corbeille.

    Supprimer la révision

  3. Cliquez sur Oui, effacer. La révision sélectionnée est supprimée de l’historique de révision du bloc-notes.

Effacer un historique de révision

Pour effacer l’historique des révisions d’un bloc-notes :

  1. Sélectionnez fichier effacer l’historique des révisions.

  2. Cliquez sur Oui, effacer. L’historique de révision du Notebook est effacé.

    Avertissement

    Une fois désactivée, l’historique de révision n’est pas récupérable.

Contrôle de version git

Notes

Pour synchroniser votre travail dans Azure Databricks avec un dépôt Git distant, Databricks recommande l’utilisation de Dépôts pour l’intégration Git.

Azure Databricks s’intègre également aux outils de contrôle de version basés sur git :