Verwenden von Notebooks

Ein Notebook ist eine Sammlung von ausführbaren Zellen (Befehlen). Wenn Sie ein Notebook verwenden, entwickeln Sie in erster Linie Zellen und führen diese aus.

Alle Notebookaufgaben werden von Benutzeroberflächenaktionen unterstützt, aber Sie können auch viele Aufgaben mithilfe von Tastenkombinationen ausführen. Schalten Sie die Verknüpfungsanzeige um, indem Sie auf das Symbol Tastatur klicken.

Entwickeln von Notebooks

In diesem Abschnitt wird beschrieben, wie Sie Notebookzellen entwickeln und durch ein Notebook navigieren.

In diesem Abschnitt

Informationen zu Notebooks

Ein Notebook verfügt über eine Symbolleiste, mit der Sie das Notebook verwalten und Aktionen innerhalb des Notebooks ausführen können:

Notebook-Symbolleiste

und mindestens eine Zelle (oder Befehle), die Sie ausführen können:

Notebookzellen

Ganz rechts neben einer Zelle enthält die Zellenaktion Zelle aktionendrei Menüs: Ausführen,Dashboardund Bearbeiten:

AusführungssymbolDashboardBearbeiten

und zwei Aktionen: Symbol und ausblenden.

Hinzufügen einer Zelle

Um eine Zelle hinzuzufügen, bewegen Sie den Mauszeiger über eine Zelle oben oder unten, klicken Sie auf das Symbol Zelle hinzufügen, oder greifen Sie ganz rechts auf das Notebookzellenmenü zu, klicken Sie auf Caretzeichen nach unten,und wählen Sie Zelle oberhalb hinzufügen oder Zelle unterhalb hinzufügenaus.

Löschen einer Zelle

Wechseln Sie ganz rechts zum Menü Zellenaktionen Zellenaktionen, und klicken Sie auf Symbol löschen (Löschen).

Wenn Sie eine Zelle löschen, wird standardmäßig ein Bestätigungsdialogfeld zum Löschen angezeigt. Um zukünftige Bestätigungsdialogfelder zu deaktivieren, aktivieren Sie das Kontrollkästchen Dies nicht mehr anzeigen, und klicken Sie auf Bestätigen. Sie können die Einstellung für das Bestätigungsdialogfeld auch mit der Option Befehlslöschung aktivieren unter Benutzer Einstellungen Symbol Benutzer Einstellungen Notebook EinstellungenUser Settings Icon umschalten.

Um gelöschte Zellen wiederherzustellen, wählen Sie entweder Edit Undo Delete Cells (Zellen löschen rückgängig machen) aus, oder verwenden Sie die Tastenkombination ( Z ).

Ausschneiden einer Zelle

Wechseln Sie ganz rechts zum Menü Zellenaktionen Zellenaktionen, klicken Sie auf Caretstrich nach unten,und wählen Sie Zelle ausschneidenaus.

Sie können auch die Tastenkombination ( X ) verwenden.

Wählen Sie zum Wiederherstellen gelöschter Zellen entweder Edit Undo Cut Cells (Zellen bearbeiten und ausschneiden) aus, oder verwenden Sie die Tastenkombination ( Z ).

Auswählen mehrerer Zellen oder aller Zellen

Sie können angrenzende Notebookzellen auswählen, indem Sie für die vorherige bzw. die nächste Zelle umschalten bzw. nach unten wechseln. Mehrfach ausgewählte Zellen können kopiert, ausgeschnitten, gelöscht und eingefügt werden.

Um alle Zellen auszuwählen, wählen Sie Bearbeiten Alle Zellen auswählen aus, oder verwenden Sie die Befehlsmodusverknüpfung Cmd+A.

Standardsprache

Die Standardsprache des Notebooks wird durch eine Schaltfläche neben dem Notebooknamen angezeigt. Im folgenden Notebook ist die Standardsprache SQL.

Notebook-Standardsprache

So ändern Sie die Standardsprache:

  1. Klicken Sie auf die Sprachschaltfläche. Das Dialogfeld Standardsprache ändern wird angezeigt.

    Ändern der Standardsprache

  2. Wählen Sie die neue Sprache in der Dropdown-Dropdowndatei Standardsprache aus.

  3. Klicken Sie auf Ändern.

  4. Um sicherzustellen, dass vorhandene Befehle weiterhin funktionieren, wird Befehlen der vorherigen Standardsprache automatisch ein Magic-Sprachbefehl vorangestellt.

Kombinieren von Sprachen

Standardmäßig verwenden Zellen die Standardsprache des Notebooks. Sie können die Standardsprache in einer Zelle überschreiben, indem Sie auf die Sprachschaltfläche klicken und in der Dropdown-Datei eine Sprache auswählen.

Dropdown für die Zellensprache

Alternativ können Sie den Befehl language magic %<language> am Anfang einer Zelle verwenden. Folgende Magic-Befehle werden unterstützt: %python%r , , und %scala%sql .

Hinweis

Wenn Sie einen Magic-Sprachbefehl aufrufen, wird der Befehl im Ausführungskontext für das Notebook an die REPL gesendet. Variablen, die in einer Sprache (und somit in der REPL für diese Sprache) definiert sind, sind in der REPL einer anderen Sprache nicht verfügbar. REPLs können den Zustand nur über externe Ressourcen wie Dateien in DBFS oder Objekte im Objektspeicher freigeben.

Notebooks unterstützen auch einige zusätzliche Magic-Befehle:

  • %sh: Ermöglicht das Ausführen von Shellcode in Ihrem Notebook. Fügen Sie die -Option hinzu, um einen Fehler in der Zelle zu erreichen, wenn der Shellbefehl den Exitstatus ungleich 0 (null) auf -e hat. Dieser Befehl wird nur auf dem Apache Spark Treiber und nicht auf den Workern ausgeführt. Um einen Shellbefehl auf allen Knoten auszuführen, verwenden Sie ein Init-Skript.
  • %fs: Ermöglicht die Verwendung von dbutils Dateisystembefehlen. Um beispielsweise den dbutils.fs.ls Befehl zum Auflisten von Dateien auszuführen, können Sie %fs ls stattdessen angeben. Weitere Informationen finden Sie unter Verwenden von %fs magic-Befehlen.
  • %md: Ermöglicht das Einbeziehen verschiedener Arten von Dokumentation, einschließlich Text, Bilder und mathematische Formeln und Gleichungen. Siehe nächster Abschnitt.

Einschließen der Dokumentation

Um Dokumentation in ein Notebook einzubinden, können Sie eine Markdownzelle erstellen, indem Sie entweder markdown über die Sprachschaltfläche der Zelle auswählen oder den Magic-Befehl verwenden. Der Inhalt der Zelle wird in HTML gerendert. Dieser Codeausschnitt enthält beispielsweise Markup für eine Überschrift der Ebene 1:

%md # Hello This is a Title

Es wird als HTML-Titel gerendert:

Notebook-HTML-Titel

Reduzierbare Überschriften

Zellen, die nach Zellen mit Markdownüberschriften angezeigt werden, können in die Überschriftenzelle reduziert werden. Die folgende Abbildung zeigt eine Überschrift der Ebene 1 mit dem Namen Überschrift 1, in der die folgenden beiden Zellen reduziert sind.

Reduzierte Zellen

Um Überschriften zu erweitern und zu reduzieren, klicken Sie auf + und - .

Weitere Informationen finden Sie unter Ausblenden und Anzeigen von Zelleninhalten.

Um Zellen nach Zellen mit Markdownüberschriften im gesamten Notebook zu erweitern oder zu reduzieren, wählen Sie im Menü Ansicht die Option Alle Überschriften explandieren oder Alle Überschriften reduzieren aus.

Alle im Ansichtsmenü erweitern/reduzieren

Sie können mithilfe relativer Pfade eine Verknüpfung mit anderen Notebooks oder Ordnern in Markdownzellen erstellen. Geben Sie das href Attribut eines Ankertags als relativen Pfad an, beginnend mit einem $ , und folgen Sie dann dem gleichen Muster wie in Unix-Dateisystemen:

%md
<a href="$./myNotebook">Link to notebook in same folder as current notebook</a>
<a href="$../myFolder">Link to folder in parent folder of current notebook</a>
<a href="$./myFolder2/myNotebook2">Link to nested notebook</a>

Anzeigen von Bildern

Verwenden Sie die folgende Syntax, um bilder anzuzeigen, die im FileStoregespeichert sind:

%md
![test](files/image.png)

Angenommen, Sie verfügen über die Imagedatei des Databricks-Logos in FileStore:

dbfs ls dbfs:/FileStore/
databricks-logo-mobile.png

Wenn Sie den folgenden Code in eine Markdownzelle eingeben:

Bild in Markdownzelle

Das Bild wird in der Zelle gerendert:

Gerenderte Abbildung

Anzeigen mathematischer Gleichungen

Notebooks unterstützen KaTeX zum Anzeigen mathematischer Formeln und Gleichungen. Beispiel:

%md
\\(c = \\pm\\sqrt{a^2 + b^2} \\)

\\(A{_i}{_j}=B{_i}{_j}\\)

$$c = \\pm\\sqrt{a^2 + b^2}$$

\\[A{_i}{_j}=B{_i}{_j}\\]

rendert als:

Gerenderte Gleichung 1

und

%md
\\( f(\beta)= -Y_t^T X_t \beta + \sum log( 1+{e}^{X_t\bullet\beta}) + \frac{1}{2}\delta^t S_t^{-1}\delta\\)

where \\(\delta=(\beta - \mu_{t-1})\\)

rendert als:

Gerenderte Gleichung 2

HTML-Code einfügen

Sie können HTML in ein Notebook einfügen, indem Sie die Funktion displayHTML verwenden. Ein Beispiel dafür finden Sie unter HTML, D3 und SVG in Notebooks.

Hinweis

Der displayHTML iframe wird von der Domäne databricksusercontent.com bereitgestellt, und die iframe-Sandbox enthält das allow-same-origin -Attribut. Auf databricksusercontent.com muss über Ihren Browser zugegriffen werden können. Wenn sie zurzeit in Ihrem Unternehmensnetzwerk blockiert ist, muss sie von der IT zur Positivliste hinzugefügt werden.

Befehlskommentare

Sie können Diskussionen mit Projektmitarbeitern mithilfe von Befehlskommentaren führen.

Klicken Sie zum Umschalten der Randleiste Kommentare oben rechts in einem Notebook auf die Schaltfläche Kommentare.

Notebookkommentare umschalten

So fügen Sie einem Befehl einen Kommentar hinzu:

  1. Markieren Sie den Befehlstext, und klicken Sie auf die Kommentarblase:

    Kommentare öffnen

  2. Fügen Sie Ihren Kommentar hinzu, und klicken Sie auf Kommentar.

    Kommentar hinzufügen

Klicken Sie zum Bearbeiten, Löschen oder Antworten auf einen Kommentar auf den Kommentar, und wählen Sie eine Aktion aus.

Kommentar bearbeiten

Ändern der Zellenanzeige

Es gibt drei Anzeigeoptionen für Notebooks:

  • Standardansicht: Ergebnisse werden unmittelbar nach Codezellen angezeigt.
  • Nur Ergebnisse: Es werden nur Ergebnisse angezeigt.
  • Nebeneinander: Code- und Ergebniszellen werden nebeneinander angezeigt, und die Ergebnisse werden auf der rechten Seite angezeigt.

Wechseln Sie zum Menü Ansicht Menü anzeigen, um Ihre Anzeigeoption auszuwählen.

Side-by-Side-Ansicht

Anzeigen von Zeilen- und Befehlsnummern

Wechseln Sie zum Anzeigen von Zeilennummern oder Befehlsnummern zum Menü Ansicht Menü anzeigen, und wählen Sie Zeilennummern anzeigen oder Befehlsnummern anzeigen aus. Sobald sie angezeigt werden, können Sie sie erneut im selben Menü ausblenden. Sie können Zeilennummern auch mit der Tastenkombination Control+L aktivieren.

Anzeigen von Zeilen- oder Befehlsnummern über das Ansichtsmenü

Im Notebook aktivierte Zeilen- und Befehlsnummern

Wenn Sie Zeilen- oder Befehlsnummern aktivieren, speichert Databricks Ihre Einstellung und zeigt sie in allen anderen Notebooks für diesen Browser an.

Befehlsnummern oberhalb von Zellen sind mit diesem bestimmten Befehl zu verknüpfen. Wenn Sie auf die Befehlsnummer für eine Zelle klicken, wird Ihre URL aktualisiert, damit sie mit diesem Befehl verankert wird. Wenn Sie einen Link zu einem bestimmten Befehl in Ihrem Notebook erstellen möchten, klicken Sie mit der rechten Maustaste auf die Befehlsnummer, und wählen Sie Linkadresse kopieren aus.

Suchen und Ersetzen von Text

Um Text in einem Notebook zu suchen und zu ersetzen, wählen Sie Suchen bearbeiten und ersetzen aus. Die aktuelle Übereinstimmung ist orange hervorgehoben, und alle anderen Übereinstimmungen sind gelb hervorgehoben.

Übereinstimmenden Text

Klicken Sie auf Ersetzen, um die aktuelle Übereinstimmung zu ersetzen. Klicken Sie auf Alle ersetzen, um alle Übereinstimmungen im Notebook zu ersetzen.

Um zwischen Übereinstimmungen zu wechseln, klicken Sie auf die Schaltflächen Prevund Next. Sie können auch UMSCHALT+EINGABE DRÜCKEN und eingeben, um zu den vorherigen bzw. nächsten Übereinstimmungen zu wechseln.

Um das Tool zum Suchen und Ersetzen zu schließen, klicken Sie auf Das Symbol löschen, oder drücken Sie esc.

AutoVervollständigen

Sie können Azure Databricks AutoVervollständigen verwenden, um Codesegmente automatisch zu vervollständigen, während Sie sie eingeben. Azure Databricks unterstützt zwei Typen von AutoVervollständigen: lokal und Server.

Lokale AutoVervollständigen schließt Wörter ab, die im Notebook definiert sind. Die automatische Serververvollständigung greifen auf den Cluster für definierte Typen, Klassen und Objekte sowie auf SQL und Tabellennamen zu. Um die automatische Vervollständigung des Servers zu aktivieren, fügen Sie Ihr Notebook an einen Cluster an, und führen Sie alle Zellen aus, die vervollständigbare Objekte definieren.

Wichtig

Die automatische Serververvollständigung in R-Notebooks wird während der Befehlsausführung blockiert.

Drücken Sie zum Auslösen der automatischen Vervollständigung die TAB-TASTE, nachdem Sie ein vervollständigbares Objekt eingeben haben. Nachdem Sie z. B. die Zellen definiert und ausgeführt haben, die die Definitionen von und enthalten, können die Methoden von abgeschlossen werden, und eine Liste gültiger Vervollständigungen wird angezeigt, wenn Sie MyClassinstance die instanceMyClass

Auslösen der automatischen Vervollständigung

Die Vervollständigung von SQL und Tabellennamen werden auf die gleiche Weise verwendet.

Typerledigung – – SQL Vervollständigung

In Databricks Runtime 7.4 und höher können Sie Python-Dokumentationshinweise anzeigen, indem Sie UMSCHALT+TAB drücken, nachdem Sie ein fähiges Python-Objekt eingeben. Die Docstrings enthalten die gleichen Informationen wie die help() -Funktion für ein -Objekt.

Python-Dokumentation

Format SQL

Azure Databricks bietet Tools, mit denen Sie code SQL in Notebookzellen schnell und einfach formatieren können. Diese Tools reduzieren den Aufwand, ihren Code formatiert zu halten, und helfen, die gleichen Codierungsstandards in Ihren Notebooks durchzusetzen.

Sie können das Formatierungsformat auf folgende Weise auslösen:

  • Einzelne Zellen

    • Tastenkombination: Drücken Sie CMD+UMSCHALT+F.

    • Befehlskontextmenü: Wählen Sie formatieren SQL befehlskontext-Dropdownmenü einer SQL aus. Dieses Element ist nur in notebook SQL zellen und solchen mit einer %sql%sql

      Formatieren SQL aus dem Befehlskontext

  • Mehrere Zellen

    Wählen Sie mehrere SQL Zellen und dann Format bearbeiten SQL Zellen aus. Wenn Sie Zellen mit mehr als einer Sprache auswählen, werden nur SQL Zellen formatiert. Dies schließt diejenigen ein, die %sql verwenden.

    Formatierungsoptionen SQL Menü

Dies ist die erste Zelle im vorherigen Beispiel nach der Formatierung:

Nach dem Formatieren SQL

Inhaltsverzeichnis anzeigen

Um ein automatisch generiertes Inhaltsverzeichnis anzuzeigen, klicken Sie auf den Pfeil oben links im Notebook (zwischen der Randleiste und der obersten Zelle). Das Inhaltsverzeichnis wird aus den markdown-Überschriften generiert, die im Notebook verwendet werden.

Öffnen des ToC

Klicken Sie auf den nach links zeigenden Pfeil, um das Inhaltsverzeichnis zu schließen.

Schließen des ToC

Anzeigen von Notebooks im dunklen Modus

Sie können Notebooks im dunklen Modus anzeigen. Um den dunklen Modus zu aktivieren oder zu deaktivieren, wählen Sie Notebookdesign anzeigen und dann Helles Design oder Dunkles Design aus.

Notebook im hellen oder dunklen Modus

Ausführen von Notebooks

In diesem Abschnitt wird beschrieben, wie Sie eine oder mehrere Notebookzellen ausführen.

In diesem Abschnitt

Anforderungen

Das Notebook muss an einen Cluster angefügt werden. Wenn der Cluster nicht ausgeführt wird, wird der Cluster gestartet, wenn Sie eine oder mehrere Zellen ausführen.

Ausführen einer Zelle

Klicken Sie im Menü Zellenaktionen ganz rechts auf Ausführungssymbol, und wählen Sie Zelle ausführenaus, oder drücken Sie UMSCHALT+EINGABETASTE.

Wichtig

Die maximale Größe für eine Notebookzelle( Inhalt und Ausgabe) beträgt 16 MB.

Versuchen Sie beispielsweise, diesen Python-Codeausschnitt auszuführen, der auf die vordefinierte sparksparkverweist.

spark

Führen Sie dann echten Code aus:

1+1 # => 2

Hinweis

Notebooks verfügen über eine Reihe von Standardeinstellungen:

  • Wenn Sie eine Zelle ausführen, wird das Notebook automatisch ohne Aufforderung an einen ausgeführten Cluster angefügt.
  • Wenn Sie UMSCHALT+EINGABE DRÜCKEN,scrollt das Notebook automatisch zur nächsten Zelle, wenn die Zelle nicht sichtbar ist.

Um diese Einstellungen zu ändern, wählen Sie User Einstellungen Icon User Einstellungen NotebookUser Settings Icon Einstellungen aus, und konfigurieren Sie die entsprechenden Kontrollkästchen.

Alle oben oder unten aufgeführten Ausführungen

Um alle Zellen vor oder nach einer Zelle auszuführen, wechseln Sie ganz rechts zum Menü Zellenaktionen Zellenaktionen, klicken Sie auf Menü ausführen, und wählen Sie Alle oben ausführen oder Alle ausführen unter aus.

Alle unten ausführen enthält die Zelle, in der Sie sich befinden. Run All Above does not.

Ausführen aller Zellen

Um alle Zellen in einem Notebook auszuführen, wählen Sie auf der Notebook-Symbolleiste Alle ausführen aus.

Wichtig

Führen Sie keine Alle ausführen aus, wenn sich die Schritte zum Einbinden und Aufheben der Bereitstellung im selben Notebook befinden. Dies kann zu einer Racebedingung führen und möglicherweise die Bereitstellungspunkte beschädigen.

Anzeigen mehrerer Ausgaben pro Zelle

Python-Notebooks und %python -Zellen in Nicht-Python-Notebooks unterstützen mehrere Ausgaben pro Zelle.

Mehrere Ausgaben in einer Zelle

Dieses Feature erfordert Databricks Runtime 7.1 oder höher und kann in Databricks Runtime 7.1 – Databricks Runtime 7.3 durch Festlegen von aktiviert spark.databricks.workspace.multipleResults.enabled true werden. Sie ist standardmäßig in Databricks Runtime 7.4 und höher aktiviert.

Python- und Scala-Fehlerhervorhebung

Python- und Scala-Notebooks unterstützen die Fehlerhervorhebung. Das heißt, die Codezeile, die den Fehler auslöst, wird in der Zelle hervorgehoben. Wenn es sich bei der Fehlerausgabe um einen Stacktrace handelt, wird außerdem die Zelle, in der der Fehler ausgelöst wird, in stacktrace als Link zur Zelle angezeigt. Sie können auf diesen Link klicken, um zum fehlerhaften Code zu springen.

Python-Fehlerhervorhebung

Scala-Fehlerhervorhebung

Benachrichtigungen

Benachrichtigungen warnen Sie bei bestimmten Ereignissen, z. B. bei welchem Befehl derzeit während der Ausführung aller Zellen ausgeführt wird und welche Befehle sich im Fehlerzustand befinden. Wenn in Ihrem Notebook mehrere Fehlerbenachrichtigungen angezeigt werden, verfügt die erste über einen Link, über den Sie alle Benachrichtigungen löschen können.

Notebookbenachrichtigungen

Notebookbenachrichtigungen sind standardmäßig aktiviert. Sie können sie unter User Einstellungen Icon User Einstellungen NotebookUser Settings Icon Einstellungendeaktivieren.

Databricks Advisor

Databricks Advisor analysiert Befehle automatisch bei jeder Ausführung und zeigt entsprechende Ratschläge in den Notebooks an. Die Hinweise enthalten Informationen, die Ihnen helfen können, die Leistung von Workloads zu verbessern, Kosten zu senken und häufige Fehler zu vermeiden.

Anzeigen von Ratschlägen

Ein blaues Feld mit einem Glühbirnensymbol signalisiert, dass Ratschläge für einen Befehl verfügbar sind. Im Feld wird die Anzahl unterschiedlicher Hinweise angezeigt.

Databricks-Ratschläge

Klicken Sie auf die Glühbirne, um das Feld zu erweitern und die Hinweise anzuzeigen. Ein oder mehrere Hinweise werden sichtbar.

Anzeigen von Ratschlägen

Klicken Sie auf den Link Weitere Informationen, um die Dokumentation mit weiteren Informationen zu den Ratschlägen anzuzeigen.

Klicken Sie auf den Link Don't show me this again (Diese Seite nicht mehr anzeigen), um den Hinweis auszublenden. Die Ratschläge dieses Typs werden nicht mehr angezeigt. Diese Aktion kann in Notebook Einstellungen umgekehrtwerden.

Klicken Sie erneut auf die Glühbirne, um das Hinweisfeld zu reduzieren.

Einstellungen für Ratschläge

Greifen Sie auf die Seite Notebook Einstellungen zu, indem Sie Benutzer Einstellungen Symbol Benutzer Einstellungen NotebookUser Settings Icon Einstellungen auswählen oder indem Sie im erweiterten Hinweisfeld auf das Zahnradsymbol klicken.

Notebook-Einstellungen

Schalten Sie die Option Databricks Advisor aktivieren um, um Ratschläge zu aktivieren oder zu deaktivieren.

Der Link Ausgeblendete Ratschläge zurücksetzen wird angezeigt, wenn ein oder mehrere Arten von Ratschlägen derzeit ausgeblendet sind. Klicken Sie auf den Link, um diesen Empfehlungstyp wieder sichtbar zu machen.

Ausführen eines Notebooks über ein anderes Notebook

Sie können ein Notebook über ein anderes Notebook ausführen, indem Sie den %run <notebook> Magic-Befehl verwenden. Dies entspricht in etwa einem :load Befehl in einer Scala REPL auf Ihrem lokalen Computer oder einer import -Anweisung in Python. Alle in definierten Variablen <notebook> werden in Ihrem aktuellen Notebook verfügbar.

%run muss %runeiner Zelle selbst befinden, da das gesamte Notebook inline ausgeführt wird.

Hinweis

Sie können nicht verwenden, um eine Python-Datei und import die in dieser Datei definierten Entitäten in einem Notebook auszuführen. Zum Importieren aus einer Python-Datei müssen Sie die Datei in eine Python-Bibliothek packen, eine Azure Databricks Bibliothek aus dieser Python-Bibliothek erstellen und die Bibliothek in dem Cluster installieren, den Sie zum Ausführen Ihres Notebooks verwenden.

Beispiel

Angenommen, Sie verfügen über notebookA und notebookB . notebookA enthält eine Zelle mit dem folgenden Python-Code:

x = 5

Obwohl Sie nicht in definiert haben, können Sie nach dem Ausführen von xnotebookB auf xnotebookB%run notebookA zugreifen.

%run /Users/path/to/notebookA

print(x) # => 5

Um einen relativen Pfad anzugeben, legen Sie ihm ./ oder ../ voran. Wenn sich und beispielsweise notebookAnotebookB im selben Verzeichnis befinden, können Sie sie alternativ über einen relativen Pfad ausführen.

%run ./notebookA

print(x) # => 5
%run ../someDirectory/notebookA # up a directory and into another

print(x) # => 5

Komplexere Interaktionen zwischen Notebooks finden Sie unter Notebookworkflows.

Verwalten des Notebookzustands und der Ergebnisse

Nachdem Sie ein Notebook an einen Cluster angefügt und mindestens eine Zelle ausgeführthaben, weist Ihr Notebook den Zustand auf und zeigt Ergebnisse an. In diesem Abschnitt wird beschrieben, wie Sie den Notebookzustand und die Ergebnisse verwalten.

In diesem Abschnitt

Löschen des Zustands und der Ergebnisse von Notebooks

Um den Notebookzustand und die Ergebnisse zu löschen, klicken Sie auf der Notebook-Symbolleiste auf Löschen, und wählen Sie die Aktion aus:

Löschen des Zustands und der Ergebnisse

Herunterladen von Ergebnissen

Das Herunterladen von Ergebnissen ist standardmäßig aktiviert. Informationen zum Umschalten dieser Einstellung finden Sie unter Verwalten der Möglichkeit zum Herunterladen von Ergebnissen aus Notebooks. Wenn das Herunterladen von Ergebnissen deaktiviert ist, ist die Schaltfläche Ergebnis herunterladen nicht sichtbar.

Herunterladen eines Zellenergebnisses

Sie können ein Zellenergebnis mit tabellarischer Ausgabe auf Ihren lokalen Computer herunterladen. Klicken Sie unten in einer Zelle auf die Schaltfläche Download Result (Ergebnis herunterladen).

Herunterladen von Zellenergebnissen

Eine CSV-Datei mit dem Namen export.csv wird in Ihr Standarddownloadverzeichnis heruntergeladen.

Vollständige Ergebnisse herunterladen

Standardmäßig gibt Azure Databricks 1.000 Zeilen eines DataFrames zurück. Wenn mehr als 1.000 Zeilen vorhanden sind, wird eine Option angezeigt, um die Abfrage erneut auszuführen und bis zu 10.000 Zeilen anzuzeigen.

Option zum erneuten Ausführen

Wenn eine Abfrage mehr als 1.000 Zeilen zurückgibt, wird der Schaltfläche Ergebnis herunterladen ein Pfeil nach unten hinzugefügt. So laden Sie alle Ergebnisse einer Abfrage herunter:

  1. Klicken Sie auf den Pfeil nach unten neben Download Result (Ergebnis herunterladen), und wählen Sie Download full results (Vollständige Ergebnisse herunterladen)aus.

    Vollständige Ergebnisse herunterladen

  2. Wählen Sie Erneut ausführen aus, und laden Sie herunter.

    Erneutes Ausführen und Herunterladen von Ergebnissen

    Nachdem Sie die vollständigen Ergebnisse heruntergeladen haben, wird eine CSV-Datei mit dem Namen export.csv auf Ihren lokalen Computer heruntergeladen, und der Ordner enthält einen /databricks-results generierten Ordner, der die Abfrageergebnisse enthält.

    Heruntergeladene Ergebnisse

Ausblenden und Anzeigen von Zelleninhalten

Der Zelleninhalt besteht aus Zellencode und dem Ergebnis der Ausführung der Zelle. Sie können den Zellencode und das Ergebnis mithilfe des Zellenaktionsmenüs Zellenaktionen oben rechts in der Zelle ausblenden und anzeigen.

So blenden Sie Zellencode aus:

  • Klicken Sie auf Nach unten, und wählen Sie Code ausblenden aus.

Um das Zellenergebnis auszublenden und anzuzeigen, führen Sie einen der folgenden Schritte aus:

  • Klicken Sie auf Nach unten, und wählen Sie Ergebnis ausblenden aus.
  • Auswählen von
  • Geben Sie ESC UMSCHALT +O ein.

Klicken Sie auf die Links Anzeigen, um ausgeblendeten Zellencode oder ausgeblendete Ergebnisse anzuzeigen:

Anzeigen von ausgeblendeten Code und Ergebnissen

Siehe auch Reduzierbare Überschriften.

Notebookisolation

Notebookisolation bezieht sich auf die Sichtbarkeit von Variablen und Klassen zwischen Notebooks. Azure Databricks unterstützt zwei Arten von Isolation:

  • Variablen- und Klassenisolation
  • Spark-Sitzungsisolation

Hinweis

Da alle an denselben Cluster angefügten Notebooks auf denselben Cluster-VMs ausgeführt werden, gibt es auch bei aktivierter Spark-Sitzungsisolation keine garantierte Benutzerisolation innerhalb eines Clusters.

Variablen- und Klassenisolation

Variablen und Klassen sind nur im aktuellen Notebook verfügbar. Beispielsweise können zwei Notebooks, die an denselben Cluster angefügt sind, Variablen und Klassen mit dem gleichen Namen definieren, aber diese Objekte sind unterschiedlich.

Um eine Klasse zu definieren, die für alle Notebooks sichtbar ist, die an denselben Cluster angefügt sind,definieren Sie die -Klasse in einer Paketzelle. Anschließend können Sie mit ihrem vollqualifizierten Namen auf die Klasse zugreifen. Dies entspricht dem Zugriff auf eine Klasse in einer angefügten Scala- oder Java-Bibliothek.

Spark-Sitzungsisolation

Jedes Notebook, das an einen Cluster mit Apache Spark 2.0.0 und höher angefügt ist, verfügt über eine vordefinierte Variable namens , die eine SparkSession darstellt. SparkSession ist der Einstiegspunkt für die Verwendung von Spark-APIs und das Festlegen von Laufzeitkonfigurationen.

Die Spark-Sitzungsisolation ist standardmäßig aktiviert. Sie können auch globale temporäre Ansichten verwenden, um temporäre Ansichten für Notebooks freizugeben. Weitere Informationen finden Sie unter Create View oder CREATE VIEW. Um die Spark-Sitzungsisolation zu deaktivieren, legen Sie spark.databricks.session.sharetrue in der spark.databricks.session.shareauf fest.

Wichtig

Das Festlegen spark.databricks.session.share von TRUE unterbricht die Überwachung, die sowohl von Streaming-Notebookzellen als auch von Streamingaufträgen verwendet wird. Dies gilt insbesondere in folgenden Fällen:

  • Die Diagramme in Streamingzellen werden nicht angezeigt.
  • Aufträge werden nicht blockiert, solange ein Stream ausgeführt wird (sie beenden einfach "erfolgreich" und beenden den Stream).
  • Streams in Aufträgen werden nicht auf Beendigung überwacht. Stattdessen müssen Sie manuell awaitTermination() aufrufen.
  • Das Aufrufen der Anzeigefunktion für Streamingdatenrahmen funktioniert nicht.

Zellen, die Befehle in anderen Sprachen auslösen (d. h. Zellen mit %scala , , und ) und %python%r%sql Zellen, die andere Notebooks enthalten (d. h. Zellen mit %run ), sind Teil des aktuellen Notebooks. Daher befinden sich diese Zellen in derselben Sitzung wie andere Notebookzellen. Im Gegensatz dazu führt ein Notebook-Workflow ein Notebook mit einem isolierten aus, was bedeutet, dass temporäre Ansichten, die in einem solchen Notebook definiert sind, in anderen Notebooks nicht sichtbar sind.

Versionskontrolle

Azure Databricks verfügt über eine einfache Versionskontrolle für Notebooks. Sie können die folgenden Aktionen für Revisionen ausführen: Hinzufügen von Kommentaren, Wiederherstellen und Löschen von Revisionen und Löschen des Revisionsverlaufs.

Klicken Sie rechts oben auf der Notebook-Symbolleiste auf Revisionsverlauf, um auf Notebookrevisionen zuzugreifen.

Revisionsverlauf

In diesem Abschnitt

Hinzufügen eines Kommentars

So fügen Sie der letzten Revision einen Kommentar hinzu:

  1. Klicken Sie auf die Revision.

  2. Klicken Sie auf den Link Jetzt speichern.

    Kommentar speichern

  3. Geben Sie im Dialogfeld Notebookrevision speichern einen Kommentar ein.

  4. Klicken Sie auf Speichern. Die Notebookrevision wird mit dem eingegebenen Kommentar gespeichert.

Wiederherstellen einer Revision

So stellen Sie eine Revision wieder her:

  1. Klicken Sie auf die Revision.

  2. Klicken Sie auf Diese Revision wiederherstellen.

    Wiederherstellungsrevision

  3. Klicken Sie auf Confirm (Bestätigen). Die ausgewählte Revision wird zur letzten Revision des Notebooks.

Löschen einer Revision

So löschen Sie den Revisionseintrag eines Notebooks:

  1. Klicken Sie auf die Revision.

  2. Klicken Sie auf das Papierkorbsymbol Papierkorb.

    Löschen der Revision

  3. Klicken Sie auf Ja, löschenSie . Die ausgewählte Revision wird aus dem Revisionsverlauf des Notebooks gelöscht.

Löschen eines Revisionsverlaufs

So löschen Sie den Revisionsverlauf eines Notebooks:

  1. Wählen Sie Revisionsverlauf löschenaus.

  2. Klicken Sie auf Ja, deaktivieren Sie. Der Notebook-Revisionsverlauf wird wieder geöffnet.

    Warnung

    Nach dem Löschen kann der Revisionsverlauf nicht wiederhergestellt werden.

Git-Versionskontrolle

Hinweis

Databricks empfiehlt die Verwendung der Repositorys für die Git-Integration, um Ihre Arbeit in Azure Databricks mit einem Git-Remoterepository zu synchronisieren.

Azure Databricks kann auch in die folgenden Git-basierten Tools zur Versionskontrolle integriert werden: