Jupyter Notebooks in Azure Cosmos DB (Vorschau)

GILT FÜR: NoSQL MongoDB Cassandra Gremlin Tabelle

Warnung

Das Jupyter-Notebooks Feature von Azure Cosmos DB wird am 30. März 2024 eingestellt; Sie können keine integrierten Jupyter-Notebooks aus dem Azure Cosmos DB-Konto verwenden. Sie sollten Visual Studio Code-Unterstützung für Jupyter-Notebooks oder Ihren bevorzugten Notebook-Client verwenden.

Jupyter Notebooks ist eine interaktive Open-Source-Entwicklungsumgebung (IDE), mit der Sie Dokumente erstellen, ausführen und freigeben können, die Livecode, Gleichungen, visuelle Elemente und erzählenden Text enthalten.

In Azure Cosmos DB integrierte Jupyter Notebooks sind direkt in das Azure-Portal und in Ihre Azure Cosmos DB-Konten integriert, sodass sie bequem und einfach verwendet werden können. Entwickler, wissenschaftliche Fachkräfte für Daten, Techniker und Analysten können die vertraute Jupyter Notebooks-Umgebung verwenden, um allgemeine Aufgaben zu erledigen. Zu diesen allgemeinen Aufgaben gehören:

  • Datenuntersuchung
  • Datenbereinigung
  • Datentransformationen
  • Numerische Simulationen
  • Statistische Modellierung
  • Datenvisualisierung
  • Machine Learning

Screenshot of various Jupyter Notebooks visualizations in Azure Cosmos DB.

Azure Cosmos DB unterstützt sowohl C#- als auch Python-Notebooks für die APIs für NoSQL, Apache Cassandra, Apache Gremlin, Table und MongoDB. Innerhalb des Notebooks können Sie integrierte Befehle und Features nutzen, die das Erstellen von Azure Cosmos DB-Ressourcen erleichtern. Sie können auch die integrierten Befehle verwenden, um Ihre Daten in Azure Cosmos DB hochzuladen, abzufragen und zu visualisieren.

Screenshot of Jupyter Notebooks integrated developer environment (IDE) in Azure Cosmos DB.

Vorteile von Jupyter Notebooks

Jupyter Notebooks wurden ursprünglich für Data Science-Anwendungen entwickelt, die in Python und R geschrieben wurden. Sie können aber auf verschiedene Weise für andere Arten von Projekten verwendet werden, z. B.:

Datenvisualisierung

Mit Jupyter Notebooks können Sie Daten in Form eines freigegebenen Notebooks visualisieren, mit dem ein Dataset als Grafik gerendert wird. Sie können Visualisierungen erstellen, interaktive Änderungen am freigegebenen Code und Dataset vornehmen und die Ergebnisse freigeben.

Codefreigabe

Dienste wie GitHub bieten Möglichkeiten zum Freigeben von Code, sind aber größtenteils nicht interaktiv. Mit einem Jupyter Notebook können Sie Code anzeigen und ausführen und die Ergebnisse direkt im Azure-Portal darstellen.

Liveinteraktionen mit Code

Der Code in einem Jupyter Notebook ist dynamisch. Sie können ihn bearbeiten und die Aktualisierungen inkrementell in Echtzeit ausführen. Sie können auch Benutzersteuerelemente (z. B. Schieberegler oder Texteingabefelder) einbetten, die als Eingabequellen für Code, Demos oder Proof of Concepts (POCs) verwendet werden.

Dokumentation zu Codebeispielen und Ergebnisse von Datenuntersuchungen

Wenn Sie über einen Codeabschnitt verfügen und die Funktionsweise zeilenweise erläutern möchten, können Sie ihn in ein Jupyter-Notebook einbetten. Sie können mit der Interaktivität gleichzeitig die Dokumentation hinzufügen.

Integrierte Befehle für Azure Cosmos DB

Die integrierten Magic-Befehle von Azure Cosmos DB ermöglichen eine einfache Interaktion mit Ihrem Konto. Sie können Befehle wie „%%upload“ und „%%sql“ verwenden, um Daten in einen Container hochzuladen und mithilfe der SQL-API-Syntax abzufragen. Sie müssen keinen zusätzlichen benutzerdefinierten Code schreiben.

Umgebung vom Typ „Alles an einem Ort“

Jupyter Notebooks fasst mehrere Ressourcen in einem einzelnen Dokument zusammen, einschließlich:

  • code
  • Rich-Text
  • images
  • videos
  • aktualisieren
  • Mathematische Gleichungen
  • Plots
  • maps
  • Interaktive Zahlen
  • Widgets
  • Grafische Benutzeroberflächen

Komponenten eines Jupyter Notebooks

Jupyter Notebooks können mehrere Typen von Komponenten enthalten, die jeweils in diskreten Blöcken oder Zellen organisiert sind:

Text und HTML

Nur-Text oder in der Markdownsyntax kommentierter Text zum Generieren von HTML-Code kann jederzeit in das Dokument eingefügt werden. CSS-Stile können auch inline eingefügt oder der Vorlage hinzugefügt werden, die zum Generieren des Notebooks verwendet wird.

Code und Ausgabe

Jupyter Notebooks unterstützen Python- und C#-Code. Die Ergebnisse des ausgeführten Codes werden direkt nach den Codeblöcken angezeigt, und die Codeblöcke können mehrfach in beliebiger Reihenfolge ausgeführt werden.

Visualisierungen

Mit Modulen wie z. B. Matplotlib, Plotly und Bokeh können Sie Grafiken und Diagramme aus dem Code generieren. Ähnlich wie bei der Ausgabe werden diese Visualisierungen inline neben dem Code angezeigt, mit dem sie generiert werden. Ähnlich wie bei der Ausgabe werden diese Visualisierungen inline neben dem Code angezeigt, mit dem sie generiert werden.

Multimedia

Da Jupyter Notebooks auf Webtechnologien basieren, können alle Multimediatypen angezeigt werden, die von einer Webseite unterstützt werden. Sie können sie als HTML-Elemente in ein Notebook einbetten oder mit dem IPython.display-Modul programmgesteuert generieren.

Daten

Sie können die Daten aus Azure Cosmos-Containern oder die Ergebnisse von Abfragen programmgesteuert in ein Jupyter Notebook importieren. Verwenden Sie integrierte Magic-Befehle, um Daten in Azure Cosmos DB hochzuladen oder abzufragen.

Nächste Schritte

Informationen zu den ersten Schritten mit integrierten Jupyter Notebooks in Azure Cosmos DB finden Sie in den folgenden Artikeln: