Jupyter Notebooks dans Azure Cosmos DB (préversion)

S’APPLIQUE À : NoSQL MongoDB Cassandra Gremlin Table

Avertissement

La fonctionnalité Jupyter Notebooks d’Azure Cosmos DB sera mise hors service le 30 mars 2024. Vous ne pourrez pas utiliser des notebooks Jupyter intégrés à partir du compte Azure Cosmos DB. Nous vous recommandons d’utiliser la prise en charge de Visual Studio Code pour les notebooks Jupyter ou votre client de notebooks préféré.

Jupyter Notebooks est un environnement de développement interactif open source (IDE) conçu pour créer, exécuter et partager des documents qui contiennent du code en direct, des équations, des visualisations et du texte narratif.

Les Jupyter Notebooks intégrés à Azure Cosmos DB sont directement intégrés au portail Azure et vos comptes Azure Cosmos DB, ce qui les rend pratiques et faciles à utiliser. Les développeurs, les scientifiques des données, les ingénieurs et les analystes peuvent utiliser l’expérience Jupyter Notebooks familière pour effectuer des tâches courantes. Ces tâches courantes sont les suivantes :

  • exploration des données
  • nettoyage de données
  • transformations de données
  • simulations numériques
  • modélisation statistique
  • visualisation des données
  • apprentissage machine

Screenshot of various Jupyter Notebooks visualizations in Azure Cosmos DB.

Azure Cosmos DB prend en charge les notebooks C# et Python pour les API pour NoSQL, Apache Cassandra, Apache Gremlin, Table et MongoDB. À l’intérieur du notebook, vous pouvez tirer parti des commandes et fonctionnalités intégrées qui facilitent la création de ressources Azure Cosmos DB. Vous pouvez également utiliser les commandes intégrées pour charger, interroger et visualiser vos données dans Azure Cosmos DB.

Screenshot of Jupyter Notebooks integrated developer environment (IDE) in Azure Cosmos DB.

Avantages des Jupyter Notebooks

À l’origine, les Jupyter Notebooks ont été développés pour les applications de science des données écrites en Python et R. Toutefois, ils peuvent être utilisés de différentes façons pour différents types de projets, notamment :

Visualisation des données

Les Jupyter Notebooks vous permettent de visualiser des données sous la forme d’un notebook partagé qui restitue un jeu de données sous forme graphique. Vous pouvez créer des visualisations, apporter des modifications interactives au code partagé et au jeu de données, et partager les résultats.

Partage du code

Les services comme GitHub fournissent des méthodes pour partager du code, mais ils sont en grande partie non interactifs. Avec un Jupyter Notebook, vous pouvez voir le code, l’exécuter, puis afficher les résultats directement dans le portail Azure.

Interactions en direct avec le code

Le code d’un Jupyter Notebook est dynamique : vous pouvez le modifier et exécuter en temps réel des mises à jour de façon incrémentielle. Vous pouvez également incorporer des contrôles utilisateur (par exemple, des curseurs ou des champs d’entrée de texte) à utiliser comme sources d’entrée pour le code, comme démonstrations ou comme preuves de concepts (POC).

Documentation des exemples de code et des résultats de l’exploration des données

Si vous avez un extrait de code et souhaitez expliquer ligne par ligne son fonctionnement, vous pouvez l’incorporer dans un notebook Jupyter. Vous pouvez ajouter l’interactivité et la documentation en même temps.

Commandes intégrées pour Azure Cosmos DB

Les commandes magiques intégrées à Azure Cosmos DB facilitent l’interaction avec votre compte. Vous pouvez utiliser des commandes comme %%upload et %%sql pour charger des données dans un conteneur et les interroger à l’aide de la syntaxe d’API SQL. Vous n’avez pas besoin d’écrire du code personnalisé supplémentaire.

Environnement « tout dans un emplacement unique »

Jupyter Notebook combine plusieurs ressources dans un seul document, notamment :

  • code
  • texte enrichi
  • images
  • videos
  • fluides
  • équations mathématiques
  • tracés
  • maps
  • figures interactives
  • widgets
  • interfaces utilisateur graphiques

Composants d’un Jupyter Notebook

Les Jupyter Notebooks peuvent inclure plusieurs types de composants, chacun étant organisé en blocs discrets ou cellules :

Texte et code HTML

il est possible d’insérer à tout moment dans le document du texte brut ou du texte annoté dans la syntaxe Markdown afin de générer du code HTML. Le style CSS peut également être inclus inline ou ajouté au modèle utilisé pour générer le notebook.

code et sortie ;

Les Jupyter Notebooks prennent en charge le code Python et C#. Les résultats du code exécuté s’affichent immédiatement après les blocs de code. De plus, les blocs de code peuvent être exécutés plusieurs fois dans l’ordre de votre choix.

Visualisations

vous pouvez générer le graphisme et les graphiques à partir du code à l’aide de modules tels que Matplotlib, Plotly ou Bokeh, entre autres. Comme pour la sortie, ces visualisations s’affichent inline en regard du code qui les génère. Comme pour la sortie, ces visualisations s’affichent inline en regard du code qui les génère.

Multimédia

Étant donné que les Jupyter Notebooks sont basés sur la technologie web, ils peuvent afficher tous les types de contenu multimédia pris en charge par une page web. Vous pouvez les inclure dans un notebook en tant qu’éléments HTML, ou vous pouvez les générer programmatiquement à l’aide du module IPython.display.

Données

Vous pouvez importer les données des conteneurs Azure Cosmos et les résultats des requêtes programmatiquement dans un Jupyter Notebook. Utilisez les commandes magiques intégrées pour charger ou interroger des données dans Azure Cosmos DB.

Étapes suivantes

Pour bien démarrer avec les Jupyter Notebooks intégrés dans Azure Cosmos DB, consultez les articles suivants :