Cuadernos de Jupyter Notebook en Azure Cosmos DB (versión preliminar)

SE APLICA A: NoSQL MongoDB Cassandra Gremlin Table

Advertencia

La característica Blocs de notas de Jupyter de Azure Cosmos DB será retirada el 30 de marzo de 2024; no podrá utilizar blocs de notas Jupyter integrados desde la cuenta Azure Cosmos DB. Se recomienda usar compatibilidad de Visual Studio Code con blocs de notas de Jupyter o el cliente de blocs de notas de su preferencia.

Jupyter Notebooks es un entorno de desarrollador interactivo (IDE) de código abierto diseñado para crear, ejecutar y compartir documentos con código dinámico, ecuaciones, visualizaciones y texto narrativo.

Los cuadernos de Jupyter Notebook integrados en Azure Cosmos DB se integran directamente en Azure Portal y en las cuentas de Azure Cosmos DB, lo que hace que sean cómodos y fáciles de usar. Los desarrolladores, ingenieros, analistas y científicos de datos pueden usar la experiencia de Jupyter Notebook que ya conocen para realizar tareas comunes. Estas tareas comunes incluyen:

  • exploración de datos
  • limpieza de datos
  • transformación de datos
  • simulaciones numéricas
  • creación de modelos estadísticos
  • visualización de datos
  • aprendizaje automático

Screenshot of various Jupyter Notebooks visualizations in Azure Cosmos DB.

Azure Cosmos DB admite cuadernos de C# y de Python de las siguientes API: para NoSQL, Apache Cassandra, Apache Gremlin, Table y MongoDB. Dentro del cuaderno, puede aprovechar las características y comandos integrados que facilitan la creación de recursos de Azure Cosmos DB. También puede usar los comandos integrados para cargar, consultar y visualizar los datos en Azure Cosmos DB.

Screenshot of Jupyter Notebooks integrated developer environment (IDE) in Azure Cosmos DB.

Ventajas de los cuadernos de Jupyter Notebook

Los cuadernos de Jupyter Notebook se desarrollaron originalmente para aplicaciones de ciencia de datos escritas en Python y R. Sin embargo, se pueden usar de varias maneras para diferentes tipos de proyectos, como:

Visualización de datos

los cuadernos de Jupyter Notebook permiten visualizar los datos en forma de cuaderno compartido que representa algún conjunto de datos como un gráfico. Puede crear visualizaciones, realizar cambios interactivos en el código compartido y el conjunto de datos, y compartir los resultados.

Uso compartido de código

Los servicios como GitHub proporcionan maneras de compartir el código, pero en su mayoría no son interactivos. Con un cuaderno de Jupyter Notebook, puede ver el código, ejecutarlo y mostrar los resultados directamente en Azure Portal.

Interacciones activas con código

el código de un cuaderno de Jupyter Notebook es dinámico; puede editarlo y ejecutar las actualizaciones de manera incremental en tiempo real. También puede insertar controles de usuario (por ejemplo, controles deslizantes o campos de entrada de texto) que se pueden usar como orígenes de entrada para código, demostraciones o prueba de conceptos (POC).

Documentación de ejemplos de código y resultados de la exploración de datos

si tiene un fragmento de código y quiere explicar línea a línea cómo funciona, puede insertarlo en un cuaderno de Jupyter. Puede agregar interactividad junto con la documentación al mismo tiempo.

Comandos integrados para Azure Cosmos DB

los comandos mágicos integrados de Azure Cosmos DB facilitan la interacción con su cuenta. Puede usar comandos como %%upload y %%sql para cargar datos en un contenedor y consultarlos mediante sintaxis de la API de SQL. No es necesario escribir código personalizado extra.

Todo en un solo lugar

Jupyter Notebooks combina varios recursos en un único documento, entre los que se incluyen:

  • código
  • texto enriquecido
  • images
  • videos
  • suaves
  • ecuaciones matemáticas
  • trazados
  • maps
  • figuras interactivas
  • widgets
  • Interfaces gráficas de usuario

Componentes de un cuaderno de Jupyter Notebook

Los cuadernos de Jupyter Notebook pueden incluir varios tipos de componentes y cada uno de ellos se organizan en celdas o bloques discretos:

Texto y HTML

El texto sin formato, o texto anotado en la sintaxis de Markdown para generar HTML, se puede insertar en el documento en cualquier momento. Los estilos de CSS también pueden insertarse o agregarse a la plantilla que se usa para generar el cuaderno.

Código y salida

los cuadernos de Jupyter Notebook admiten código de Python y de C#. Los resultados del código ejecutado aparecen inmediatamente después de los bloques de código, y estos se pueden ejecutar varias veces en cualquier orden que desee.

Visualizaciones

puede generar gráficos a partir del código mediante módulos como Matplotlib, Plotly, Bokeh, etc. De forma similar a la salida, estas visualizaciones aparecen insertadas junto al código que las genera. De forma similar a la salida, estas visualizaciones aparecen insertadas junto al código que las genera.

Contenido multimedia

como los cuadernos de Jupyter Notebook se basan en tecnología web, pueden mostrar todos los tipos de contenido multimedia que se admiten en una página web. Puede incluirlos en un cuaderno como elementos HTML o puede generarlos mediante programación con el módulo IPython.display.

data

puede importar los datos mediante programación desde contenedores de Azure Cosmos o los resultados de las consultas a un cuaderno de Jupyter Notebook. Use comandos mágicos integrados para cargar o consultar datos en Azure Cosmos DB.

Pasos siguientes

Para empezar a trabajar con cuadernos de Jupyter Notebook integrados en Azure Cosmos DB, consulte los siguientes artículos: