Записные книжки Jupyter в Azure Cosmos DB (предварительная версия)

Область применения: Nosql Mongodb Кассандра Гремлин Таблица

Предупреждение

Функция Jupyter Notebook в Azure Cosmos DB будет прекращена 30 марта 2024 г.; Вы не сможете использовать встроенные записные книжки Jupyter из учетной записи Azure Cosmos DB. Мы рекомендуем использовать поддержку Visual Studio Code для записных книжек Jupyter или предпочитаемого клиента записных книжек.

Jupyter Notebooks — это интерактивная среда разработки с открытым исходным кодом (IDE), предназначенная для создания, выполнения и совместного использования документов, содержащих динамический код, уравнения, визуализации и текст повествования.

Встроенные записные книжки Jupyter Notebook в Azure Cosmos DB напрямую интегрируются с порталом Azure и учетными записями Azure Cosmos DB, что делает их простыми и удобными в использовании. Разработчики, специалисты по обработке и анализу данных и аналитики могут использовать знакомый интерфейс Jupyter Notebook для выполнения распространенных задач. К этим общим задачам относятся:

  • Исследование данных
  • очистка данных
  • преобразования данных
  • числовые имитации
  • статистическое моделирование
  • Визуализация данных
  • машинное обучение;

Screenshot of various Jupyter Notebooks visualizations in Azure Cosmos DB.

Azure Cosmos DB поддерживает записные книжки C# и Python для API noSQL, Apache Cassandra, Apache Gremlin, Table и MongoDB. В записной книжке можно воспользоваться встроенными командами и функциями, которые упрощают создание ресурсов Azure Cosmos DB. Вы также можете использовать встроенные команды для отправки, запроса и визуализации данных в Azure Cosmos DB.

Screenshot of Jupyter Notebooks integrated developer environment (IDE) in Azure Cosmos DB.

Преимущества записных книжек Jupyter Notebook

Записные книжки Jupyter Notebook изначально разрабатывались для приложений по обработке и анализу данных, написанных на Python и R. Однако их можно использовать различными способами для разнообразных задач. Рассмотрим некоторые из них.

Визуализация данных

Jupyter Notebook позволяет визуализировать данные в виде общей записной книжки, отображающей набор данных в графическом виде. Вы можете создавать визуализации, вносить интерактивные изменения в общий код и набор данных, а также делиться результатами с другими пользователями.

Общий доступ к коду

Службы, такие как GitHub, предоставляют способы совместного использования кода, но они в значительной степени не интерактивны. С помощью записной книжки Jupyter Notebook можно просматривать код, выполнять его и отображать результаты непосредственно на портале Azure.

Динамическое взаимодействие с кодом

Код в записной книжке Jupyter Notebook является динамическим. Вы можете изменять его и выполнять добавочные обновления в реальном времени. Кроме того, в записную книжку можно встроить пользовательские элементы управления (например, ползунки или поля для ввода текста), которые будут использоваться в качестве источников входных данных для кода, демонстраций или подтверждения концепции.

Документация по примерам кода и результатам исследования данных

Если у вас есть фрагмент кода и вы хотите объяснить, как работает каждая строка, внедрите его в Jupyter Notebook. Вы можете добавить интерактивность одновременно с документацией.

Встроенные команды для Azure Cosmos DB

Встроенные в Azure Cosmos DB магические команды упрощают взаимодействие с учетной записью. С помощью команд %%upload и %%sql можно передать данные в контейнер и запрашивать их посредством API-синтаксиса для SQL. Вам не нужно писать дополнительный пользовательский код.

Все в одной среде

Jupyter Notebook объединяет несколько ресурсов в один документ, включая:

  • кодом
  • форматированный текст
  • images
  • videos
  • анимаций
  • математические уравнения
  • Участки
  • maps
  • интерактивные цифры
  • мини-приложения
  • графические пользовательские интерфейсы

Компоненты записной книжки Jupyter Notebook

Записные книжки Jupyter Notebook могут содержать несколько типов компонентов, каждый из которых организован в отдельные блоки или ячейки:

Текст и HTML

Обычный текст или текст с заметками в синтаксисе Markdown для создания HTML можно вставить в документ в любой точке. Дизайн CSS также можно встроить или добавить в шаблон, используемый для создания записной книжки.

код и выходные данные;

Записные книжки Jupyter Notebook поддерживают код Python и C#. Результаты выполненного кода появляются сразу после блоков кода, и блоки кода могут выполняться несколько раз в любом порядке.

Визуализации

Вы можете создавать графические элементы и диаграммы на основе кода с помощью таких модулей, как Matplotlib, Plotly, Bokeh и др. Подобно выходным данным, эти визуализации отображаются в строке рядом с кодом, который их генерирует. Подобно выходным данным, эти визуализации отображаются в строке рядом с кодом, который их генерирует.

Мультимедиа

Поскольку в основе записных книжек Jupyter Notebook лежит веб-технология, они могут отображать все типы мультимедиа, которые поддерживают веб-страницы. Вы можете включить их в записную книжку как элементы HTML или сгенерировать их программно с помощью модуля IPython.display.

Data

Данные из контейнеров Azure Cosmos или из результатов запросов можно программно импортировать в записную книжку Jupyter Notebook. Для передачи данных и их запроса в Azure Cosmos DB используются встроенные магические команды.

Следующие шаги

Чтобы приступить к работе со встроенными записными книжками Jupyter Notebook в Azure Cosmos DB, ознакомьтесь со следующими статьями: