Экспорт и импорт записных книжек Databricks

На этой странице описывается импорт и экспорт записных книжек в Azure Databricks и форматы записных книжек, поддерживаемые Azure Databricks.

Поддерживаемые форматы записных книжек

Databricks может импортировать и экспортировать записные книжки в следующих форматах:

  • Исходный файл: файл, содержащий только операторы исходного кода с расширением .scala, .py, .sqlили .r.
  • HTML: записная книжка Azure Databricks с расширением .html.
  • Архив Databricks .dbc .
  • Записная книжка IPython: записная книжка Jupyter с расширением .ipynb.
  • RMarkdown: документ R Markdown с расширением .Rmd.

Импорт записной книжки

Вы можете импортировать внешнюю записную книжку из URL-адреса или файла. Вы также можете импортировать ZIP-архив записных книжек , экспортированных массово из рабочей области Azure Databricks.

  1. Щелкните Значок рабочей областиРабочая область на боковой панели. Выполните одно из следующих действий.
    • Щелкните правой кнопкой мыши папку и выберите Импорт.
    • Чтобы импортировать записную книжку на верхнем уровне текущей папки рабочей области, щелкните меню кебаб в правом верхнем углу и выберите Импорт.
  2. Укажите URL-адрес или найдите файл, содержащий поддерживаемый внешний формат, или ZIP-архив записных книжек, экспортированных из рабочей области Azure Databricks.
  3. Нажмите кнопку Импорт.
    • Если выбрать одну записную книжку, она будет экспортирована в текущую папку.
    • При выборе архива DBC или ZIP его структура папок воссоздается в текущей папке и импортируется каждая записная книжка.

Импорт файла и его преобразование в записную книжку

Скрипты Python, SQL, Scala и R можно преобразовать в записные книжки с одной ячейкой, добавив комментарий в первую ячейку файла:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Чтобы определить ячейки в скрипте, используйте специальный комментарий, показанный ниже. При импорте скрипта в Databricks создаются ячейки, помеченные показанными строками COMMAND .

Python

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Экспорт записных книжек

Примечание

При экспорте записной книжки в формате HTML, IPython notebook (.ipynb) или архива (DBC) и не были очищены выходные данные команды, выходные данные включаются в экспорт.

Чтобы экспортировать записную книжку, выберите Экспорт файла > на панели инструментов записной книжки и выберите формат экспорта.

Чтобы экспортировать все папки в папке рабочей области в виде ZIP-архива, выполните следующие действия.

  1. Щелкните Значок рабочей областиРабочая область на боковой панели.
  2. Щелкните папку правой кнопкой мыши и выберите Экспорт.
  3. Выберите формат экспорта:
    • Архив DBC. Экспорт архива Databricks , двоичного формата, который включает метаданные и выходные данные команды записной книжки.
    • Исходный файл. ЭкспортИРУЙТЕ ZIP-архив исходных файлов записных книжек, которые можно импортировать в рабочую область Azure Databricks, использовать в конвейере CI/CD или просмотреть в качестве исходных файлов на языке по умолчанию для каждой записной книжки. Выходные данные команды записной книжки не включены.
    • АРХИВ HTML: экспорт ZIP-архива HTML-файлов. HTML-файл каждой записной книжки можно импортировать в рабочую область Azure Databricks или просмотреть в формате HTML. Выходные данные команды записной книжки включены.