Источники данных

В этом разделе описаны источники данных Apache Spark, которые можно использовать в Azure Databricks. Во многих из них задействована записная книжка, на примере которой демонстрируется использование источника данных для чтения и записи данных.

Ниже перечислены источники данных, которые напрямую поддерживаются в Databricks Runtime, а также те, для доступа к которым нужно использовать простые команды оболочки.

Кроме того, Azure Databricks поддерживает Delta Lake и упрощает создание таблиц Delta на основе нескольких форматов данных.

Дополнительные сведения об источниках данных Apache Spark см. в статье Generic Load/Save Functions (Универсальные функции загрузки и сохранения) и Generic File Source Options (Универсальные параметры источников файлов).

Дополнительные сведения о доступе к метаданным для источников данных на основе файлов см. в статье Столбец метаданных файла.

Для приведенных ниже источников данных в хранилище нужно настроить подключение к хранилищу. Для некоторых также нужно создать библиотеку Azure Databricks и установить ее в кластере.