数据源
本部分介绍可在 Azure Databricks 中使用的 Apache Spark 数据源。 很多都有一个笔记本来演示如何使用数据源读取和写入数据。
下列数据源直接在 Databricks Runtime 中受到支持,或者需要简单的 shell 命令来启用访问权限:
此外,Azure Databricks 还支持 Delta Lake,因此可以通过多种数据格式轻松创建 Delta 表。
有关 Apache Spark 数据源的详细信息,请参阅通用加载/保存函数和泛型文件源选项。
若要了解如何访问基于文件的数据源的元数据,请参阅文件元数据列。
以下存储数据源要求你配置与存储的连接。 一些还需要你创建一个 Azure Databricks 库并将它安装在群集中: