azure_data_lake_datastore 模块

包含将连接信息保存到 Azure Data Lake Storage 的数据存储的基本功能。

AbstractADLSDatastore

表示将连接信息保存到 Azure Data Lake Storage 的数据存储的基类。

不应直接使用此类。 若要创建将连接信息保存到 Azure Data Lake Storage 的数据存储,请使用 Datastore 类的 register_azure_data_lake* 方法之一。

初始化新的 Azure Data Lake 数据存储。

AzureDataLakeDatastore

表示将连接信息保存到 Azure Data Lake Storage 的数据存储。

若要创建将连接信息保存到 Azure Data Lake Storage 的数据存储,请使用 Datastore 类的 register_azure_data_lake 方法。

注意:使用数据存储访问数据时,必须具有访问数据的权限,这取决于在数据存储中注册的凭据。

初始化新的 Azure Data Lake 数据存储。

AzureDataLakeGen2Datastore

表示将连接信息保存到 Azure Data Lake Storage Gen2 的数据存储。

若要创建将连接信息保存到 Azure Data Lake Storage 的数据存储,请使用 Datastore 类的 register_azure_data_lake_gen2 方法。

若要访问 AzureDataLakeGen2Datastore 对象中的数据,请创建 Dataset,并对 FileDataset 使用 from_files 等方法之一。 有关详细信息,请参阅创建 Azure 机器学习数据集

另请记住:

  • AzureDataLakeGen2 类不提供上传方法,建议通过数据集将数据上传到 AzureDataLakeGen2 数据存储。 此处提供了更多详细信息:https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets

  • 使用数据存储访问数据时,必须具有访问数据的权限,这取决于在数据存储中注册的凭据。

  • 使用服务主体身份验证通过 AzureDataLakeGen2 访问存储时,必须为服务主体或应用注册分配至少“存储 Blob 数据读取器”的特定基于角色的访问控制 (RBAC) 角色。 有关详细信息,请参阅存储内置角色

初始化新的 Azure Data Lake Gen2 数据存储。