AzureDataLakeGen2Datastore Класс
Представляет хранилище данных, в котором содержатся сведения о подключении к Azure Data Lake Storage 2-го поколения.
Чтобы создать хранилище данных, которое сохраняет сведения о подключении к Azure Data Lake Storage, используйте метод register_azure_data_lake_gen2
класса Datastore.
Чтобы получить доступ к данным из объекта AzureDataLakeGen2Datastore, создайте Dataset и используйте для FileDataset один из методов, таких как from_files. Дополнительные сведения см. в статье Создание наборов данных Машинного обучения Azure.
Также помните о следующем:
Класс AzureDataLakeGen2 не предоставляет метода для передачи данных. Загружать данные в хранилища данных AzureDataLakeGen2 рекомендуется через набор данных. Дополнительные сведения см. в статье, доступной по адресу https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets.
Для доступа к данным в хранилище необходимо иметь соответствующее разрешение, которое зависит от учетных данных, зарегистрированных в этом хранилище.
При использовании проверки подлинности на основе субъекта-службы для доступа к хранилищу через AzureDataLakeGen2 субъекту-службе или регистрации приложения необходимо назначить определенную роль управления доступом на основе ролей (RBAC). Это должна быть как минимум роль "Читатель данных больших двоичных объектов хранилища". Дополнительные сведения см. в статье Встроенные роли службы хранилища.
Инициализирует новое хранилище данных Azure Data Lake 2-го поколения.
- Наследование
-
AzureDataLakeGen2Datastore
Конструктор
AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)
Параметры
- tenant_id
- str
Идентификатор каталога/идентификатор клиента субъекта-службы.
- client_id
- str
Идентификатор клиента или идентификатор приложения субъекта-службы.
- resource_url
- str
URL-адрес ресурса, который определяет, какие операции будут выполняться в Data Lake Store.
- authority_url
- str
URL-адрес центра, используемый для проверки подлинности пользователя.
- protocol
- str
Протокол, используемый для подключения к контейнеру больших двоичных объектов. При значении None по умолчанию используется HTTPS.
- endpoint
- str
Конечная точка контейнера больших двоичных объектов. При значении None по умолчанию используется core.windows.net.
- service_data_access_auth_identity
- str или <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Указывает, какое удостоверение следует использовать для проверки подлинности доступа к данным службы к хранилищу клиента. Возможные значения: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"
- resource_url
- str
URL-адрес ресурса, который определяет, какие операции будут выполняться в Data Lake Store.
- protocol
- str
Протокол, используемый для подключения к контейнеру больших двоичных объектов. При значении None по умолчанию используется HTTPS.
- endpoint
- str
Конечная точка контейнера больших двоичных объектов. При значении None по умолчанию используется core.windows.net.
- service_data_access_auth_identity
- str или <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Указывает, какое удостоверение следует использовать для проверки подлинности доступа к данным службы к хранилищу клиента. Возможные значения: "Нет", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по