Поделиться через


AzureDataLakeGen2Datastore Класс

Представляет хранилище данных, в котором содержатся сведения о подключении к Azure Data Lake Storage 2-го поколения.

Чтобы создать хранилище данных, которое сохраняет сведения о подключении к Azure Data Lake Storage, используйте метод register_azure_data_lake_gen2 класса Datastore.

Чтобы получить доступ к данным из объекта AzureDataLakeGen2Datastore, создайте Dataset и используйте для FileDataset один из методов, таких как from_files. Дополнительные сведения см. в статье Создание наборов данных Машинного обучения Azure.

Также помните о следующем:

  • Класс AzureDataLakeGen2 не предоставляет метода для передачи данных. Загружать данные в хранилища данных AzureDataLakeGen2 рекомендуется через набор данных. Дополнительные сведения см. в статье, доступной по адресу https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets.

  • Для доступа к данным в хранилище необходимо иметь соответствующее разрешение, которое зависит от учетных данных, зарегистрированных в этом хранилище.

  • При использовании проверки подлинности на основе субъекта-службы для доступа к хранилищу через AzureDataLakeGen2 субъекту-службе или регистрации приложения необходимо назначить определенную роль управления доступом на основе ролей (RBAC). Это должна быть как минимум роль "Читатель данных больших двоичных объектов хранилища". Дополнительные сведения см. в статье Встроенные роли службы хранилища.

Инициализирует новое хранилище данных Azure Data Lake 2-го поколения.

Наследование
AzureDataLakeGen2Datastore

Конструктор

AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)

Параметры

workspace
str
Обязательно

Рабочая область, к которой принадлежит это хранилище данных.

name
str
Обязательно

Имя хранилища данных.

container_name
str
Обязательно

Имя контейнера больших двоичных объектов Azure.

account_name
str
Обязательно

имя учетной записи хранения.

tenant_id
str
значение по умолчанию: None

Идентификатор каталога/идентификатор клиента субъекта-службы.

client_id
str
значение по умолчанию: None

Идентификатор клиента или идентификатор приложения субъекта-службы.

client_secret
str
значение по умолчанию: None

Секрет субъекта-службы.

resource_url
str
значение по умолчанию: None

URL-адрес ресурса, который определяет, какие операции будут выполняться в Data Lake Store.

authority_url
str
значение по умолчанию: None

URL-адрес центра, используемый для проверки подлинности пользователя.

protocol
str
значение по умолчанию: None

Протокол, используемый для подключения к контейнеру больших двоичных объектов. При значении None по умолчанию используется HTTPS.

endpoint
str
значение по умолчанию: None

Конечная точка контейнера больших двоичных объектов. При значении None по умолчанию используется core.windows.net.

service_data_access_auth_identity
str или <xref:_restclient.models.ServiceDataAccessAuthIdentity>
значение по умолчанию: None

Указывает, какое удостоверение следует использовать для проверки подлинности доступа к данным службы к хранилищу клиента. Возможные значения: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"

workspace
str
Обязательно

Рабочая область, к которой принадлежит это хранилище данных.

name
str
Обязательно

Имя хранилища данных.

container_name
str
Обязательно

Имя контейнера больших двоичных объектов Azure.

account_name
str
Обязательно

имя учетной записи хранения.

tenant_id
str
Обязательно

Идентификатор каталога/идентификатор клиента субъекта-службы.

client_id
str
Обязательно

Идентификатор клиента или идентификатор приложения субъекта-службы.

client_secret
str
Обязательно

Секрет субъекта-службы.

resource_url
str
Обязательно

URL-адрес ресурса, который определяет, какие операции будут выполняться в Data Lake Store.

authority_url
str
Обязательно

URL-адрес центра, используемый для проверки подлинности пользователя.

protocol
str
Обязательно

Протокол, используемый для подключения к контейнеру больших двоичных объектов. При значении None по умолчанию используется HTTPS.

endpoint
str
Обязательно

Конечная точка контейнера больших двоичных объектов. При значении None по умолчанию используется core.windows.net.

service_data_access_auth_identity
str или <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Обязательно

Указывает, какое удостоверение следует использовать для проверки подлинности доступа к данным службы к хранилищу клиента. Возможные значения: "Нет", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"