AzureDataLakeGen2Datastore Clase

Representa un almacén de datos que guarda la información de conexión a Azure Data Lake Storage Gen2.

Para crear un almacén de datos que guarde la información de conexión a Azure Data Lake Storage, use el método register_azure_data_lake_gen2 de la clase Datastore.

Para acceder a los datos de un objeto AzureDataLakeGen2Datastore, cree un elemento Dataset y use uno de los métodos como from_files para un FileDataset. Para más información, consulte Creación de conjuntos de datos de Azure Machine Learning.

Además, tenga en cuenta lo siguiente:

  • La clase AzureDataLakeGen2 no proporciona el método de carga; la manera recomendada de cargar datos en almacenes de datos AzureDataLakeGen2 es mediante la carga de conjuntos de datos. Encontrará más detalles en https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets.

  • Cuando se usa un almacén de datos para acceder a los datos, debe tener permiso para acceder a ellos, lo que depende de las credenciales registradas en el almacén de datos.

  • Al usar la autenticación de entidad de servicio para acceder al almacenamiento a través de AzureDataLakeGen2, se debe asignar a la entidad de servicio o al registro de la aplicación el rol específico de control de acceso basado en rol (RBAC) con el nivel mínimo de "lector de datos de Storage Blob". Para más información, consulte Roles integrados en Storage.

Inicializa un nuevo almacén de datos de Azure Data Lake Gen2.

Herencia
AzureDataLakeGen2Datastore

Constructor

AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)

Parámetros

workspace
str
Requerido

Área de trabajo a la que pertenece este almacén de datos.

name
str
Requerido

Nombre del almacén de datos.

container_name
str
Requerido

Nombre del contenedor de blobs de Azure.

account_name
str
Requerido

El nombre de la cuenta de almacenamiento.

tenant_id
str
valor predeterminado: None

Identificador de directorio o identificador de inquilino de la entidad de servicio.

client_id
str
valor predeterminado: None

Identificador de la aplicación/identificador de cliente de la entidad de servicio

client_secret
str
valor predeterminado: None

Secreto de la entidad de servicio.

resource_url
str
valor predeterminado: None

Dirección URL del recurso que determina qué operaciones se realizarán en Data Lake Store.

authority_url
str
valor predeterminado: None

La dirección URL de la autoridad que se usa para autenticar al usuario.

protocol
str
valor predeterminado: None

Protocolo que se va a usar para conectar con el contenedor de blobs. Si es None, el valor predeterminado es HTTPS.

endpoint
str
valor predeterminado: None

Punto de conexión del contenedor de blobs. Si es None, el valor predeterminado es core.windows.net.

service_data_access_auth_identity
str o <xref:_restclient.models.ServiceDataAccessAuthIdentity>
valor predeterminado: None

Indica qué identidad se va a usar para autenticar el acceso a datos de servicio para el almacenamiento del cliente. Los valores posibles son: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"

workspace
str
Requerido

Área de trabajo a la que pertenece este almacén de datos.

name
str
Requerido

Nombre del almacén de datos.

container_name
str
Requerido

Nombre del contenedor de blobs de Azure.

account_name
str
Requerido

El nombre de la cuenta de almacenamiento.

tenant_id
str
Requerido

Identificador de directorio o identificador de inquilino de la entidad de servicio.

client_id
str
Requerido

Identificador de la aplicación/identificador de cliente de la entidad de servicio

client_secret
str
Requerido

Secreto de la entidad de servicio.

resource_url
str
Requerido

Dirección URL del recurso que determina qué operaciones se realizarán en Data Lake Store.

authority_url
str
Requerido

La dirección URL de la autoridad que se usa para autenticar al usuario.

protocol
str
Requerido

Protocolo que se va a usar para conectar con el contenedor de blobs. Si es None, el valor predeterminado es HTTPS.

endpoint
str
Requerido

Punto de conexión del contenedor de blobs. Si es None, el valor predeterminado es core.windows.net.

service_data_access_auth_identity
str o <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Requerido

Indica qué identidad se va a usar para autenticar el acceso a datos de servicio para el almacenamiento del cliente. Los valores posibles son: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"