AzureDataLakeGen2Datastore Clase
Representa un almacén de datos que guarda la información de conexión a Azure Data Lake Storage Gen2.
Para crear un almacén de datos que guarde la información de conexión a Azure Data Lake Storage, use el método register_azure_data_lake_gen2
de la clase Datastore.
Para acceder a los datos de un objeto AzureDataLakeGen2Datastore, cree un elemento Dataset y use uno de los métodos como from_files para un FileDataset. Para más información, consulte Creación de conjuntos de datos de Azure Machine Learning.
Además, tenga en cuenta lo siguiente:
La clase AzureDataLakeGen2 no proporciona el método de carga; la manera recomendada de cargar datos en almacenes de datos AzureDataLakeGen2 es mediante la carga de conjuntos de datos. Encontrará más detalles en https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets.
Cuando se usa un almacén de datos para acceder a los datos, debe tener permiso para acceder a ellos, lo que depende de las credenciales registradas en el almacén de datos.
Al usar la autenticación de entidad de servicio para acceder al almacenamiento a través de AzureDataLakeGen2, se debe asignar a la entidad de servicio o al registro de la aplicación el rol específico de control de acceso basado en rol (RBAC) con el nivel mínimo de "lector de datos de Storage Blob". Para más información, consulte Roles integrados en Storage.
Inicializa un nuevo almacén de datos de Azure Data Lake Gen2.
- Herencia
-
AzureDataLakeGen2Datastore
Constructor
AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)
Parámetros
- tenant_id
- str
Identificador de directorio o identificador de inquilino de la entidad de servicio.
- client_id
- str
Identificador de la aplicación/identificador de cliente de la entidad de servicio
- resource_url
- str
Dirección URL del recurso que determina qué operaciones se realizarán en Data Lake Store.
- authority_url
- str
La dirección URL de la autoridad que se usa para autenticar al usuario.
- protocol
- str
Protocolo que se va a usar para conectar con el contenedor de blobs. Si es None, el valor predeterminado es HTTPS.
- endpoint
- str
Punto de conexión del contenedor de blobs. Si es None, el valor predeterminado es core.windows.net.
- service_data_access_auth_identity
- str o <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Indica qué identidad se va a usar para autenticar el acceso a datos de servicio para el almacenamiento del cliente. Los valores posibles son: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"
- tenant_id
- str
Identificador de directorio o identificador de inquilino de la entidad de servicio.
- client_id
- str
Identificador de la aplicación/identificador de cliente de la entidad de servicio
- resource_url
- str
Dirección URL del recurso que determina qué operaciones se realizarán en Data Lake Store.
- protocol
- str
Protocolo que se va a usar para conectar con el contenedor de blobs. Si es None, el valor predeterminado es HTTPS.
- endpoint
- str
Punto de conexión del contenedor de blobs. Si es None, el valor predeterminado es core.windows.net.
- service_data_access_auth_identity
- str o <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Indica qué identidad se va a usar para autenticar el acceso a datos de servicio para el almacenamiento del cliente. Los valores posibles son: "None", "WorkspaceSystemAssignedIdentity", "WorkspaceUserAssignedIdentity"
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de