DataReference Clase

Representa una referencia a los datos de un almacén de datos.

DataReference representa una ruta de acceso de un almacén de datos y se puede usar para describir cómo y dónde deben estar disponibles los datos en una ejecución. Ya no es el enfoque recomendado para el acceso a datos y la entrega en Azure Machine Learning. El conjunto de datos admite el acceso a datos desde Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database y Azure Database for PostgreSQL a través de una interfaz unificada a la que se han agregado capacidades de administración de datos. Se recomienda usar el conjunto de datos para leer datos en los proyectos de aprendizaje automático.

Para más información sobre cómo usar el conjunto de datos de Azure ML en dos escenarios comunes, consulte los artículos:

Constructor De clase DataReference.

Herencia
builtins.object
DataReference

Constructor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parámetros

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
str
valor predeterminado: None

Nombre de la referencia de datos.

path_on_datastore
str
valor predeterminado: None

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

mode
str
valor predeterminado: mount

Operación en la referencia de datos. Los valores admitidos son "mount" (valor predeterminado) y "download".

Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada. En este caso, especifique la ruta de acceso con el parámetro path_on_compute cuando declare DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

path_on_compute
str
valor predeterminado: None

Ruta de acceso en el destino de proceso para la referencia de datos.

overwrite
bool
valor predeterminado: False

Indica si se van a sobrescribir los datos existentes.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
str
Requerido

Nombre de la referencia de datos.

path_on_datastore
str
Requerido

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

mode
str
Requerido

Operación en la referencia de datos. Valores admitidos "mount" (valor predeterminado) y "download".

Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada. En este caso, especifique la ruta de acceso con el parámetro path_on_compute cuando declare DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

path_on_compute
str
Requerido

Ruta de acceso en el destino de proceso para la referencia de datos.

overwrite
bool
Requerido

Indica si se van a sobrescribir los datos existentes.

Comentarios

DataReference define la ubicación de los datos y su uso en el enlace de proceso de destino ("mount" o "upload"). La ruta de acceso a los datos del almacén de datos puede ser la raíz "/", un directorio dentro del almacén de datos o un archivo de este.

Métodos

as_download

Cambie la operación de referencia de datos que se va a descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Cambie la operación de referencia de datos que se va a montar.

El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Cambie la operación de referencia de datos que se va a cargar.

Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix.

create

Cree un objeto DataReference mediante DataPath y DataPathComputeBinding.

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

as_download

Cambie la operación de referencia de datos que se va a descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parámetros

path_on_compute
str
valor predeterminado: None

Ruta de acceso en el proceso para la referencia de datos.

overwrite
bool
valor predeterminado: False

Indica si se van a sobrescribir los datos existentes.

Devoluciones

Nuevo objeto de referencia de datos.

Tipo de valor devuelto

as_mount

Cambie la operación de referencia de datos que se va a montar.

El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Devoluciones

Nuevo objeto de referencia de datos.

Tipo de valor devuelto

as_upload

Cambie la operación de referencia de datos que se va a cargar.

Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parámetros

path_on_compute
str
valor predeterminado: None

Ruta de acceso en el proceso para la referencia de datos.

overwrite
bool
valor predeterminado: False

Indica si se van a sobrescribir los datos existentes.

Devoluciones

Nuevo objeto de referencia de datos.

Tipo de valor devuelto

create

Cree un objeto DataReference mediante DataPath y DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parámetros

data_reference_name
str
valor predeterminado: None

Nombre de la referencia de datos que se va a crear.

datapath
DataPath
valor predeterminado: None

[Obligatorio] Ruta de acceso de datos que se va a usar.

datapath_compute_binding
DataPathComputeBinding
valor predeterminado: None

[Obligatorio] Enlace de proceso de la ruta de acceso a los datos que se va a usar.

Devoluciones

Objeto DataReference.

Tipo de valor devuelto

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

path(path=None, data_reference_name=None)

Parámetros

path
str
valor predeterminado: None

Ruta de acceso en el almacén de datos.

data_reference_name
str
valor predeterminado: None

Nombre de la referencia de datos.

Devoluciones

Objeto de referencia de datos.

Tipo de valor devuelto

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

to_config()

Devoluciones

Nuevo objeto DataReferenceConfiguration.

Tipo de valor devuelto