Share via


DataReference Clase

Representa una referencia a los datos de un almacén de datos.

DataReference representa una ruta de acceso de un almacén de datos y se puede usar para describir cómo y dónde deben estar disponibles los datos en una ejecución. Ya no es el enfoque recomendado para el acceso a datos y la entrega en Azure Machine Learning. El conjunto de datos admite el acceso a datos desde Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database y Azure Database for PostgreSQL a través de una interfaz unificada a la que se han agregado capacidades de administración de datos. Se recomienda usar el conjunto de datos para leer datos en los proyectos de aprendizaje automático.

Para más información sobre cómo usar el conjunto de datos de Azure ML en dos escenarios comunes, consulte los artículos:

Constructor De clase DataReference.

Herencia
builtins.object
DataReference

Constructor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
datastore
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
str

Nombre de la referencia de datos.

valor predeterminado: None
path_on_datastore
str

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

valor predeterminado: None
mode
str

Operación en la referencia de datos. Los valores admitidos son "mount" (valor predeterminado) y "download".

Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada. En este caso, especifique la ruta de acceso con el parámetro path_on_compute cuando declare DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

valor predeterminado: mount
path_on_compute
str

Ruta de acceso en el destino de proceso para la referencia de datos.

valor predeterminado: None
overwrite

Indica si se van a sobrescribir los datos existentes.

valor predeterminado: False
datastore
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
Requerido
str

Nombre de la referencia de datos.

path_on_datastore
Requerido
str

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

mode
Requerido
str

Operación en la referencia de datos. Valores admitidos "mount" (valor predeterminado) y "download".

Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada. En este caso, especifique la ruta de acceso con el parámetro path_on_compute cuando declare DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

path_on_compute
Requerido
str

Ruta de acceso en el destino de proceso para la referencia de datos.

overwrite
Requerido

Indica si se van a sobrescribir los datos existentes.

Comentarios

DataReference define la ubicación de los datos y su uso en el enlace de proceso de destino ("mount" o "upload"). La ruta de acceso a los datos del almacén de datos puede ser la raíz "/", un directorio dentro del almacén de datos o un archivo de este.

Métodos

as_download

Cambie la operación de referencia de datos que se va a descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Cambie la operación de referencia de datos que se va a montar.

El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Cambie la operación de referencia de datos que se va a cargar.

Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix.

create

Cree un objeto DataReference mediante DataPath y DataPathComputeBinding.

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

as_download

Cambie la operación de referencia de datos que se va a descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
path_on_compute
str

Ruta de acceso en el proceso para la referencia de datos.

valor predeterminado: None
overwrite

Indica si se van a sobrescribir los datos existentes.

valor predeterminado: False

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

as_mount

Cambie la operación de referencia de datos que se va a montar.

El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

as_upload

Cambie la operación de referencia de datos que se va a cargar.

Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
path_on_compute
str

Ruta de acceso en el proceso para la referencia de datos.

valor predeterminado: None
overwrite

Indica si se van a sobrescribir los datos existentes.

valor predeterminado: False

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

create

Cree un objeto DataReference mediante DataPath y DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parámetros

Nombre Description
data_reference_name
str

Nombre de la referencia de datos que se va a crear.

valor predeterminado: None
datapath

[Obligatorio] Ruta de acceso de datos que se va a usar.

valor predeterminado: None
datapath_compute_binding

[Obligatorio] Enlace de proceso de la ruta de acceso a los datos que se va a usar.

valor predeterminado: None

Devoluciones

Tipo Description

Objeto DataReference.

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

path(path=None, data_reference_name=None)

Parámetros

Nombre Description
path
str

Ruta de acceso en el almacén de datos.

valor predeterminado: None
data_reference_name
str

Nombre de la referencia de datos.

valor predeterminado: None

Devoluciones

Tipo Description

Objeto de referencia de datos.

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

to_config()

Devoluciones

Tipo Description

Nuevo objeto DataReferenceConfiguration.