DataReference Classe

Representa uma referência a dados em um armazenamento de dados.

Uma DataReference representa um caminho em um armazenamento de dados e pode ser usada para descrever como e onde os dados devem ser disponibilizados em uma execução. Essa não é mais a abordagem recomendada para acesso e entrega de dados no Azure Machine Learning. O conjunto de dados dá suporte ao acesso de dados de Armazenamento de Blobs do Azure, Arquivos do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Banco de Dados SQL do Azure e Banco de Dados do Azure para PostgreSQL por meio de interface unificada com recursos de gerenciamento de dados adicionados. É recomendável usar o conjunto de dados para ler dados em seus projetos de machine learning.

Para obter mais informações sobre como usar o conjunto de dados do Azure ML em dois cenários comuns, consulte os artigos:

Construtor DataReference de classe.

Herança
builtins.object
DataReference

Construtor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
datastore
Obrigatório

O armazenamento de dados para referenciar.

data_reference_name
str

O nome da referência de dados.

valor padrão: None
path_on_datastore
str

O caminho relativo no armazenamento de suporte para referência de dados.

valor padrão: None
mode
str

A operação na referência de dados. Os valores compatíveis são 'mount' (o padrão) e 'download'.

Use o modo 'download' quando o script espera um caminho específico (por exemplo, embutido em código) para os dados de entrada. Nesse caso, especifique o caminho com o parâmetro path_on_compute ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script.

Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML _DATAREFERENCE_ <data_reference_name> é definido com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos de uma etapa do pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime.

valor padrão: mount
path_on_compute
str

O caminho no destino de computação para a referência de dados.

valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

valor padrão: False
datastore
Obrigatório

O armazenamento de dados para referenciar.

data_reference_name
Obrigatório
str

O nome da referência de dados.

path_on_datastore
Obrigatório
str

O caminho relativo no armazenamento de suporte para referência de dados.

mode
Obrigatório
str

A operação na referência de dados. Valores com suporte 'mount' (o padrão) e 'download'.

Use o modo 'download' quando o script espera um caminho específico (por exemplo, embutido em código) para os dados de entrada. Nesse caso, especifique o caminho com o parâmetro path_on_compute ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script.

Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML _DATAREFERENCE_ <data_reference_name> é definido com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos de uma etapa do pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime.

path_on_compute
Obrigatório
str

O caminho no destino de computação para a referência de dados.

overwrite
Obrigatório

Indica se os dados existentes devem ser substituídos.

Comentários

Um DataReference define o local dos dados e como os dados são usados na associação de computação de destino (montagem ou upload). O caminho para os dados no armazenamento de dados pode ser a raiz /, um diretório dentro do armazenamento de dados ou um arquivo no armazenamento de dados.

Métodos

as_download

Alterna a operação de referência de dados para download.

O download de DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Alterna a operação de referência de dados para montar.

A montagem DataReference só é compatível com o Azure Blob. Para montar dados no Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Alterna a operação de referência de dados para carregar.

Para obter mais informações sobre quais computações e armazenamentos de dados são compatíveis com o carregamento de dados, consulte: https://aka.ms/datastore-matrix.

create

Cria um DataReference usando DataPath e DataPathComputeBinding.

path

Cria uma instância de DataReference com base no caminho fornecido.

to_config

Converte o objeto DataReference no objeto DataReferenceConfiguration.

as_download

Alterna a operação de referência de dados para download.

O download de DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
path_on_compute
str

O caminho na computação para a referência de dados.

valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

valor padrão: False

Retornos

Tipo Description

Um novo objeto de referência de dados.

as_mount

Alterna a operação de referência de dados para montar.

A montagem DataReference só é compatível com o Azure Blob. Para montar dados no Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Retornos

Tipo Description

Um novo objeto de referência de dados.

as_upload

Alterna a operação de referência de dados para carregar.

Para obter mais informações sobre quais computações e armazenamentos de dados são compatíveis com o carregamento de dados, consulte: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
path_on_compute
str

O caminho na computação para a referência de dados.

valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

valor padrão: False

Retornos

Tipo Description

Um novo objeto de referência de dados.

create

Cria um DataReference usando DataPath e DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parâmetros

Nome Description
data_reference_name
str

O nome da referência de dados a ser criada.

valor padrão: None
datapath

[Obrigatório] O caminho de dados a ser usado.

valor padrão: None
datapath_compute_binding

[Obrigatório] A associação de computação do caminho de dados a ser usada.

valor padrão: None

Retornos

Tipo Description

Um objeto DataReference.

path

Cria uma instância de DataReference com base no caminho fornecido.

path(path=None, data_reference_name=None)

Parâmetros

Nome Description
path
str

O caminho no armazenamento de dados.

valor padrão: None
data_reference_name
str

O nome da referência de dados.

valor padrão: None

Retornos

Tipo Description

O objeto de referência de dados.

to_config

Converte o objeto DataReference no objeto DataReferenceConfiguration.

to_config()

Retornos

Tipo Description

Um novo objeto DataReferenceConfiguration.