DataReference Klasa

Reprezentuje odwołanie do danych w magazynie danych.

Funkcja DataReference reprezentuje ścieżkę w magazynie danych i może służyć do opisania sposobu i miejsca udostępnienia danych w przebiegu. Nie jest to już zalecane podejście do uzyskiwania dostępu do danych i dostarczania ich w usłudze Azure Machine Learning. Zestaw danych obsługuje uzyskiwanie dostępu do danych z usługi Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database i Azure Database for PostgreSQL dzięki ujednoliconemu interfejsowi z dodanymi możliwościami zarządzania danymi. Zaleca się używanie zestawu danych do odczytywania danych w projektach uczenia maszynowego.

Aby uzyskać więcej informacji na temat używania zestawu danych usługi Azure ML w dwóch typowych scenariuszach, zobacz artykuły:

Klasa DataReference, konstruktor.

Dziedziczenie
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parametry

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Wymagane

Magazyn danych do odwołania.

data_reference_name
str
wartość domyślna: None

Nazwa odwołania do danych.

path_on_datastore
str
wartość domyślna: None

Ścieżka względna w magazynie zapasowym dla odwołania do danych.

mode
str
wartość domyślna: mount

Operacja dotycząca odwołania do danych. Obsługiwane wartości to "mount" (ustawienie domyślne) i "download".

Użyj trybu pobierania, gdy skrypt oczekuje określonej ścieżki (np. zakodowanej na stałe) dla danych wejściowych. W takim przypadku określ ścieżkę za pomocą parametru path_on_compute podczas deklarowania właściwości DataReference. Usługa Azure Machine Learning pobierze dane określone przez ścieżkę przed wykonaniem skryptu.

W trybie instalacji katalog tymczasowy jest tworzony z zainstalowanymi danymi, a zmienna środowiskowa $AZUREML_DATAREFERENCE_<data_reference_name> jest ustawiana ze ścieżką do katalogu tymczasowego. Jeśli przekażesz element DataReference do listy argumentów dla kroku potoku (np. PythonScriptStep), odwołanie zostanie rozwinięte do lokalnej ścieżki danych w czasie wykonywania.

path_on_compute
str
wartość domyślna: None

Ścieżka w docelowym obiekcie obliczeniowym dla odwołania do danych.

overwrite
bool
wartość domyślna: False

Wskazuje, czy zastąpić istniejące dane.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Wymagane

Magazyn danych do odwołania.

data_reference_name
str
Wymagane

Nazwa odwołania do danych.

path_on_datastore
str
Wymagane

Ścieżka względna w magazynie zapasowym dla odwołania do danych.

mode
str
Wymagane

Operacja dotycząca odwołania do danych. Obsługiwane wartości "mount" (ustawienie domyślne) i "download".

Użyj trybu pobierania, gdy skrypt oczekuje określonej ścieżki (np. zakodowanej na stałe) dla danych wejściowych. W takim przypadku określ ścieżkę za pomocą parametru path_on_compute podczas deklarowania właściwości DataReference. Usługa Azure Machine Learning pobierze dane określone przez ścieżkę przed wykonaniem skryptu.

W trybie instalacji katalog tymczasowy jest tworzony z zainstalowanymi danymi, a zmienna środowiskowa $AZUREML_DATAREFERENCE_<data_reference_name> jest ustawiana ze ścieżką do katalogu tymczasowego. Jeśli przekażesz element DataReference do listy argumentów dla kroku potoku (np. PythonScriptStep), odwołanie zostanie rozwinięte do lokalnej ścieżki danych w czasie wykonywania.

path_on_compute
str
Wymagane

Ścieżka w docelowym obiekcie obliczeniowym dla odwołania do danych.

overwrite
bool
Wymagane

Wskazuje, czy zastąpić istniejące dane.

Uwagi

Funkcja DataReference definiuje zarówno lokalizację danych, jak i sposób użycia danych w docelowym powiązaniu obliczeniowym (instalowanie lub przekazywanie). Ścieżka do danych w magazynie danych może być katalogiem głównym /, katalogiem w magazynie danych lub plikiem w magazynie danych.

Metody

as_download

Przełącz operację odwołania do danych, aby pobrać.

Pobieranie danychReference obsługuje tylko obiekty blob platformy Azure i udział plików platformy Azure. Aby pobrać dane z usług Azure Blob, Azure File Share, Azure Data Lake Gen1 i Azure Data Lake Gen2, zalecamy użycie zestawu danych usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat tworzenia i używania zestawu danych, odwiedź stronę https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Przełącz operację odwołania do danych, aby zainstalować.

Instalacja DataReference obsługuje tylko obiekt blob platformy Azure. Aby zainstalować dane w usługach Azure Blob, Azure File Share, Azure Data Lake Gen1 i Azure Data Lake Gen2, zalecamy użycie zestawu danych usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat tworzenia i używania zestawu danych, odwiedź stronę https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Przełącz operację odwołania do danych w celu przekazania.

Aby uzyskać więcej informacji o tym, które obliczenia i magazyny danych obsługują przekazywanie danych, zobacz: https://aka.ms/datastore-matrix.

create

Utwórz element DataReference przy użyciu metod DataPath i DataPathComputeBinding.

path

Utwórz wystąpienie DataReference na podstawie podanej ścieżki.

to_config

Przekonwertuj obiekt DataReference na obiekt DataReferenceConfiguration.

as_download

Przełącz operację odwołania do danych, aby pobrać.

Pobieranie danychReference obsługuje tylko obiekty blob platformy Azure i udział plików platformy Azure. Aby pobrać dane z usług Azure Blob, Azure File Share, Azure Data Lake Gen1 i Azure Data Lake Gen2, zalecamy użycie zestawu danych usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat tworzenia i używania zestawu danych, odwiedź stronę https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parametry

path_on_compute
str
wartość domyślna: None

Ścieżka do obliczeń dla odwołania do danych.

overwrite
bool
wartość domyślna: False

Wskazuje, czy zastąpić istniejące dane.

Zwraca

Nowy obiekt odwołania do danych.

Typ zwracany

as_mount

Przełącz operację odwołania do danych, aby zainstalować.

Instalacja DataReference obsługuje tylko obiekt blob platformy Azure. Aby zainstalować dane w usługach Azure Blob, Azure File Share, Azure Data Lake Gen1 i Azure Data Lake Gen2, zalecamy użycie zestawu danych usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat tworzenia i używania zestawu danych, odwiedź stronę https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Zwraca

Nowy obiekt odwołania do danych.

Typ zwracany

as_upload

Przełącz operację odwołania do danych w celu przekazania.

Aby uzyskać więcej informacji o tym, które obliczenia i magazyny danych obsługują przekazywanie danych, zobacz: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parametry

path_on_compute
str
wartość domyślna: None

Ścieżka do obliczeń dla odwołania do danych.

overwrite
bool
wartość domyślna: False

Wskazuje, czy zastąpić istniejące dane.

Zwraca

Nowy obiekt odwołania do danych.

Typ zwracany

create

Utwórz element DataReference przy użyciu metod DataPath i DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parametry

data_reference_name
str
wartość domyślna: None

Nazwa odwołania do danych do utworzenia.

datapath
DataPath
wartość domyślna: None

[Wymagane] Ścieżka danych do użycia.

datapath_compute_binding
DataPathComputeBinding
wartość domyślna: None

[Wymagane] Powiązanie obliczeniowe ścieżki danych do użycia.

Zwraca

Obiekt DataReference.

Typ zwracany

path

Utwórz wystąpienie DataReference na podstawie podanej ścieżki.

path(path=None, data_reference_name=None)

Parametry

path
str
wartość domyślna: None

Ścieżka w magazynie danych.

data_reference_name
str
wartość domyślna: None

Nazwa odwołania do danych.

Zwraca

Obiekt odwołania do danych.

Typ zwracany

to_config

Przekonwertuj obiekt DataReference na obiekt DataReferenceConfiguration.

to_config()

Zwraca

Nowy obiekt DataReferenceConfiguration.

Typ zwracany