AbstractDataset Klasa

Odwołanie

Podstawowa klasa zestawów danych w usłudze Azure Machine Learning.

Odwołaj się do TabularDatasetFactory klasy i FileDatasetFactory klasy, aby utworzyć wystąpienia zestawu danych.

Konstruktor Class AbstractDataset.

Ten konstruktor nie powinien być wywoływany bezpośrednio. Zestaw danych ma zostać utworzony przy użyciu TabularDatasetFactory klasy i FileDatasetFactory klasy.

Dziedziczenie: builtins.object

AbstractDataset

Konstruktor

AbstractDataset()

Metody

add_tags	Dodaj pary wartości klucza do słownika tagów tego zestawu danych.
as_named_input	Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.
get_all	Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.
get_by_id	Pobierz zestaw danych zapisany w obszarze roboczym.
get_by_name	Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.
get_partition_key_values	Zwraca unikatowe wartości klucza partition_keys. Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None `# get all partition key value pairs partitions = ds.get_partition_key_values() # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}] partitions = ds.get_partition_key_values(['country']) # Return [{'country': 'US'}]`
register	Zarejestruj zestaw danych w podanym obszarze roboczym.
remove_tags	Usuń określone klucze ze słownika tagów tego zestawu danych.
unregister_all_versions	Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.
update	Wykonaj aktualizację w miejscu zestawu danych.

add_tags

Dodaj pary wartości klucza do słownika tagów tego zestawu danych.

add_tags(tags=None)

Parametry

tags: dict[str, str]

Wymagane

Słownik tagów do dodania.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

Union[TabularDataset, FileDataset]

as_named_input

Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.

as_named_input(name)

Parametry

name: str

Wymagane

Nazwa zestawu danych dla przebiegu.

Zwraca

Obiekt konfiguracji opisujący sposób materializacji zestawu danych w przebiegu.

Typ zwracany

DatasetConsumptionConfig

Uwagi

Nazwa w tym miejscu będzie dotyczyć tylko w ramach przebiegu usługi Azure Machine Learning. Nazwa musi zawierać tylko znaki alfanumeryczne i podkreślenia, aby można je było udostępnić jako zmienną środowiskową. Ta nazwa służy do pobierania zestawu danych w kontekście przebiegu przy użyciu dwóch metod:

Zmienna środowiskowa:

Nazwa będzie nazwą zmiennej środowiskowej, a zmaterializowany zestaw danych zostanie udostępniony jako wartość zmiennej środowiskowej. Jeśli zestaw danych zostanie pobrany lub zainstalowany, wartość będzie ścieżką pobraną/zainstalowaną. Na przykład:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Uwaga

Jeśli zestaw danych jest ustawiony na tryb bezpośredni, wartość będzie identyfikatorem zestawu danych. Następnie możesz

pobierz obiekt zestawu danych, wykonując Dataset.get_by_id(os.environ['foo'])

Run.input_datasets:

Jest to słownik, w którym kluczem będzie nazwa zestawu danych określona w tej metodzie, a wartość będzie zmaterializowanym zestawem danych. W przypadku pobranego i zainstalowanego zestawu danych wartość będzie ścieżką pobraną/zainstalowaną. W przypadku trybu bezpośredniego wartość będzie tym samym obiektem zestawu danych określonym w skryscie przesyłania zadania.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.

static get_all(workspace)

Parametry

workspace: Workspace

Wymagane

Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestawy danych.

Zwraca

Słownik obiektów TabularDataset i FileDataset kluczy według ich nazwy rejestracji.

Typ zwracany

dict[str, Union[TabularDataset, FileDataset]]

get_by_id

Pobierz zestaw danych zapisany w obszarze roboczym.

static get_by_id(workspace, id, **kwargs)

Parametry

workspace: Workspace

Wymagane

Istniejący obszar roboczy usługi AzureML, w którym jest zapisywany zestaw danych.

id: str

Wymagane

Identyfikator zestawu danych.

Zwraca

Obiekt zestawu danych. Jeśli zestaw danych jest zarejestrowany, zostanie również zwrócona jego nazwa rejestracji i wersja.

Typ zwracany

Union[TabularDataset, FileDataset]

get_by_name

Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.

static get_by_name(workspace, name, version='latest', **kwargs)

Parametry

workspace: Workspace

Wymagane

Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestaw danych.

name: str

Wymagane

Nazwa rejestracji.

version: int

Wymagane

Wersja rejestracji. Wartość domyślna to "latest".

Zwraca

Zarejestrowany obiekt zestawu danych.

Typ zwracany

Union[TabularDataset, FileDataset]

get_partition_key_values

Zwraca unikatowe wartości klucza partition_keys.

Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]

get_partition_key_values(partition_keys=None)

Parametry

partition_keys: list[str]

Wymagane

klucze partycji

register

Zarejestruj zestaw danych w podanym obszarze roboczym.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parametry

workspace: Workspace

Wymagane

Obszar roboczy do zarejestrowania zestawu danych.

name: str

Wymagane

Nazwa rejestrowania zestawu danych za pomocą polecenia .

description: str

Wymagane

Tekstowy opis zestawu danych. Domyślnie wartość Brak.

tags: dict[str, str]

Wymagane

Słownik tagów wartości klucza, aby nadać zestaw danych. Domyślnie wartość Brak.

create_new_version: bool

Wymagane

Wartość logiczna do zarejestrowania zestawu danych jako nowej wersji pod określoną nazwą.

Zwraca

Zarejestrowany obiekt zestawu danych.

Typ zwracany

Union[TabularDataset, FileDataset]

remove_tags

Usuń określone klucze ze słownika tagów tego zestawu danych.

remove_tags(tags=None)

Parametry

tags: list[str]

Wymagane

Lista kluczy do usunięcia.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

Union[TabularDataset, FileDataset]

unregister_all_versions

Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.

unregister_all_versions()

Uwagi

Operacja nie zmienia żadnych danych źródłowych.

update

Wykonaj aktualizację w miejscu zestawu danych.

update(description=None, tags=None)

Parametry

description: str

Wymagane

Nowy opis do użycia dla zestawu danych. Ten opis zastępuje istniejący opis. Domyślnie jest to istniejący opis. Aby wyczyścić opis, wprowadź pusty ciąg.

tags: dict[str, str]

Wymagane

Słownik tagów do aktualizowania zestawu danych za pomocą polecenia . Te tagi zastępują istniejące tagi dla zestawu danych. Domyślnie do istniejących tagów. Aby wyczyścić tagi, wprowadź pusty słownik.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

Union[TabularDataset, FileDataset]

Konstruktor

Metody

add_tags

Parametry

Zwraca

Typ zwracany

as_named_input

Parametry

Zwraca

Typ zwracany

Uwagi

get_all

Parametry

Zwraca

Typ zwracany

get_by_id

Parametry

Zwraca

Typ zwracany

get_by_name

Parametry

Zwraca

Typ zwracany

get_partition_key_values

Parametry

register

Parametry

Zwraca

Typ zwracany

remove_tags

Parametry

Zwraca

Typ zwracany

unregister_all_versions

Uwagi

update

Parametry

Zwraca

Typ zwracany

Atrybuty

data_changed_time

Zwraca

Typ zwracany

Uwagi

description

Zwraca

Typ zwracany

id

Zwraca

Typ zwracany

name

Zwraca

Typ zwracany

partition_keys

Zwraca

Typ zwracany

tags

Zwraca

Typ zwracany

version

Zwraca

Typ zwracany

Opinia

Opinia

Dodatkowe zasoby