AbstractDataset Klasa

Podstawowa klasa zestawów danych w usłudze Azure Machine Learning.

Odwołaj się do TabularDatasetFactory klasy i FileDatasetFactory klasy, aby utworzyć wystąpienia zestawu danych.

Konstruktor Class AbstractDataset.

Ten konstruktor nie powinien być wywoływany bezpośrednio. Zestaw danych ma zostać utworzony przy użyciu TabularDatasetFactory klasy i FileDatasetFactory klasy.

Dziedziczenie
builtins.object
AbstractDataset

Konstruktor

AbstractDataset()

Metody

add_tags

Dodaj pary wartości klucza do słownika tagów tego zestawu danych.

as_named_input

Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.

get_all

Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.

get_by_id

Pobierz zestaw danych zapisany w obszarze roboczym.

get_by_name

Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.

get_partition_key_values

Zwraca unikatowe wartości klucza partition_keys.

Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Zarejestruj zestaw danych w podanym obszarze roboczym.

remove_tags

Usuń określone klucze ze słownika tagów tego zestawu danych.

unregister_all_versions

Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.

update

Wykonaj aktualizację w miejscu zestawu danych.

add_tags

Dodaj pary wartości klucza do słownika tagów tego zestawu danych.

add_tags(tags=None)

Parametry

tags
dict[str, str]
Wymagane

Słownik tagów do dodania.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

as_named_input

Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.

as_named_input(name)

Parametry

name
str
Wymagane

Nazwa zestawu danych dla przebiegu.

Zwraca

Obiekt konfiguracji opisujący sposób materializacji zestawu danych w przebiegu.

Typ zwracany

Uwagi

Nazwa w tym miejscu będzie dotyczyć tylko w ramach przebiegu usługi Azure Machine Learning. Nazwa musi zawierać tylko znaki alfanumeryczne i podkreślenia, aby można je było udostępnić jako zmienną środowiskową. Ta nazwa służy do pobierania zestawu danych w kontekście przebiegu przy użyciu dwóch metod:

  • Zmienna środowiskowa:

    Nazwa będzie nazwą zmiennej środowiskowej, a zmaterializowany zestaw danych zostanie udostępniony jako wartość zmiennej środowiskowej. Jeśli zestaw danych zostanie pobrany lub zainstalowany, wartość będzie ścieżką pobraną/zainstalowaną. Na przykład:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Uwaga

Jeśli zestaw danych jest ustawiony na tryb bezpośredni, wartość będzie identyfikatorem zestawu danych. Następnie możesz

pobierz obiekt zestawu danych, wykonując Dataset.get_by_id(os.environ['foo'])

  • Run.input_datasets:

    Jest to słownik, w którym kluczem będzie nazwa zestawu danych określona w tej metodzie, a wartość będzie zmaterializowanym zestawem danych. W przypadku pobranego i zainstalowanego zestawu danych wartość będzie ścieżką pobraną/zainstalowaną. W przypadku trybu bezpośredniego wartość będzie tym samym obiektem zestawu danych określonym w skryscie przesyłania zadania.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.

static get_all(workspace)

Parametry

workspace
Workspace
Wymagane

Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestawy danych.

Zwraca

Słownik obiektów TabularDataset i FileDataset kluczy według ich nazwy rejestracji.

Typ zwracany

get_by_id

Pobierz zestaw danych zapisany w obszarze roboczym.

static get_by_id(workspace, id, **kwargs)

Parametry

workspace
Workspace
Wymagane

Istniejący obszar roboczy usługi AzureML, w którym jest zapisywany zestaw danych.

id
str
Wymagane

Identyfikator zestawu danych.

Zwraca

Obiekt zestawu danych. Jeśli zestaw danych jest zarejestrowany, zostanie również zwrócona jego nazwa rejestracji i wersja.

Typ zwracany

get_by_name

Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.

static get_by_name(workspace, name, version='latest', **kwargs)

Parametry

workspace
Workspace
Wymagane

Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestaw danych.

name
str
Wymagane

Nazwa rejestracji.

version
int
Wymagane

Wersja rejestracji. Wartość domyślna to "latest".

Zwraca

Zarejestrowany obiekt zestawu danych.

Typ zwracany

get_partition_key_values

Zwraca unikatowe wartości klucza partition_keys.

Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Parametry

partition_keys
list[str]
Wymagane

klucze partycji

register

Zarejestruj zestaw danych w podanym obszarze roboczym.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parametry

workspace
Workspace
Wymagane

Obszar roboczy do zarejestrowania zestawu danych.

name
str
Wymagane

Nazwa rejestrowania zestawu danych za pomocą polecenia .

description
str
Wymagane

Tekstowy opis zestawu danych. Domyślnie wartość Brak.

tags
dict[str, str]
Wymagane

Słownik tagów wartości klucza, aby nadać zestaw danych. Domyślnie wartość Brak.

create_new_version
bool
Wymagane

Wartość logiczna do zarejestrowania zestawu danych jako nowej wersji pod określoną nazwą.

Zwraca

Zarejestrowany obiekt zestawu danych.

Typ zwracany

remove_tags

Usuń określone klucze ze słownika tagów tego zestawu danych.

remove_tags(tags=None)

Parametry

tags
list[str]
Wymagane

Lista kluczy do usunięcia.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

unregister_all_versions

Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.

unregister_all_versions()

Uwagi

Operacja nie zmienia żadnych danych źródłowych.

update

Wykonaj aktualizację w miejscu zestawu danych.

update(description=None, tags=None)

Parametry

description
str
Wymagane

Nowy opis do użycia dla zestawu danych. Ten opis zastępuje istniejący opis. Domyślnie jest to istniejący opis. Aby wyczyścić opis, wprowadź pusty ciąg.

tags
dict[str, str]
Wymagane

Słownik tagów do aktualizowania zestawu danych za pomocą polecenia . Te tagi zastępują istniejące tagi dla zestawu danych. Domyślnie do istniejących tagów. Aby wyczyścić tagi, wprowadź pusty słownik.

Zwraca

Zaktualizowany obiekt zestawu danych.

Typ zwracany

Atrybuty

data_changed_time

Zwróć czas zmiany danych źródłowych.

Zwraca

Czas, kiedy nastąpiła ostatnia zmiana danych źródłowych.

Typ zwracany

Uwagi

Czas zmiany danych jest dostępny dla źródła danych opartego na plikach. Żaden nie zostanie zwrócony, gdy źródło danych nie jest obsługiwane do sprawdzania, kiedy nastąpiła zmiana.

description

Zwróć opis rejestracji.

Zwraca

Opis zestawu danych.

Typ zwracany

str

id

Zwróć identyfikator zestawu danych.

Zwraca

Identyfikator zestawu danych. Jeśli zestaw danych nie zostanie zapisany w żadnym obszarze roboczym, identyfikator będzie mieć wartość Brak.

Typ zwracany

str

name

Zwróć nazwę rejestracji.

Zwraca

Nazwa zestawu danych.

Typ zwracany

str

partition_keys

Zwróć klucze partycji.

Zwraca

klucze partycji

Typ zwracany

tags

Zwróć tagi rejestracji.

Zwraca

Tagi zestawu danych.

Typ zwracany

str

version

Zwróć wersję rejestracji.

Zwraca

Wersja zestawu danych.

Typ zwracany

int