AbstractDataset Klasa
Podstawowa klasa zestawów danych w usłudze Azure Machine Learning.
Odwołaj się do TabularDatasetFactory klasy i FileDatasetFactory klasy, aby utworzyć wystąpienia zestawu danych.
Konstruktor Class AbstractDataset.
Ten konstruktor nie powinien być wywoływany bezpośrednio. Zestaw danych ma zostać utworzony przy użyciu TabularDatasetFactory klasy i FileDatasetFactory klasy.
- Dziedziczenie
-
builtins.objectAbstractDataset
Konstruktor
AbstractDataset()
Metody
add_tags |
Dodaj pary wartości klucza do słownika tagów tego zestawu danych. |
as_named_input |
Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu. |
get_all |
Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym. |
get_by_id |
Pobierz zestaw danych zapisany w obszarze roboczym. |
get_by_name |
Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji. |
get_partition_key_values |
Zwraca unikatowe wartości klucza partition_keys. Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None
|
register |
Zarejestruj zestaw danych w podanym obszarze roboczym. |
remove_tags |
Usuń określone klucze ze słownika tagów tego zestawu danych. |
unregister_all_versions |
Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego. |
update |
Wykonaj aktualizację w miejscu zestawu danych. |
add_tags
Dodaj pary wartości klucza do słownika tagów tego zestawu danych.
add_tags(tags=None)
Parametry
Zwraca
Zaktualizowany obiekt zestawu danych.
Typ zwracany
as_named_input
Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.
as_named_input(name)
Parametry
Zwraca
Obiekt konfiguracji opisujący sposób materializacji zestawu danych w przebiegu.
Typ zwracany
Uwagi
Nazwa w tym miejscu będzie dotyczyć tylko w ramach przebiegu usługi Azure Machine Learning. Nazwa musi zawierać tylko znaki alfanumeryczne i podkreślenia, aby można je było udostępnić jako zmienną środowiskową. Ta nazwa służy do pobierania zestawu danych w kontekście przebiegu przy użyciu dwóch metod:
Zmienna środowiskowa:
Nazwa będzie nazwą zmiennej środowiskowej, a zmaterializowany zestaw danych zostanie udostępniony jako wartość zmiennej środowiskowej. Jeśli zestaw danych zostanie pobrany lub zainstalowany, wartość będzie ścieżką pobraną/zainstalowaną. Na przykład:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Uwaga
Jeśli zestaw danych jest ustawiony na tryb bezpośredni, wartość będzie identyfikatorem zestawu danych. Następnie możesz
pobierz obiekt zestawu danych, wykonując Dataset.get_by_id(os.environ['foo'])
Run.input_datasets:
Jest to słownik, w którym kluczem będzie nazwa zestawu danych określona w tej metodzie, a wartość będzie zmaterializowanym zestawem danych. W przypadku pobranego i zainstalowanego zestawu danych wartość będzie ścieżką pobraną/zainstalowaną. W przypadku trybu bezpośredniego wartość będzie tym samym obiektem zestawu danych określonym w skryscie przesyłania zadania.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.
static get_all(workspace)
Parametry
- workspace
- Workspace
Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestawy danych.
Zwraca
Słownik obiektów TabularDataset i FileDataset kluczy według ich nazwy rejestracji.
Typ zwracany
get_by_id
Pobierz zestaw danych zapisany w obszarze roboczym.
static get_by_id(workspace, id, **kwargs)
Parametry
- workspace
- Workspace
Istniejący obszar roboczy usługi AzureML, w którym jest zapisywany zestaw danych.
Zwraca
Obiekt zestawu danych. Jeśli zestaw danych jest zarejestrowany, zostanie również zwrócona jego nazwa rejestracji i wersja.
Typ zwracany
get_by_name
Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.
static get_by_name(workspace, name, version='latest', **kwargs)
Parametry
- workspace
- Workspace
Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestaw danych.
Zwraca
Zarejestrowany obiekt zestawu danych.
Typ zwracany
get_partition_key_values
Zwraca unikatowe wartości klucza partition_keys.
Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parametry
register
Zarejestruj zestaw danych w podanym obszarze roboczym.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parametry
Słownik tagów wartości klucza, aby nadać zestaw danych. Domyślnie wartość Brak.
- create_new_version
- bool
Wartość logiczna do zarejestrowania zestawu danych jako nowej wersji pod określoną nazwą.
Zwraca
Zarejestrowany obiekt zestawu danych.
Typ zwracany
remove_tags
Usuń określone klucze ze słownika tagów tego zestawu danych.
remove_tags(tags=None)
Parametry
Zwraca
Zaktualizowany obiekt zestawu danych.
Typ zwracany
unregister_all_versions
Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.
unregister_all_versions()
Uwagi
Operacja nie zmienia żadnych danych źródłowych.
update
Wykonaj aktualizację w miejscu zestawu danych.
update(description=None, tags=None)
Parametry
- description
- str
Nowy opis do użycia dla zestawu danych. Ten opis zastępuje istniejący opis. Domyślnie jest to istniejący opis. Aby wyczyścić opis, wprowadź pusty ciąg.
Słownik tagów do aktualizowania zestawu danych za pomocą polecenia . Te tagi zastępują istniejące tagi dla zestawu danych. Domyślnie do istniejących tagów. Aby wyczyścić tagi, wprowadź pusty słownik.
Zwraca
Zaktualizowany obiekt zestawu danych.
Typ zwracany
Atrybuty
data_changed_time
Zwróć czas zmiany danych źródłowych.
Zwraca
Czas, kiedy nastąpiła ostatnia zmiana danych źródłowych.
Typ zwracany
Uwagi
Czas zmiany danych jest dostępny dla źródła danych opartego na plikach. Żaden nie zostanie zwrócony, gdy źródło danych nie jest obsługiwane do sprawdzania, kiedy nastąpiła zmiana.
description
id
Zwróć identyfikator zestawu danych.
Zwraca
Identyfikator zestawu danych. Jeśli zestaw danych nie zostanie zapisany w żadnym obszarze roboczym, identyfikator będzie mieć wartość Brak.
Typ zwracany
name
partition_keys
tags
version
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla