az ml dataset

Hinweis

Dieser Verweis ist Teil der ml-Erweiterung für die Azure CLI (Version 2.15.0 oder höher). Die Erweiterung wird beim ersten Ausführen eines Az ml-Datasetbefehls automatisch installiert. Weitere Informationen zu Erweiterungen

Verwalten von Azure ML-Datasetressourcen.

Azure ML-Datasetressourcen sind Verweise auf Dateien in Ihren Speicherdiensten oder öffentlichen URLs zusammen mit allen entsprechenden Metadaten. Sie sind keine Kopien Ihrer Daten. Sie können diese Datasetressourcen verwenden, um auf relevante Daten während der Modellschulung zuzugreifen und die referenzierten Daten in Ihr Berechnungsziel herunterzuladen oder herunterzuladen.

Befehle

az ml dataset create

Erstellen Sie eine Dataset-Ressource.

az ml dataset list

Listen von Datasetressourcen in einem Arbeitsbereich auf.

az ml dataset show

Zeigt Details für ein Dataset-Objekt an.

az ml dataset update

Aktualisieren einer Dataset-Ressource.

az ml dataset create

Erstellen Sie eine Dataset-Ressource.

Datasetressourcen können von Dateien auf Ihrem lokalen Computer oder als Verweise auf Dateien im Cloudspeicher definiert werden. Das erstellte Dataset-Objekt wird im Arbeitsbereich unter dem angegebenen Namen und der angegebenen Version nachverfolgt.

Geben Sie das Feld "local_path" in Ihrer YAML-Konfiguration an, um ein Dataset-Objekt aus datei(n) auf Ihrem lokalen Computer zu erstellen. Azure ML lädt diese Datei(n) in den Blobcontainer hoch, der den Standarddatenspeicher des Arbeitsbereichs (benannt "workspaceblobstore") zurückgibt. Die erstellte Dataset-Ressource verweist dann auf diese hochgeladenen Daten.

Um ein Dataset-Objekt zu erstellen, das auf Datei(n) im Cloudspeicher verweist, geben Sie den "Datenspeicher" an, der dem Speicherdienst und dem "Pfad" der Datei in Ihrer YAML-Konfiguration entspricht.

Sie können auch eine Dataset-Ressource direkt aus einer Speicher-URL oder einer öffentlichen URL erstellen. Geben Sie dazu die URL zum Feld "Pfad" in Ihrer YAML-Konfiguration an.

az ml dataset create --resource-group
                     --workspace-name
                     [--description]
                     [--file]
                     [--local-path]
                     [--name]
                     [--paths]
                     [--set]
                     [--tags]
                     [--version]

Beispiele

Erstellen einer Dataset-Ressource aus einer YAML-Spezifikationsdatei

az ml dataset create --file data.yml --resource-group my-resource-group --workspace-name my-workspace

Erforderliche Parameter

--resource-group -g

Name der Ressourcengruppe Sie können die Standardgruppe mit az configure --defaults group=<name> konfigurieren.

--workspace-name -w

Name des Azure ML-Arbeitsbereichs. Sie können die Standardgruppe mit az configure --defaults workspace=<name> konfigurieren.

Optionale Parameter

--description -d

Beschreibung des Datasets

--file -f

Lokaler Pfad zur YAML-Datei, die die Azure ML-Datasetspezifikation enthält.

--local-path -l

Lokaler Datei- oder Ordnerpfad zum Erstellen des Datasets.

--name -n

Name des Datasets.

--paths -p

Pfad der Daten in unterstützten URI-Formaten zum Erstellen des Datasets. Beispiele: 'folder:azureml://datastores/mydatastore/paths/path_to_data/', 'file:azureml://datastores/mydatastore/paths/path_to_data/myfile.csv'.

--set

Aktualisieren Sie ein Objekt, indem Sie einen Eigenschaftenpfad und einen wert angeben, der festgelegt werden soll. Beispiel: --set-property1.property2=.

--tags

Leergetrennte Tags für das Dataset.

--version -v

Version des Datasets.

az ml dataset list

Listen von Datasetressourcen in einem Arbeitsbereich auf.

az ml dataset list --resource-group
                   --workspace-name
                   [--max-results]
                   [--name]

Beispiele

Alle Datasetressourcen in einem Arbeitsbereich auflisten

az ml dataset list --resource-group my-resource-group --workspace-name my-workspace

Alle Dataset-Ressourcenversionen für den angegebenen Namen in einem Arbeitsbereich auflisten

az ml dataset list --name my-data --resource-group my-resource-group --workspace-name my-workspace

Listet alle Datasetressourcen in einem Arbeitsbereich mit dem Argument --query auf, um eine JMESPath-Abfrage auf den Ergebnissen von Befehlen auszuführen.

az ml dataset list --query "[].{Name:name}" --output table --resource-group my-resource-group --workspace-name my-workspace

Erforderliche Parameter

--resource-group -g

Name der Ressourcengruppe Sie können die Standardgruppe mit az configure --defaults group=<name> konfigurieren.

--workspace-name -w

Name des Azure ML-Arbeitsbereichs. Sie können die Standardgruppe mit az configure --defaults workspace=<name> konfigurieren.

Optionale Parameter

--max-results -r

Maximale Anzahl von Ergebnissen, die zurückgegeben werden sollen.

--name -n

Name der Datenressource. Falls angegeben, werden alle Datenversionen unter diesem Namen zurückgegeben.

az ml dataset show

Zeigt Details für ein Dataset-Objekt an.

az ml dataset show --name
                   --resource-group
                   --workspace-name
                   [--label]
                   [--version]

Beispiele

Details für ein Dataset-Objekt mit dem angegebenen Namen und der angegebenen Version anzeigen

az ml dataset show --name my-data --version 1 --resource-group my-resource-group --workspace-name my-workspace

Erforderliche Parameter

--name -n

Name der Datenressource.

--resource-group -g

Name der Ressourcengruppe Sie können die Standardgruppe mit az configure --defaults group=<name> konfigurieren.

--workspace-name -w

Name des Azure ML-Arbeitsbereichs. Sie können die Standardgruppe mit az configure --defaults workspace=<name> konfigurieren.

Optionale Parameter

--label -l

Bezeichnung der Datenressource.

--version -v

Version der Datenressource.

az ml dataset update

Aktualisieren einer Dataset-Ressource.

Nur die Eigenschaften "Beschreibung" und "Tags" können aktualisiert werden.

az ml dataset update --resource-group
                     --workspace-name
                     [--add]
                     [--force-string]
                     [--label]
                     [--name]
                     [--remove]
                     [--set]
                     [--version]

Erforderliche Parameter

--resource-group -g

Name der Ressourcengruppe Sie können die Standardgruppe mit az configure --defaults group=<name> konfigurieren.

--workspace-name -w

Name des Azure ML-Arbeitsbereichs. Sie können die Standardgruppe mit az configure --defaults workspace=<name> konfigurieren.

Optionale Parameter

--add

Fügen Sie einem Objekt eine Liste von Objekten hinzu, indem Sie ein Pfad- und Schlüsselwertpaar angeben. Beispiel: --add property.listProperty <key=value, string or JSON string>.

--force-string

Wenn Sie "set" oder "add" verwenden, behalten Sie Zeichenfolgen literale beibehalten, anstatt zu versuchen, in JSON zu konvertieren.

--label -l

Bezeichnung der Datenressource.

--name -n

Name der Datenressource.

--remove

Entfernen Sie eine Eigenschaft oder ein Element aus einer Liste. Beispiel: --remove property.list OR --remove propertyToRemove.

--set

Aktualisieren Sie ein Objekt, indem Sie einen Eigenschaftenpfad und einen wert angeben, der festgelegt werden soll. Beispiel: --set-property1.property2=.

--version -v

Version der Datenressource.