az ml endpoint realtime

Hinweis

Dieser Verweis ist Teil der Azure-cli-ml-Erweiterung für die Azure CLI (Version 2.0.28 oder höher). Die Erweiterung wird automatisch installiert, wenn Sie einen az ml-Endpunkt-Echtzeitbefehl ausführen. Weitere Informationen zu Erweiterungen

Verwalten von operationalisierten Echtzeitendpunkten.

Befehle

az ml endpoint realtime create-version

Erstellen Sie eine Version für den Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime delete

Löschen Sie einen Echtzeitendpunkt und seine Version aus dem Arbeitsbereich.

az ml endpoint realtime delete-version

Löschen sie eine Version für den Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime get-access-token

Rufen Sie ein Token ab, um Anforderungen an einen Echtzeitendpunkt auszulegen.

az ml endpoint realtime get-keys

Rufen Sie Schlüssel zum Ausgeben von Anforderungen für einen Echtzeitendpunkt ab.

az ml endpoint realtime get-logs

Abrufen von Protokollen für einen Echtzeitendpunkt.

az ml endpoint realtime list

Auflisten von Echtzeitendpunkten im Arbeitsbereich.

az ml endpoint realtime regen-key

Generieren Sie Schlüssel für einen Echtzeitendpunkt neu.

az ml endpoint realtime run

Führen Sie einen Echtzeitendpunkt im Arbeitsbereich aus.

az ml endpoint realtime show

Details für einen Echtzeitendpunkt im Arbeitsbereich anzeigen.

az ml endpoint realtime update

Aktualisieren eines Echtzeitendpunkts im Arbeitsbereich.

az ml endpoint realtime update-version

Aktualisieren einer Version für den Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime create-version

Erstellen Sie eine Version für Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime create-version --name
                                       --version-name
                                       [--add-property]
                                       [--add-tag]
                                       [--ar]
                                       [--as]
                                       [--at]
                                       [--autoscale-max-replicas]
                                       [--autoscale-min-replicas]
                                       [--cc]
                                       [--ccl]
                                       [--cf]
                                       [--collect-model-data]
                                       [--cvt]
                                       [--dc]
                                       [--description]
                                       [--ed]
                                       [--entry-script]
                                       [--environment-name]
                                       [--environment-version]
                                       [--failure-threshold]
                                       [--gb]
                                       [--gbl]
                                       [--gc]
                                       [--ic]
                                       [--id]
                                       [--is-default]
                                       [--max-request-wait-time]
                                       [--model]
                                       [--model-metadata-file]
                                       [--no-wait]
                                       [--nr]
                                       [--path]
                                       [--period-seconds]
                                       [--replica-max-concurrent-requests]
                                       [--resource-group]
                                       [--scoring-timeout-ms]
                                       [--sd]
                                       [--st]
                                       [--subscription-id]
                                       [--timeout-seconds]
                                       [--tp]
                                       [--workspace-name]
                                       [-v]

Erforderliche Parameter

--name -n

Der Endpunktname.

--version-name --vn

Der Versionsname, der in einem Endpunkt erstellt werden soll.

Optionale Parameter

--add-property

Key/Value-Eigenschaft, die hinzugefügt werden soll (z. B..key=wert). Mehrere Eigenschaften können mit mehreren --add-property-Optionen angegeben werden.

--add-tag

Schlüssel-/Werttag, das hinzugefügt werden soll (z. B..key=Wert). Mehrere Tags können mit mehreren --add-tag-Optionen angegeben werden.

--ar --autoscale-refresh-seconds

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

--as --autoscale-enabled

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ ist.

--at --autoscale-target-utilization

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

--autoscale-max-replicas --ma

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10.

--autoscale-min-replicas --mi

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

--cc --cpu-cores

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Dabei kann es sich um eine Dezimalzahl handeln. Der Standardwert ist 0,1.

--ccl --cpu-cores-limit

Maximale Anzahl der CPU-Kerne, die dieser Webdienst verwenden darf. Kann eine Dezimalzahl sein.

--cf --conda-file

Pfad zur lokalen Datei, die eine für das Image zu verwendende Conda-Umgebungsdefinition enthält.

--collect-model-data --md

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

--cvt --is-control-version-type

Gibt an, ob dies die Steuerelementversion in einem Endpunkt ist. Der Standardwert lautet „False“.

--dc --deploy-config-file

Pfad zu einer JSON-Datei, die Bereitstellungsmetadaten enthält.

--description -d

Beschreibung des Diensts

--ed --environment-directory

Verzeichnis für Azure Machine Learning Environment für die Bereitstellung. Es ist derselbe Verzeichnispfad wie im Befehl "az ml environment scaffold" angegeben.

--entry-script --es

Pfad zur lokalen Datei, die den Code enthält, der für den Dienst ausgeführt werden soll (relativer Pfad von source_directory, wenn eine bereitgestellt wird).

--environment-name -e

Name der Azure Machine Learning-Umgebung für die Bereitstellung.

--environment-version --ev

Version einer vorhandenen Azure Machine Learning-Umgebung für die Bereitstellung.

--failure-threshold --ft

Wenn ein Pod startet und die Liveness-Sonde fehlschlägt, versucht Kubernetes vor dem Aufgeben --fehler-Schwellenwerte. Der Standardwert ist 3. Der Mindestwert ist 1.

--gb --memory-gb

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein.

--gbl --memory-gb-limit

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

--gc --gpu-cores

Die Anzahl der gpu-Kerne, die für diesen Webdienst zugewiesen werden sollen. Der Standardwert ist 1.

--ic --inference-config-file

Pfad zu einer JSON- oder YAML-Datei, die die Schlussfolgerungskonfiguration enthält.

--id --initial-delay-seconds

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.

--is-default

Gibt an, ob dies die Standardversion in einem Endpunkt ist. Der Standardwert lautet „False“.

--max-request-wait-time --mr

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

--model -m

Die ID des zu bereitstellenden Modells. Mehrere Modelle können mit zusätzlichen -m-Argumenten angegeben werden. Modelle müssen zuerst registriert werden.

--model-metadata-file -f

Pfad zu einer JSON-Datei, die Modellregistrierungsmetadaten enthält. Mehrere Modelle können mit mehreren -f-Parametern bereitgestellt werden.

--no-wait

Flag to not wait for asynchron calls.

--nr --num-replicas

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--period-seconds --ps

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

--replica-max-concurrent-requests --rm

Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten, die für diesen Webdienst zulässig sind. Der Standardwert lautet 1.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--scoring-timeout-ms --tm

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

--sd --source-directory

Pfad zu Ordnern, die alle Dateien zum Erstellen des Images enthalten.

--st --success-threshold

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.

--subscription-id

Gibt die Abonnement-ID an.

--timeout-seconds --ts

Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

--tp --traffic-percentile

Der Datenverkehr perzentrieren diese Version in Endpoint.

--workspace-name -w

Name des Arbeitsbereichs, der den Dienst enthält, der aktualisiert werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime delete

Löschen Sie einen Echtzeitendpunkt und seine Version aus dem Arbeitsbereich.

az ml endpoint realtime delete --name
                               [--path]
                               [--resource-group]
                               [--subscription-id]
                               [--workspace-name]
                               [-v]

Erforderliche Parameter

--name -n

Der zu löschende Endpunktname.

Optionale Parameter

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der gelöscht werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime delete-version

Löschen Sie eine Version für Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime delete-version --name
                                       --version-name
                                       [--no-wait]
                                       [--path]
                                       [--resource-group]
                                       [--subscription-id]
                                       [--workspace-name]
                                       [-v]

Erforderliche Parameter

--name -n

Der Endpunktname.

--version-name --vn

Der zu löschende Versionsname.

Optionale Parameter

--no-wait

Kennzeichnen, um nicht auf asynchrone Anrufe zu warten.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der gelöscht werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime get-access-token

Rufen Sie ein Token ab, um Anforderungen an einen Echtzeitendpunkt zu beheben.

az ml endpoint realtime get-access-token --name
                                         [--path]
                                         [--resource-group]
                                         [--subscription-id]
                                         [--workspace-name]
                                         [-v]

Erforderliche Parameter

--name -n

Endpunktname.

Optionale Parameter

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der angezeigt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime get-keys

Abrufen von Schlüsseln zum Problem von Anforderungen gegen einen Echtzeitendpunkt.

az ml endpoint realtime get-keys --name
                                 [--path]
                                 [--resource-group]
                                 [--subscription-id]
                                 [--workspace-name]
                                 [-v]

Erforderliche Parameter

--name -n

Endpunktname.

Optionale Parameter

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der angezeigt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime get-logs

Abrufen von Protokollen für einen Echtzeitendpunkt.

az ml endpoint realtime get-logs --name
                                 [--init]
                                 [--num_lines]
                                 [--path]
                                 [--resource-group]
                                 [--subscription-id]
                                 [--workspace-name]
                                 [-v]

Erforderliche Parameter

--name -n

Endpunktname.

Optionale Parameter

--init -i

Abrufen von Protokollen des Initcontainers anstelle des Bewertungscontainers.

--num_lines -l

Anzahl der Protokolllinien, die von tail zurückgegeben werden sollen (Standard ist 5000).

Standardwert: 5000
--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der angezeigt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime list

Listet Echtzeitendpunkte im Arbeitsbereich auf.

az ml endpoint realtime list [--compute-type]
                             [--model-id]
                             [--model-name]
                             [--path]
                             [--property]
                             [--resource-group]
                             [--subscription-id]
                             [--tag]
                             [--workspace-name]
                             [-v]

Optionale Parameter

--compute-type -c

Wenn angegeben, werden nur Dienste angezeigt, die den angegebenen Berechnungstyp haben. (Optionen sind "ACI", "AKS", "AKSENDPOINT").

--model-id

Wenn angegeben, werden nur Dienste angezeigt, die über die angegebene Modell-ID verfügen.

--model-name

Wenn angegeben, werden nur Dienste angezeigt, die den angegebenen Modellnamen haben.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--property

Wenn angegeben, wird basierend auf dem bereitgestellten Schlüssel/Wert (z. B..key oder key=wert) gefiltert. Mehrere Eigenschaften können mit mehreren --Eigenschaftsoptionen angegeben werden.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--tag

Wenn angegeben, wird basierend auf dem bereitgestellten Schlüssel/Wert (z. B..key oder key=wert) gefiltert. Mehrere Tags können mit mehreren -Tag-Optionen angegeben werden.

--workspace-name -w

Name des Arbeitsbereichs, der die Endpunkte enthält, auflisten.

-v

Verbosity-Flag.

az ml endpoint realtime regen-key

Generieren Sie Schlüssel für einen Echtzeitendpunkt.

az ml endpoint realtime regen-key --key
                                  --name
                                  [--path]
                                  [--resource-group]
                                  [--set-key]
                                  [--subscription-id]
                                  [--workspace-name]
                                  [-v]

Erforderliche Parameter

--key -k

Welcher Schlüssel zur Regeneriert werden soll, wenn regen angegeben wird. Optionen: Primär, Sekundär.

--name -n

Endpunktname.

Optionale Parameter

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--set-key -s

Geben Sie den Auth-Wert für den angegebenen Schlüssel an.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der angezeigt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime run

Führen Sie einen Echtzeitendpunkt im Arbeitsbereich aus.

az ml endpoint realtime run --name
                            [--input-data]
                            [--path]
                            [--resource-group]
                            [--subscription-id]
                            [--workspace-name]
                            [-v]

Erforderliche Parameter

--name -n

Der Endpunktname, mit dem er bewertet werden soll.

Optionale Parameter

--input-data -d

Die daten, die zum Aufrufen des Endpunkts verwendet werden sollen.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der ausgeführt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime show

Details für einen Echtzeitendpunkt im Arbeitsbereich anzeigen.

az ml endpoint realtime show --name
                             [--path]
                             [--resource-group]
                             [--subscription-id]
                             [--workspace-name]
                             [-v]

Erforderliche Parameter

--name -n

Name des Endpunkts, der angezeigt werden soll.

Optionale Parameter

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der angezeigt werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime update

Aktualisieren eines Echtzeitendpunkts im Arbeitsbereich.

az ml endpoint realtime update --name
                               [--add-property]
                               [--add-tag]
                               [--ae]
                               [--ai]
                               [--description]
                               [--no-wait]
                               [--path]
                               [--remove-tag]
                               [--resource-group]
                               [--subscription-id]
                               [--token-auth-enabled]
                               [--workspace-name]
                               [-v]

Erforderliche Parameter

--name -n

Der Endpunktname, der aktualisiert werden soll.

Optionale Parameter

--add-property

Key/Value-Eigenschaft, die hinzugefügt werden soll (z. B..key=Wert). Mehrere Eigenschaften können mit mehreren --add-property-Optionen angegeben werden.

--add-tag

Schlüssel-/Werttag zum Hinzufügen (z. B..key=Wert). Mehrere Tags können mit mehreren Add-Tag-Optionen angegeben werden.

--ae --auth-enabled

Unabhängig davon, ob die Schlüsselauth für diesen Endpunkt aktiviert werden soll. Der Standardwert lautet „False“.

--ai --enable-app-insights

Unabhängig davon, ob AppInsights für diesen Endpunkt aktiviert werden soll. Der Standardwert lautet „False“.

--description -d

Eine Beschreibung des Endpunkts

--no-wait

Kennzeichnen, um nicht auf asynchrone Anrufe zu warten.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--remove-tag

Schlüssel des zu entfernenden Tags. Mehrere Tags können mit mehreren --remove-tag-Optionen angegeben werden.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--subscription-id

Gibt die Abonnement-ID an.

--token-auth-enabled

Ob Tokenauth für diesen Endpunkt aktiviert werden soll oder nicht. Der Standardwert lautet „False“.

--workspace-name -w

Name des Arbeitsbereichs, der den Endpunkt enthält, der aktualisiert werden soll.

-v

Verbosity-Flag.

az ml endpoint realtime update-version

Aktualisieren einer Version für Echtzeitendpunkt im Arbeitsbereich.

az ml endpoint realtime update-version --name
                                       --version-name
                                       [--add-property]
                                       [--add-tag]
                                       [--ar]
                                       [--as]
                                       [--at]
                                       [--autoscale-max-replicas]
                                       [--autoscale-min-replicas]
                                       [--cc]
                                       [--ccl]
                                       [--cf]
                                       [--collect-model-data]
                                       [--cvt]
                                       [--dc]
                                       [--description]
                                       [--ed]
                                       [--entry-script]
                                       [--environment-name]
                                       [--environment-version]
                                       [--failure-threshold]
                                       [--gb]
                                       [--gbl]
                                       [--gc]
                                       [--ic]
                                       [--id]
                                       [--is-default]
                                       [--max-request-wait-time]
                                       [--model]
                                       [--model-metadata-file]
                                       [--no-wait]
                                       [--nr]
                                       [--path]
                                       [--period-seconds]
                                       [--replica-max-concurrent-requests]
                                       [--resource-group]
                                       [--scoring-timeout-ms]
                                       [--sd]
                                       [--st]
                                       [--subscription-id]
                                       [--timeout-seconds]
                                       [--tp]
                                       [--workspace-name]
                                       [-v]

Erforderliche Parameter

--name -n

Der Endpunktname.

--version-name --vn

Der Versionsname, der in einem Endpunkt erstellt werden soll.

Optionale Parameter

--add-property

Key/Value-Eigenschaft, die hinzugefügt werden soll (z. B..key=Wert). Mehrere Eigenschaften können mit mehreren --add-property-Optionen angegeben werden.

--add-tag

Schlüssel-/Werttag zum Hinzufügen (z. B..key=Wert). Mehrere Tags können mit mehreren Add-Tag-Optionen angegeben werden.

--ar --autoscale-refresh-seconds

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

--as --autoscale-enabled

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ ist.

--at --autoscale-target-utilization

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

--autoscale-max-replicas --ma

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10.

--autoscale-min-replicas --mi

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

--cc --cpu-cores

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Dabei kann es sich um eine Dezimalzahl handeln. Der Standardwert ist 0,1.

--ccl --cpu-cores-limit

Maximale Anzahl der CPU-Kerne, die dieser Webdienst verwenden darf. Kann eine Dezimalzahl sein.

--cf --conda-file

Pfad zur lokalen Datei, die eine für das Image zu verwendende Conda-Umgebungsdefinition enthält.

--collect-model-data --md

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

--cvt --is-control-version-type

Unabhängig davon, ob dies die Steuerelementversion in einem Endpunkt ist. Der Standardwert lautet „False“.

--dc --deploy-config-file

Pfad zu einer JSON-Datei mit Bereitstellungsmetadaten.

--description -d

Beschreibung des Diensts

--ed --environment-directory

Verzeichnis für Azure Machine Learning Environment für die Bereitstellung. Es ist der gleiche Verzeichnispfad wie im Befehl "az ml environment scaffold" angegeben.

--entry-script --es

Pfad zu lokaler Datei, die den Code enthält, der für den Dienst ausgeführt werden soll (relativer Pfad von source_directory, wenn eine bereitgestellt wird).

--environment-name -e

Name der Azure Machine Learning-Umgebung für die Bereitstellung.

--environment-version --ev

Version einer vorhandenen Azure Machine Learning-Umgebung für die Bereitstellung.

--failure-threshold --ft

Wenn ein Pod gestartet wird und der Liveness-Prüfpunkt fehlschlägt, versucht Kubernetes vor dem Aufgeben --Fehler-Schwellenwerte. Der Standardwert ist 3. Der Mindestwert ist 1.

--gb --memory-gb

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein.

--gbl --memory-gb-limit

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

--gc --gpu-cores

Die Anzahl der GPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Der Standardwert ist 1.

--ic --inference-config-file

Pfad zu einer JSON- oder YAML-Datei, die eine Inferencekonfiguration enthält.

--id --initial-delay-seconds

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.

--is-default

Ob dies die Standardversion in einem Endpunkt ist. Der Standardwert lautet „False“.

--max-request-wait-time --mr

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

--model -m

Die ID des zu bereitstellenden Modells. Mehrere Modelle können mit zusätzlichen -m-Argumenten angegeben werden. Modelle müssen zuerst registriert werden.

--model-metadata-file -f

Pfad zu einer JSON-Datei mit Modellregistrierungsmetadaten. Mehrere Modelle können mithilfe mehrerer -f-Parameter bereitgestellt werden.

--no-wait

Kennzeichnen, um nicht auf asynchrone Anrufe zu warten.

--nr --num-replicas

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

--path

Pfad zu einem Projektordner. Standard: aktuelles Verzeichnis.

--period-seconds --ps

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

--replica-max-concurrent-requests --rm

Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten, die für diesen Webdienst zulässig sind. Der Standardwert lautet 1.

--resource-group -g

Ressourcengruppe, die dem bereitgestellten Arbeitsbereich entspricht.

--scoring-timeout-ms --tm

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

--sd --source-directory

Pfad zu Ordnern, die alle Dateien zum Erstellen des Images enthalten.

--st --success-threshold

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.

--subscription-id

Gibt die Abonnement-ID an.

--timeout-seconds --ts

Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

--tp --traffic-percentile

Der Datenverkehr perzentrieren diese Version in Endpoint.

--workspace-name -w

Name des Arbeitsbereichs, der den Dienst enthält, der aktualisiert werden soll.

-v

Verbosity-Flag.