CLI (v2) Met Azure Arc ingeschakeld Kubernetes Online-implementatie YAML-schema

Artikel
11/22/2023

VAN TOEPASSING OP:Azure CLI ml-extensie v2 (huidige)

Het JSON-bronschema vindt u op https://azuremlschemas.azureedge.net/latest/kubernetesOnlineDeployment.schema.json.

Notitie

De YAML-syntaxis die in dit document wordt beschreven, is gebaseerd op het JSON-schema voor de nieuwste versie van de ML CLI v2-extensie. Deze syntaxis werkt gegarandeerd alleen met de nieuwste versie van de ML CLI v2-extensie. U vindt de schema's voor oudere extensieversies op https://azuremlschemasprod.azureedge.net/.

YAML-syntaxis

Toets	Type	Description	Toegestane waarden	Default value
`$schema`	tekenreeks	Het YAML-schema. Als u de Azure Machine Learning VS Code-extensie gebruikt om het YAML-bestand te ontwerpen, inclusief `$schema` bovenaan het bestand, kunt u schema- en resourcevoltooiingen aanroepen.
`name`	tekenreeks	Vereist. Naam van de implementatie. Hier worden naamgevingsregels gedefinieerd.
`description`	tekenreeks	Beschrijving van de implementatie.
`tags`	object	Woordenlijst met tags voor de implementatie.
`endpoint_name`	tekenreeks	Vereist. De naam van het eindpunt voor het maken van de implementatie onder.
`model`	tekenreeks of object	Het model dat moet worden gebruikt voor de implementatie. Deze waarde kan een verwijzing zijn naar een bestaand versiemodel in de werkruimte of een inline modelspecificatie. Als u naar een bestaand model wilt verwijzen, gebruikt u de `azureml:<model-name>:<model-version>` syntaxis. Als u een model inline wilt definiëren, volgt u het modelschema. Als best practice voor productiescenario's moet u het model afzonderlijk maken en hiernaar verwijzen. Dit veld is optioneel voor aangepaste containerimplementatiescenario's .
`model_mount_path`	tekenreeks	Het pad om het model te koppelen in een aangepaste container. Alleen van toepassing op aangepaste containerimplementatiescenario's . Als het `model` veld is opgegeven, wordt het gekoppeld aan dit pad in de container.
`code_configuration`	object	Configuratie voor de scorecodelogica. Dit veld is optioneel voor aangepaste containerimplementatiescenario's .
`code_configuration.code`	tekenreeks	Lokaal pad naar de broncodemap voor het scoren van het model.
`code_configuration.scoring_script`	tekenreeks	Relatief pad naar het scorebestand in de broncodemap.
`environment_variables`	object	Woordenlijst van sleutel-waardeparen van omgevingsvariabelen die moeten worden ingesteld in de implementatiecontainer. U kunt deze omgevingsvariabelen openen vanuit uw scorescripts.
`environment`	tekenreeks of object	Vereist. De omgeving die moet worden gebruikt voor de implementatie. Deze waarde kan een verwijzing zijn naar een bestaande versieomgeving in de werkruimte of een inline-omgevingsspecificatie. Als u naar een bestaande omgeving wilt verwijzen, gebruikt u de `azureml:<environment-name>:<environment-version>` syntaxis. Als u een omgeving inline wilt definiëren, volgt u het omgevingsschema. Als best practice voor productiescenario's moet u de omgeving afzonderlijk maken en hiernaar verwijzen.
`instance_type`	tekenreeks	Het exemplaartype dat wordt gebruikt om de deductieworkload te plaatsen. Als u dit weglaat, wordt de deductieworkload geplaatst op het standaardexemplarentype van het Kubernetes-cluster dat is opgegeven in het veld van `compute` het eindpunt. Indien opgegeven, wordt de deductieworkload op dat geselecteerde exemplaartype geplaatst. De set exemplaartypen voor een Kubernetes-cluster wordt geconfigureerd via de aangepaste resourcedefinitie van het Kubernetes-cluster (CRD), waardoor ze geen deel uitmaken van het YAML-schema van Azure Machine Learning voor het koppelen van Kubernetes-rekenkracht. Zie Kubernetes-exemplaartypen maken en selecteren voor meer informatie.
`instance_count`	geheel getal	Het aantal exemplaren dat moet worden gebruikt voor de implementatie. Geef de waarde op op basis van de workload die u verwacht. Dit veld is alleen vereist als u het `default` schaaltype (`scale_settings.type: default`) gebruikt. `instance_count` kan worden bijgewerkt nadat de implementatie is gemaakt met behulp van `az ml online-deployment update` de opdracht.
`app_insights_enabled`	boolean	Of u integratie wilt inschakelen met het Azure-toepassing Insights-exemplaar dat is gekoppeld aan uw werkruimte.		`false`
`scale_settings`	object	De schaalinstellingen voor de implementatie. De twee typen schaalinstellingen die worden ondersteund, zijn het `default` schaaltype en het `target_utilization` schaaltype. Met het `default` schaaltype (`scale_settings.type: default`) kunt u het aantal exemplaren handmatig omhoog en omlaag schalen nadat de implementatie is gemaakt door de eigenschap bij te `instance_count` werken. Zie TargetUtilizationScale Instellingen voor de set configureerbare eigenschappen om het `target_utilization` schaaltype (`scale_settings.type: target_utilization`) te configureren.
`scale_settings.type`	tekenreeks	Het schaaltype.	`default`, `target_utilization`	`target_utilization`
`data_collector`	object	Instellingen voor gegevensverzameling voor de implementatie. Zie DataCollector voor de set configureerbare eigenschappen.
`request_settings`	object	Scoreaanvraaginstellingen voor de implementatie. Zie Aanvraag Instellingen voor de set configureerbare eigenschappen.
`liveness_probe`	object	Instellingen voor livenesstest voor het regelmatig controleren van de status van de container. Zie Test Instellingen voor de set configureerbare eigenschappen.
`readiness_probe`	object	Instellingen voor gereedheidstests om te valideren of de container gereed is om verkeer te verwerken. Zie Test Instellingen voor de set configureerbare eigenschappen.
`resources`	object	Vereisten voor containerresources.
`resources.requests`	object	Resourceaanvragen voor de container. Zie ContainerResourceRequests voor de set configureerbare eigenschappen.
`resources.limits`	object	Resourcelimieten voor de container. Zie ContainerResourceLimits voor de set configureerbare eigenschappen.

Aanvraag Instellingen

Toets	Type	Description	Default value
`request_timeout_ms`	geheel getal	De time-out voor scoren in milliseconden.	`5000`
`max_concurrent_requests_per_instance`	geheel getal	Het maximum aantal gelijktijdige aanvragen per exemplaar dat is toegestaan voor de implementatie. Wijzig deze instelling niet van de standaardwaarde, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.	`1`
`max_queue_wait_ms`	geheel getal	De maximale tijdsduur in milliseconden van een aanvraag blijft in de wachtrij.	`500`

Test Instellingen

Toets	Type	Description	Default value
`period`	geheel getal	Hoe vaak (in seconden) de test moet worden uitgevoerd.	`10`
`initial_delay`	geheel getal	Het aantal seconden nadat de container is gestart voordat de test wordt gestart. Minimumwaarde is `1`.	`10`
`timeout`	geheel getal	Het aantal seconden waarna er een time-out optreedt voor de test. Minimumwaarde is `1`.	`2`
`success_threshold`	geheel getal	De minimale opeenvolgende successen voor de test worden beschouwd als geslaagd nadat deze is mislukt. Minimumwaarde is `1`.	`1`
`failure_threshold`	geheel getal	Wanneer een test mislukt, probeert `failure_threshold` het systeem tijden voordat het opgeeft. Als u een livenesstest opgeeft, wordt de container opnieuw opgestart. In het geval van een gereedheidstest wordt de container gemarkeerd als Ongelezen. Minimumwaarde is `1`.	`30`

TargetUtilizationScale Instellingen

Toets	Type	Description	Default value
`type`	Const	Het schaaltype	`target_utilization`
`min_instances`	geheel getal	Het minimale aantal instanties dat moet worden gebruikt.	`1`
`max_instances`	geheel getal	Het maximum aantal exemplaren dat moet worden geschaald.	`1`
`target_utilization_percentage`	geheel getal	Het CPU-doelgebruik voor de automatische schaalaanpassing.	`70`
`polling_interval`	geheel getal	Hoe vaak de automatische schaalaanpassing moet proberen om de implementatie te schalen, in seconden.	`1`

ContainerResourceRequests

Toets	Type	Omschrijving
`cpu`	tekenreeks	Het aantal CPU-kernen dat is aangevraagd voor de container.
`memory`	tekenreeks	De geheugengrootte die is aangevraagd voor de container
`nvidia.com/gpu`	tekenreeks	Het aantal Nvidia GPU-kaarten dat is aangevraagd voor de container

ContainerResourceLimits

Toets	Type	Omschrijving
`cpu`	tekenreeks	De limiet voor het aantal CPU-kernen voor de container.
`memory`	tekenreeks	De limiet voor de geheugengrootte voor de container.
`nvidia.com/gpu`	tekenreeks	De limiet voor het aantal Nvidia GPU-kaarten voor de container

DataCollector

Toets	Type	Description	Default value
`sampling_rate`	zwevend	Het percentage dat wordt weergegeven als een decimaal percentage van de gegevens die moeten worden verzameld. Een waarde van 1,0 vertegenwoordigt bijvoorbeeld het verzamelen van 100% van de gegevens.	`1.0`
`rolling_rate`	tekenreeks	De snelheid voor het partitioneren van de gegevens in de opslag. Waarde kan zijn: Minuut, Uur, Dag, Maand, Jaar.	`Hour`
`collections`	object	Set afzonderlijke `collection_name`s en hun respectieve instellingen voor deze implementatie.
`collections.<collection_name>`	object	Logische groepering van productiedeductiegegevens die moeten worden verzameld (voorbeeld: `model_inputs`). Er zijn twee gereserveerde namen: `request` en `response`, die respectievelijk overeenkomen met het verzamelen van nettoladinggegevens voor HTTP-aanvragen en antwoorden. Alle andere namen zijn willekeurig en definieerbaar door de gebruiker. Opmerking: elk `collection_name` moet overeenkomen met de naam van het `Collector` object dat in de implementatie `score.py` wordt gebruikt om de productiedeductiegegevens te verzamelen. Zie Gegevens verzamelen van modellen in productie voor meer informatie over het verzamelen van nettoladinggegevens en het verzamelen van gegevens met de meegeleverde Python SDK.
`collections.<collection_name>.enabled`	boolean	Hiermee wordt aangegeven of het verzamelen van gegevens voor de opgegeven gegevens moet worden ingeschakeld `collection_name`.	`'False''`
`collections.<collection_name>.data.name`	tekenreeks	De naam van de gegevensasset die moet worden geregistreerd bij de verzamelde gegevens.	`<endpoint>-<deployment>-<collection_name>`
`collections.<collection_name>.data.path`	tekenreeks	Het volledige Azure Machine Learning-gegevensarchiefpad waarin de verzamelde gegevens moeten worden geregistreerd als een gegevensasset.	`azureml://datastores/workspaceblobstore/paths/modelDataCollector/<endpoint_name>/<deployment_name>/<collection_name>`
`collections.<collection_name>.data.version`	geheel getal	De versie van de gegevensasset die moet worden geregistreerd bij de verzamelde gegevens in Blob Storage.	`1`

Opmerkingen

De az ml online-deployment opdrachten kunnen worden gebruikt voor het beheren van online-implementaties van Azure Machine Learning Kubernetes.

Voorbeelden

Voorbeelden zijn beschikbaar in de GitHub-voorbeeldenopslagplaats.

Volgende stappen

De CLI (v2) installeren en gebruiken

Share via