Online Deployments - List
Répertorier les déploiements de points de terminaison d’inférence.
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2023-10-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2023-10-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Nom du point de terminaison d’inférence. |
resource
|
path | True |
string |
Nom du groupe de ressources. Le nom ne respecte pas la casse. |
subscription
|
path | True |
string |
ID de l’abonnement cible. |
workspace
|
path | True |
string |
Nom de l’espace de travail Azure Machine Learning. Regex pattern: |
api-version
|
query | True |
string |
Version de l’API à utiliser pour cette opération. |
$order
|
query |
string |
Classement de la liste. |
|
$skip
|
query |
string |
Jeton de continuation pour la pagination. |
|
$top
|
query |
integer int32 |
En haut de la liste. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
Succès |
|
Other Status Codes |
Error |
Exemples
List Online Deployments.
Sample Request
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2023-10-01&$orderBy=string&$top=1
Sample Response
{
"value": [
{
"id": "string",
"name": "string",
"type": "string",
"properties": {
"description": "string",
"properties": {
"string": "string"
},
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"scaleSettings": {
"scaleType": "Default"
},
"requestSettings": {
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M",
"maxConcurrentRequestsPerInstance": 1
},
"modelMountPath": "string",
"appInsightsEnabled": false,
"livenessProbe": {
"failureThreshold": 1,
"successThreshold": 1,
"timeout": "PT5M",
"period": "PT5M",
"initialDelay": "PT5M"
},
"provisioningState": "Creating",
"instanceType": "string",
"model": "string",
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceRequests": {
"cpu": "\"1\"",
"memory": "\"2Gi\"",
"gpu": "\"1\""
},
"containerResourceLimits": {
"cpu": "\"1\"",
"memory": "\"2Gi\"",
"gpu": "\"1\""
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {},
"location": "string",
"kind": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"principalId": "00000000-1111-2222-3333-444444444444",
"clientId": "00000000-1111-2222-3333-444444444444"
}
}
},
"sku": {
"name": "string",
"tier": "Free",
"size": "string",
"family": "string",
"capacity": 1
}
}
],
"nextLink": "string"
}
Définitions
Nom | Description |
---|---|
Code |
Configuration d’une ressource de code de scoring. |
Container |
Les ressources requises pour chaque conteneur instance au sein d’un déploiement en ligne. |
Container |
|
created |
Type d’identité qui a créé la ressource. |
Default |
|
Deployment |
Valeurs possibles pour DeploymentProvisioningState. |
Egress |
Énumérez pour déterminer si PublicNetworkAccess est activé ou désactivé pour la sortie d’un déploiement. |
Endpoint |
Enum pour déterminer le type de calcul du point de terminaison. |
Error |
Informations supplémentaires sur l’erreur de gestion des ressources. |
Error |
Détail de l’erreur. |
Error |
Réponse d’erreur |
Kubernetes |
Propriétés spécifiques à un KubernetesOnlineDeployment. |
Managed |
Propriétés spécifiques à un ManagedOnlineDeployment. |
Managed |
Identité de service managée (identités affectées par le système et/ou par l’utilisateur) |
Managed |
Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). |
Online |
|
Online |
Liste paginée des entités OnlineDeployment. |
Online |
Configuration des demandes de scoring de déploiement en ligne. |
Probe |
Configuration de la sonde liveness/readiness du conteneur de déploiement. |
Scale |
|
Sku |
Définition du modèle de ressource représentant la référence SKU |
Sku |
Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. |
system |
Métadonnées relatives à la création et à la dernière modification de la ressource. |
Target |
|
User |
Propriétés de l’identité affectée par l’utilisateur |
CodeConfiguration
Configuration d’une ressource de code de scoring.
Nom | Type | Description |
---|---|---|
codeId |
string |
ID de ressource ARM de la ressource de code. |
scoringScript |
string |
[Obligatoire] Script à exécuter au démarrage. par exemple « score.py » |
ContainerResourceRequirements
Les ressources requises pour chaque conteneur instance au sein d’un déploiement en ligne.
Nom | Type | Description |
---|---|---|
containerResourceLimits |
Informations sur la limite des ressources de conteneur : |
|
containerResourceRequests |
Informations sur la demande de ressource de conteneur : |
ContainerResourceSettings
Nom | Type | Description |
---|---|---|
cpu |
string |
Nombre de demandes/limite de processeurs virtuels pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
gpu |
string |
Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
memory |
string |
Demande/limite de taille de mémoire pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
Type d’identité qui a créé la ressource.
Nom | Type | Description |
---|---|---|
Application |
string |
|
Key |
string |
|
ManagedIdentity |
string |
|
User |
string |
DefaultScaleSettings
Nom | Type | Description |
---|---|---|
scaleType |
string:
Default |
[Obligatoire] Type d’algorithme de mise à l’échelle de déploiement |
DeploymentProvisioningState
Valeurs possibles pour DeploymentProvisioningState.
Nom | Type | Description |
---|---|---|
Canceled |
string |
|
Creating |
string |
|
Deleting |
string |
|
Failed |
string |
|
Scaling |
string |
|
Succeeded |
string |
|
Updating |
string |
EgressPublicNetworkAccessType
Énumérez pour déterminer si PublicNetworkAccess est activé ou désactivé pour la sortie d’un déploiement.
Nom | Type | Description |
---|---|---|
Disabled |
string |
|
Enabled |
string |
EndpointComputeType
Enum pour déterminer le type de calcul du point de terminaison.
Nom | Type | Description |
---|---|---|
AzureMLCompute |
string |
|
Kubernetes |
string |
|
Managed |
string |
ErrorAdditionalInfo
Informations supplémentaires sur l’erreur de gestion des ressources.
Nom | Type | Description |
---|---|---|
info |
object |
Informations supplémentaires |
type |
string |
Type d’informations supplémentaires. |
ErrorDetail
Détail de l’erreur.
Nom | Type | Description |
---|---|---|
additionalInfo |
Informations supplémentaires sur l’erreur. |
|
code |
string |
Code d'erreur. |
details |
Détails de l’erreur. |
|
message |
string |
Message d’erreur. |
target |
string |
Cible d’erreur. |
ErrorResponse
Réponse d’erreur
Nom | Type | Description |
---|---|---|
error |
Objet error. |
KubernetesOnlineDeployment
Propriétés spécifiques à un KubernetesOnlineDeployment.
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
appInsightsEnabled |
boolean |
False |
Si la valeur est true, active la journalisation Application Insights. |
codeConfiguration |
Configuration du code pour le déploiement du point de terminaison. |
||
containerResourceRequirements |
Exigences en ressources pour le conteneur (processeur et mémoire). |
||
description |
string |
Description du déploiement du point de terminaison. |
|
egressPublicNetworkAccess | Enabled |
Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : Activé. |
|
endpointComputeType |
string:
Kubernetes |
[Obligatoire] Type de calcul du point de terminaison. |
|
environmentId |
string |
ID de ressource ARM ou AssetId de la spécification de l’environnement pour le déploiement du point de terminaison. |
|
environmentVariables |
object |
Configuration des variables d’environnement pour le déploiement. |
|
instanceType |
string |
Type de instance de calcul. |
|
livenessProbe |
La probe liveness supervise régulièrement l’intégrité du conteneur. |
||
model |
string |
Chemin d’uri du modèle. |
|
modelMountPath |
string |
Chemin d’accès pour monter le modèle dans un conteneur personnalisé. |
|
properties |
object |
Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. |
|
provisioningState |
État d’approvisionnement pour le déploiement du point de terminaison. |
||
readinessProbe |
La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness. |
||
requestSettings |
Paramètres de demande pour le déploiement. |
||
scaleSettings | OnlineScaleSettings: |
Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et sur DefaultScaleSettings pour ManagedOnlineDeployment. |
ManagedOnlineDeployment
Propriétés spécifiques à un ManagedOnlineDeployment.
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
appInsightsEnabled |
boolean |
False |
Si la valeur est true, active la journalisation Application Insights. |
codeConfiguration |
Configuration du code pour le déploiement du point de terminaison. |
||
description |
string |
Description du déploiement du point de terminaison. |
|
egressPublicNetworkAccess | Enabled |
Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : Activé. |
|
endpointComputeType |
string:
Managed |
[Obligatoire] Type de calcul du point de terminaison. |
|
environmentId |
string |
ID de ressource ARM ou AssetId de la spécification d’environnement pour le déploiement du point de terminaison. |
|
environmentVariables |
object |
Configuration des variables d’environnement pour le déploiement. |
|
instanceType |
string |
Type de instance de calcul. |
|
livenessProbe |
La probe liveness supervise régulièrement l’intégrité du conteneur. |
||
model |
string |
Chemin d’uri du modèle. |
|
modelMountPath |
string |
Chemin d’accès pour monter le modèle dans un conteneur personnalisé. |
|
properties |
object |
Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. |
|
provisioningState |
État d’approvisionnement pour le déploiement du point de terminaison. |
||
readinessProbe |
La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness. |
||
requestSettings |
Paramètres de demande pour le déploiement. |
||
scaleSettings | OnlineScaleSettings: |
Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et sur DefaultScaleSettings pour ManagedOnlineDeployment. |
ManagedServiceIdentity
Identité de service managée (identités affectées par le système et/ou par l’utilisateur)
Nom | Type | Description |
---|---|---|
principalId |
string |
ID de principal de service de l’identité affectée par le système. Cette propriété est fournie uniquement pour une identité affectée par le système. |
tenantId |
string |
ID de locataire de l’identité affectée par le système. Cette propriété est fournie uniquement pour une identité affectée par le système. |
type |
Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). |
|
userAssignedIdentities |
<string,
User |
identités User-Assigned |
ManagedServiceIdentityType
Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés).
Nom | Type | Description |
---|---|---|
None |
string |
|
SystemAssigned |
string |
|
SystemAssigned,UserAssigned |
string |
|
UserAssigned |
string |
OnlineDeploymentTrackedResource
Nom | Type | Description |
---|---|---|
id |
string |
ID de ressource complet pour la ressource. Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
identity |
Identité de service managée (identités affectées par le système et/ou par l’utilisateur) |
|
kind |
string |
Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. |
location |
string |
Emplacement géographique où réside la ressource |
name |
string |
nom de la ressource. |
properties | OnlineDeployment: |
[Obligatoire] Attributs supplémentaires de l’entité. |
sku |
Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. |
|
systemData |
Métadonnées Azure Resource Manager contenant les informations createdBy et modifiedBy. |
|
tags |
object |
Balises de ressource. |
type |
string |
Type de la ressource. Par exemple, « Microsoft.Compute/virtualMachines » ou « Microsoft.Storage/storageAccounts » |
OnlineDeploymentTrackedResourceArmPaginatedResult
Liste paginée des entités OnlineDeployment.
Nom | Type | Description |
---|---|---|
nextLink |
string |
Lien vers la page suivante des objets OnlineDeployment. Si la valeur est null, il n’y a pas de pages supplémentaires. |
value |
Tableau d’objets de type OnlineDeployment. |
OnlineRequestSettings
Configuration des demandes de scoring de déploiement en ligne.
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
maxConcurrentRequestsPerInstance |
integer |
1 |
Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1. |
maxQueueWait |
string |
PT0.5S |
(Déconseillé pour les points de terminaison managés en ligne) Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601.
Par défaut, 500 ms.
(Augmentez maintenant pour prendre |
requestTimeout |
string |
PT5S |
Délai d’expiration du score au format ISO 8601. Par défaut, 5 000 ms. |
ProbeSettings
Configuration de la sonde liveness/readiness du conteneur de déploiement.
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
failureThreshold |
integer |
30 |
Nombre d’échecs à autoriser avant de retourner un status défectueux. |
initialDelay |
string |
Délai avant la première sonde au format ISO 8601. |
|
period |
string |
PT10S |
Durée entre les sondes au format ISO 8601. |
successThreshold |
integer |
1 |
Nombre de sondes réussies avant de retourner un status sain. |
timeout |
string |
PT2S |
Délai d’expiration de la sonde au format ISO 8601. |
ScaleType
Nom | Type | Description |
---|---|---|
Default |
string |
|
TargetUtilization |
string |
Sku
Définition du modèle de ressource représentant la référence SKU
Nom | Type | Description |
---|---|---|
capacity |
integer |
Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si un scale-out/scale-in n’est pas possible pour la ressource, cela peut être omis. |
family |
string |
Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici. |
name |
string |
Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre |
size |
string |
Taille de la référence SKU. Lorsque le champ name est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome. |
tier |
Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas requis sur un PUT. |
SkuTier
Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT.
Nom | Type | Description |
---|---|---|
Basic |
string |
|
Free |
string |
|
Premium |
string |
|
Standard |
string |
systemData
Métadonnées relatives à la création et à la dernière modification de la ressource.
Nom | Type | Description |
---|---|---|
createdAt |
string |
Horodatage de la création de ressources (UTC). |
createdBy |
string |
Identité qui a créé la ressource. |
createdByType |
Type d’identité qui a créé la ressource. |
|
lastModifiedAt |
string |
Horodatage de la dernière modification de la ressource (UTC) |
lastModifiedBy |
string |
Identité qui a modifié la ressource pour la dernière fois. |
lastModifiedByType |
Type d’identité qui a modifié la ressource pour la dernière fois. |
TargetUtilizationScaleSettings
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
maxInstances |
integer |
1 |
Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances. |
minInstances |
integer |
1 |
Nombre minimal d’instances devant toujours être présentes. |
pollingInterval |
string |
PT1S |
Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. |
scaleType |
string:
Target |
[Obligatoire] Type d’algorithme de mise à l’échelle de déploiement |
|
targetUtilizationPercentage |
integer |
70 |
Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. |
UserAssignedIdentity
Propriétés de l’identité affectée par l’utilisateur
Nom | Type | Description |
---|---|---|
clientId |
string |
ID client de l’identité affectée. |
principalId |
string |
ID principal de l’identité affectée. |