Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2023-02-01-preview
Definição de recurso do Bicep
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos – Consulte comandos de implantação do grupo de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para Kubernetes, use:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Para Gerenciado, use:
endpointComputeType: 'Managed'
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
scaleType: 'Default'
Para TargetUtilization, use:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
name | O nome do recurso Veja como definir nomes e tipos para recursos filho no Bicep. |
cadeia de caracteres (obrigatório) |
local | A localização geográfica em que o recurso reside | cadeia de caracteres (obrigatório) |
marcas | Marcas de recurso. | Dicionário de nomes e valores de marcas. Confira Marcas em modelos |
sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | Sku |
kind | Metadados usados pelo portal/ferramentas/etc para renderizar experiências de experiência de usuário diferentes para recursos do mesmo tipo. | string |
pai | No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai. Para obter mais informações, consulte Recurso filho fora do recurso pai. |
Nome simbólico para o recurso do tipo: onlineEndpoints |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) | ManagedServiceIdentity |
properties | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formato: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | string |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará uma saída segura. Padrão: habilitado. | 'Desabilitado' 'Enabled' |
environmentId | ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. | string |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | string |
properties | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, o padrão é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do ativo de código. | string |
scoringScript | [Obrigatório] O script a ser executado na inicialização. ex. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidas antes de retornar um status não íntegro. | INT |
Initialdelay | O atraso antes da primeira investigação no formato ISO 8601. | string |
period | O período de tempo entre investigações no formato ISO 8601. | string |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | INT |
tempo limite | O tempo limite da investigação no formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. | INT |
maxQueueWait | A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
string |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Default TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
maxInstances | O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. | INT |
Mininstances | O número mínimo de instâncias sempre presentes. | INT |
Pollinginterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. | string |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | INT |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos do contêiner: | ContainerResourceSettings |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Managed' (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
ALOCADA | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se o scale out/in não for possível para o recurso, isso poderá ser omitido. | INT |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | string |
name | O nome da SKU. Ex - P3. Normalmente, é um código de letra+número | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | string |
Camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
Definição de recurso de modelo do ARM
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos – Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o JSON a seguir ao modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-02-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para Kubernetes, use:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Para Gerenciado, use:
"endpointComputeType": "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto .
Para Padrão, use:
"scaleType": "Default"
Para TargetUtilization, use:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | A versão da API de recursos | '2023-02-01-preview' |
name | O nome do recurso Veja como definir nomes e tipos para recursos filho em modelos do ARM JSON. |
cadeia de caracteres (obrigatório) |
local | A localização geográfica em que o recurso reside | cadeia de caracteres (obrigatório) |
marcas | Marcas de recurso. | Dicionário de nomes e valores de marcas. Consulte Marcas em modelos |
sku | Detalhes de SKU necessários para o contrato do ARM para Dimensionamento Automático. | Sku |
kind | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | string |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) | ManagedServiceIdentity |
properties | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores de dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | string |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará uma saída segura. Padrão: habilitado. | 'Desabilitado' 'Enabled' |
environmentId | ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. | string |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | string |
properties | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, o padrão é TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso arm do ativo de código. | string |
scoringScript | [Obrigatório] O script a ser executado na inicialização. ex. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidas antes de retornar um status não íntegro. | INT |
Initialdelay | O atraso antes da primeira investigação no formato ISO 8601. | string |
period | O período de tempo entre investigações no formato ISO 8601. | string |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | INT |
tempo limite | O tempo limite da investigação no formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. | INT |
maxQueueWait | A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
string |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Default TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
maxInstances | O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. | INT |
Mininstances | O número mínimo de instâncias sempre presentes. | INT |
Pollinginterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. | string |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | INT |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
containerResourceRequirements | Os requisitos de recursos para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | ContainerResourceSettings |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memória | Solicitação/limite de tamanho de memória para o contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
ALOCADA | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se expansão/redução não for possível para o recurso, isso poderá ser omitido. | INT |
família | Se o serviço tiver gerações diferentes de hardware, para a mesma SKU, isso poderá ser capturado aqui. | string |
name | O nome da SKU. Ex - P3. Normalmente, é um código de letra+número | cadeia de caracteres (obrigatório) |
tamanho | O tamanho do SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | string |
Camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
Definição de recurso do Terraform (provedor de AzAPI)
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos
Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Terraform a seguir ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para Kubernetes, use:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Para Gerenciado, use:
endpointComputeType = "Managed"
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
scaleType = "Default"
Para TargetUtilization, use:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Valores de propriedade
workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview" |
name | O nome do recurso | cadeia de caracteres (obrigatório) |
local | A localização geográfica em que o recurso reside | cadeia de caracteres (obrigatório) |
parent_id | A ID do recurso que é o pai desse recurso. | ID do recurso do tipo: onlineEndpoints |
marcas | Marcas de recurso. | Dicionário de nomes e valores de marcas. |
sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | Sku |
kind | Metadados usados pelo portal/ferramentas/etc para renderizar experiências de experiência de usuário diferentes para recursos do mesmo tipo. | string |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) | ManagedServiceIdentity |
properties | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (obrigatório) |
identity_ids | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formato: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | Matriz de IDs de identidade do usuário. |
UserAssignedIdentities
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | UserAssignedIdentity |
UserAssignedIdentity
Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | string |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará saída segura. Padrão: habilitado. | "Desabilitado" "Habilitado" |
environmentId | ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. | string |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | string |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho do URI para o modelo. | string |
modelMountPath | O caminho para montar o modelo em um contêiner personalizado. | string |
properties | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Definir o tipo de objeto | Kubernetes Gerenciado (obrigatório) |
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID de recurso do ARM do ativo de código. | string |
scoreScript | [Obrigatório] O script a ser executado na inicialização. ex. "score.py" | cadeia de caracteres (obrigatório) Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidas antes de retornar um status não íntegro. | INT |
Initialdelay | O atraso antes da primeira investigação no formato ISO 8601. | string |
period | O período de tempo entre investigações no formato ISO 8601. | string |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | INT |
tempo limite | O tempo limite da investigação no formato ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|---|---|
{propriedade personalizada} | string | |
{propriedade personalizada} | string |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. | INT |
maxQueueWait | A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
string |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
string |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir o tipo de objeto | Default TargetUtilization (obrigatório) |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | "Padrão" (obrigatório) |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | "TargetUtilization" (obrigatório) |
maxInstances | O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. | INT |
Mininstances | O número mínimo de instâncias sempre presentes. | INT |
Pollinginterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. | string |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | INT |
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | "Kubernetes" (obrigatório) |
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos do contêiner: | ContainerResourceSettings |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | ContainerResourceSettings |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
cpu | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | "Gerenciado" (obrigatório) |
Sku
Nome | Descrição | Valor |
---|---|---|
ALOCADA | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se o scale out/in não for possível para o recurso, isso poderá ser omitido. | INT |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | string |
name | O nome da SKU. Ex - P3. Normalmente, é um código de letra+número | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | string |
Camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | “Basic” "Free" "Premium" "Standard" |
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de