Share via


Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2023-02-01-preview

Definição de recurso do Bicep

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o seguinte Bicep ao modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para Kubernetes, use:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Para Gerenciado, use:

  endpointComputeType: 'Managed'

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Padrão, use:

  scaleType: 'Default'

Para TargetUtilization, use:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valores de propriedade

workspaces/onlineEndpoints/deployments

Nome Descrição Valor
name O nome do recurso

Veja como definir nomes e tipos para recursos filho no Bicep.
cadeia de caracteres (obrigatório)
local A localização geográfica em que o recurso reside cadeia de caracteres (obrigatório)
marcas Marcas de recurso. Dicionário de nomes e valores de marcas. Confira Marcas em modelos
sku Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. Sku
kind Metadados usados pelo portal/ferramentas/etc para renderizar experiências de experiência de usuário diferentes para recursos do mesmo tipo. string
pai No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai.

Para obter mais informações, consulte Recurso filho fora do recurso pai.
Nome simbólico para o recurso do tipo: onlineEndpoints
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) ManagedServiceIdentity
properties [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formato: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{propriedade personalizada} UserAssignedIdentity

UserAssignedIdentity

Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. string
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará uma saída segura. Padrão: habilitado. 'Desabilitado'
'Enabled'
environmentId ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. string
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo no contêiner personalizado. string
properties Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
o padrão é TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerenciado (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do ativo de código. string
scoringScript [Obrigatório] O script a ser executado na inicialização. ex. "score.py" cadeia de caracteres (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidas antes de retornar um status não íntegro. INT
Initialdelay O atraso antes da primeira investigação no formato ISO 8601. string
period O período de tempo entre investigações no formato ISO 8601. string
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. INT
tempo limite O tempo limite da investigação no formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. INT
maxQueueWait A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
string
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Default
TargetUtilization (obrigatório)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'Default' (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'TargetUtilization' (obrigatório)
maxInstances O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. INT
Mininstances O número mínimo de instâncias sempre presentes. INT
Pollinginterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. string
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. INT

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Kubernetes' (obrigatório)
containerResourceRequirements Os requisitos de recurso para o contêiner (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos do contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memória Solicitação/limite de tamanho de memória para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Managed' (obrigatório)

Sku

Nome Descrição Valor
ALOCADA Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se o scale out/in não for possível para o recurso, isso poderá ser omitido. INT
família Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. string
name O nome da SKU. Ex - P3. Normalmente, é um código de letra+número cadeia de caracteres (obrigatório)
tamanho O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. string
Camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. 'Básico'
'Gratuito'
'Premium'
'Standard'

Definição de recurso de modelo do ARM

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

Para obter uma lista de propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o JSON a seguir ao modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-02-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para Kubernetes, use:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Para Gerenciado, use:

  "endpointComputeType": "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto .

Para Padrão, use:

  "scaleType": "Default"

Para TargetUtilization, use:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valores de propriedade

workspaces/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion A versão da API de recursos '2023-02-01-preview'
name O nome do recurso

Veja como definir nomes e tipos para recursos filho em modelos do ARM JSON.
cadeia de caracteres (obrigatório)
local A localização geográfica em que o recurso reside cadeia de caracteres (obrigatório)
marcas Marcas de recurso. Dicionário de nomes e valores de marcas. Consulte Marcas em modelos
sku Detalhes de SKU necessários para o contrato do ARM para Dimensionamento Automático. Sku
kind Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. string
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) ManagedServiceIdentity
properties [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores de dicionário podem ser objetos vazios ({}) em solicitações. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{propriedade personalizada} UserAssignedIdentity

UserAssignedIdentity

Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. string
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará uma saída segura. Padrão: habilitado. 'Desabilitado'
'Enabled'
environmentId ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. string
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo no contêiner personalizado. string
properties Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
o padrão é TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerenciado (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do ativo de código. string
scoringScript [Obrigatório] O script a ser executado na inicialização. ex. "score.py" cadeia de caracteres (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidas antes de retornar um status não íntegro. INT
Initialdelay O atraso antes da primeira investigação no formato ISO 8601. string
period O período de tempo entre investigações no formato ISO 8601. string
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. INT
tempo limite O tempo limite da investigação no formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. INT
maxQueueWait A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
string
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Default
TargetUtilization (obrigatório)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'Default' (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'TargetUtilization' (obrigatório)
maxInstances O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. INT
Mininstances O número mínimo de instâncias sempre presentes. INT
Pollinginterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. string
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. INT

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Kubernetes' (obrigatório)
containerResourceRequirements Os requisitos de recursos para o contêiner (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memória Solicitação/limite de tamanho de memória para o contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Gerenciado' (obrigatório)

Sku

Nome Descrição Valor
ALOCADA Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se expansão/redução não for possível para o recurso, isso poderá ser omitido. INT
família Se o serviço tiver gerações diferentes de hardware, para a mesma SKU, isso poderá ser capturado aqui. string
name O nome da SKU. Ex - P3. Normalmente, é um código de letra+número cadeia de caracteres (obrigatório)
tamanho O tamanho do SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. string
Camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. 'Básico'
'Gratuito'
'Premium'
'Standard'

Definição de recurso do Terraform (provedor de AzAPI)

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

  • Grupos de recursos

Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Terraform a seguir ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para Kubernetes, use:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Para Gerenciado, use:

  endpointComputeType = "Managed"

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Padrão, use:

  scaleType = "Default"

Para TargetUtilization, use:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valores de propriedade

workspaces/onlineEndpoints/deployments

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-02-01-preview"
name O nome do recurso cadeia de caracteres (obrigatório)
local A localização geográfica em que o recurso reside cadeia de caracteres (obrigatório)
parent_id A ID do recurso que é o pai desse recurso. ID do recurso do tipo: onlineEndpoints
marcas Marcas de recurso. Dicionário de nomes e valores de marcas.
sku Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. Sku
kind Metadados usados pelo portal/ferramentas/etc para renderizar experiências de experiência de usuário diferentes para recursos do mesmo tipo. string
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou atribuídas pelo usuário) ManagedServiceIdentity
properties [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciada (em que os tipos SystemAssigned e UserAssigned são permitidos). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
identity_ids O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formato: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. Matriz de IDs de identidade do usuário.

UserAssignedIdentities

Nome Descrição Valor
{propriedade personalizada} UserAssignedIdentity

UserAssignedIdentity

Esse objeto não contém nenhuma propriedade a ser definida durante a implantação. Todas as propriedades são ReadOnly.

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. string
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se desabilitado, isso criará saída segura. Padrão: habilitado. "Desabilitado"
"Habilitado"
environmentId ID de recurso do ARM da especificação de ambiente para a implantação do ponto de extremidade. string
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. string
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho do URI para o modelo. string
modelMountPath O caminho para montar o modelo em um contêiner personalizado. string
properties Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos da investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Definir o tipo de objeto Kubernetes
Gerenciado (obrigatório)

CodeConfiguration

Nome Descrição Valor
codeId ID de recurso do ARM do ativo de código. string
scoreScript [Obrigatório] O script a ser executado na inicialização. ex. "score.py" cadeia de caracteres (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidas antes de retornar um status não íntegro. INT
Initialdelay O atraso antes da primeira investigação no formato ISO 8601. string
period O período de tempo entre investigações no formato ISO 8601. string
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. INT
tempo limite O tempo limite da investigação no formato ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor
{propriedade personalizada} string
{propriedade personalizada} string

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitidas por implantação. O valor padrão é 1. INT
maxQueueWait A quantidade máxima de tempo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
string
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
string

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir o tipo de objeto Default
TargetUtilization (obrigatório)

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação "Padrão" (obrigatório)

TargetUtilizationScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação "TargetUtilization" (obrigatório)
maxInstances O número máximo de instâncias ao qual a implantação pode escalar. A cota será reservada para max_instances. INT
Mininstances O número mínimo de instâncias sempre presentes. INT
Pollinginterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Seconds. string
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. INT

KubernetesOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. "Kubernetes" (obrigatório)
containerResourceRequirements Os requisitos de recurso para o contêiner (cpu e memória). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos do contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
cpu Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Número de solicitações/limite de cartões de GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memória Solicitação/limite de tamanho de memória para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. "Gerenciado" (obrigatório)

Sku

Nome Descrição Valor
ALOCADA Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se o scale out/in não for possível para o recurso, isso poderá ser omitido. INT
família Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. string
name O nome da SKU. Ex - P3. Normalmente, é um código de letra+número cadeia de caracteres (obrigatório)
tamanho O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. string
Camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. “Basic”
"Free"
"Premium"
"Standard"