Esquema YAML do ponto de extremidade online da CLI (v2)

Artigo
05/03/2024

APLICA-SE A:Extensão de ML da CLI do Azure v2 (atual)

O esquema JSON de origem pode ser encontrado no https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json ponto de extremidade online gerenciado e no https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para o ponto de extremidade online do Kubernetes. As diferenças entre o ponto de extremidade online gerenciado e o ponto de extremidade online do Kubernetes estão descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no ponto de extremidade online gerenciado.

Observação

A sintaxe YAML detalhada neste documento baseia-se no esquema JSON da última versão da extensão de ML da CLI v2. Essa sintaxe só tem a garantia de funcionar com a última versão da extensão de ML da CLI v2. Encontre os esquemas para as versões mais antigas da extensão em https://azuremlschemasprod.azureedge.net/.

Observação

Um YAML de exemplo totalmente especificado para pontos de extremidade online gerenciados está disponível para referência

Sintaxe YAML

Chave	Type	Descrição	Valores permitidos	Valor padrão
`$schema`	string	O esquema YAML. Se você usar a extensão do Azure Machine Learning para VS Code para criar o arquivo YAML, a inclusão de `$schema` no início do arquivo permitirá invocar conclusões de esquema e recursos.
`name`	string	Obrigatórios. Nome do ponto de extremidade. Deve ser exclusivo no nível da região do Azure. As regras de nomenclatura são definidas sob limites de ponto de extremidade.
`description`	string	Descrição do ponto de extremidade.
`tags`	objeto	Dicionário de tags para o ponto de extremidade.
`auth_mode`	string	O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use `key` para autenticação baseada em chave. Use `aml_token` para autenticação baseada em chave do Azure Machine Learning. Use `aad_token` para autenticação baseada em token do Microsoft Entra (versão prévia).	`key`, `aml_token`, `aad_token`	`key`
`compute`	string	Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável a implantações de ponto de extremidade para clusters de Kubernetes habilitados para o Azure Arc (o destino de computação especificado neste campo deve ter `type: kubernetes`). Não especifique esse campo se você estiver fazendo uma inferência online gerenciada.
`identity`	objeto	A configuração de identidade gerenciada para acessar recursos do Azure para inferência e provisionamento de ponto de extremidade.
`identity.type`	string	O tipo de identidade gerenciada. Se o tipo for `user_assigned`, a propriedade `identity.user_assigned_identities` também deverá ser especificada.	`system_assigned`, `user_assigned`
`identity.user_assigned_identities`	array	Lista de IDs de recurso totalmente qualificadas das identidades atribuídas pelo usuário.
`traffic`	objeto	O tráfego representa a porcentagem de solicitações a serem atendidas por implantações diferentes. Ele é representado por um dicionário de pares chave-valor, em que as chaves representam o nome e o valor da implantação representam a porcentagem de tráfego para essa implantação. Por exemplo, `blue: 90 green: 10` significa que 90% solicitações são enviadas para a implantação nomeada `blue` e 10% são enviadas para a implantação `green`. O tráfego total deve ser 0 ou somar até 100. Consulte Distribuição de Cofre para pontos de extremidade online para ver a configuração de tráfego em ação. Observação: não é possível definir esse campo durante a criação do ponto de extremidade online pois as implantações nesse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego para um ponto de extremidade online após as implantações terem sido criadas usando `az ml online-endpoint update`; por exemplo, `az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10"`.
`public_network_access`	string	Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando `disabled`, as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do workspace do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados	`enabled`, `disabled`	`enabled`
`mirror_traffic`	string	Porcentagem de tráfego dinâmico para espelhar para uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. O percentual espelhado do tráfego é copiado e enviado para a implantação especificada para que você possa coletar métricas e registrar sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros de protocolo HTTP. Ela é representada por um dicionário com um só par chave-valor, em que a chave representa o nome da implantação e o valor representa o percentual do tráfego a ser espelhado para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado.

Comentários

Os comandos az ml online-endpoint podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.

Exemplos

Os exemplos estão disponíveis no repositório de exemplos do GitHub. Vários são mostrados abaixo.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identidade atribuída pelo sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identidade atribuída pelo usuário

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Compartilhar via