Partilhar via


BanditPolicy Classe

Define uma política de cessação antecipada com base em critérios de margem e um intervalo de frequência e atraso para avaliação.

Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.

Herança
azureml.train.hyperdrive.policy.EarlyTerminationPolicy
BanditPolicy

Construtor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parâmetros

Name Description
slack_factor

A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho.

valor predefinido: None
slack_amount

A distância absoluta permitida da execução com melhor desempenho.

valor predefinido: None
evaluation_interval
int

A frequência de aplicação da política.

valor predefinido: 1
delay_evaluation
int

O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificada, a política aplica todos os múltiplos que evaluation_interval são maiores ou iguais a delay_evaluation.

valor predefinido: 0
slack_factor
Necessário

A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho.

slack_amount
Necessário

A distância absoluta permitida da execução com melhor desempenho.

evaluation_interval
Necessário
int

A frequência de aplicação da política.

delay_evaluation
Necessário
int

O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificada, a política aplica todos os múltiplos que evaluation_interval são maiores ou iguais a delay_evaluation.

Observações

A política Bandit utiliza os seguintes parâmetros de configuração:

  • slack_factor: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma proporção.

  • slack_amount: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma quantidade absoluta.

  • evaluation_interval: opcional. A frequência de aplicação da política. Cada vez que o script de preparação regista as métricas primárias conta como um intervalo.

  • delay_evaluation: opcional. O número de intervalos para atrasar a avaliação da política. Utilize este parâmetro para evitar a terminação prematura das execuções de preparação. Se for especificada, a política aplica todos os múltiplos que evaluation_interval são maiores ou iguais a delay_evaluation.

Qualquer execução que não se insera no fator slack ou na quantidade de margem da métrica de avaliação relativamente à execução com melhor desempenho será terminada.

Considere uma política bandit com slack_factor = 0,2 e evaluation_interval = 100. Suponha que a execução X é a execução com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que o melhor AUC reportado para uma execução é Y. Esta política compara o valor (Y + Y * 0,2) com 0,8 e, se menor, cancela a execução. Se delay_evaluation = 200, a primeira vez que a política será aplicada é no intervalo de 200.

Agora, considere uma política bandit com slack_amount = 0,2 e evaluation_interval = 100. Se a Execução 3 for a execução atualmente com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC inferior a 0,6 (0,8 - 0,2) após 100 iterações será terminada. Da mesma forma, também delay_evaluation pode ser utilizado para atrasar a primeira avaliação da política de terminação para um número específico de sequências.

Para obter mais informações sobre a aplicação de políticas de terminação antecipada, veja Otimizar hiperparâmetros para o seu modelo.

Atributos

delay_evaluation

Devolva o número de sequências para as quais a primeira avaliação está atrasada.

Devoluções

Tipo Description
int

A avaliação de atraso.

evaluation_interval

Devolver o valor do intervalo de avaliação.

Devoluções

Tipo Description
int

O intervalo de avaliação.

slack_factor

Devolva o fator slack no que diz respeito à execução de preparação com melhor desempenho.

Devoluções

Tipo Description

O factor slack.

POLICY_NAME

POLICY_NAME = 'Bandit'