BanditPolicy Classe

Referência

Define uma política de cessação antecipada com base em critérios de margem e um intervalo de frequência e atraso para avaliação.

Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.

Herança: azureml.train.hyperdrive.policy.EarlyTerminationPolicy

BanditPolicy

Construtor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parâmetros

Name	Description
slack_factor	float A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho. valor predefinido: None
slack_amount	float A distância absoluta permitida da execução com melhor desempenho. valor predefinido: None
evaluation_interval	int A frequência de aplicação da política. valor predefinido: 1
delay_evaluation	int O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificada, a política aplica todos os múltiplos que `evaluation_interval` são maiores ou iguais a `delay_evaluation`. valor predefinido: 0
slack_factor Necessário	float A proporção utilizada para calcular a distância permitida da execução de experimentação com melhor desempenho.
slack_amount Necessário	float A distância absoluta permitida da execução com melhor desempenho.
evaluation_interval Necessário	int A frequência de aplicação da política.
delay_evaluation Necessário	int O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificada, a política aplica todos os múltiplos que `evaluation_interval` são maiores ou iguais a `delay_evaluation`.

Observações

A política Bandit utiliza os seguintes parâmetros de configuração:

slack_factor: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma proporção.
slack_amount: a quantidade de margem permitida relativamente à execução de preparação com melhor desempenho. Este fator especifica a margem como uma quantidade absoluta.
evaluation_interval: opcional. A frequência de aplicação da política. Cada vez que o script de preparação regista as métricas primárias conta como um intervalo.
delay_evaluation: opcional. O número de intervalos para atrasar a avaliação da política. Utilize este parâmetro para evitar a terminação prematura das execuções de preparação. Se for especificada, a política aplica todos os múltiplos que evaluation_interval são maiores ou iguais a delay_evaluation.

Qualquer execução que não se insera no fator slack ou na quantidade de margem da métrica de avaliação relativamente à execução com melhor desempenho será terminada.

Considere uma política bandit com slack_factor = 0,2 e evaluation_interval = 100. Suponha que a execução X é a execução com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que o melhor AUC reportado para uma execução é Y. Esta política compara o valor (Y + Y * 0,2) com 0,8 e, se menor, cancela a execução. Se delay_evaluation = 200, a primeira vez que a política será aplicada é no intervalo de 200.

Agora, considere uma política bandit com slack_amount = 0,2 e evaluation_interval = 100. Se a Execução 3 for a execução atualmente com melhor desempenho com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC inferior a 0,6 (0,8 - 0,2) após 100 iterações será terminada. Da mesma forma, também delay_evaluation pode ser utilizado para atrasar a primeira avaliação da política de terminação para um número específico de sequências.

Para obter mais informações sobre a aplicação de políticas de terminação antecipada, veja Otimizar hiperparâmetros para o seu modelo.

Atributos

delay_evaluation

Devolva o número de sequências para as quais a primeira avaliação está atrasada.

Devoluções

Tipo	Description
int	A avaliação de atraso.

evaluation_interval

Devolver o valor do intervalo de avaliação.

Devoluções

Tipo	Description
int	O intervalo de avaliação.

slack_factor

Devolva o fator slack no que diz respeito à execução de preparação com melhor desempenho.

Devoluções

Tipo	Description
float	O factor slack.

POLICY_NAME

POLICY_NAME = 'Bandit'

Partilhar via

BanditPolicy Classe

Construtor

Parâmetros

Observações

Atributos

delay_evaluation

Devoluções

evaluation_interval

Devoluções

slack_factor

Devoluções

POLICY_NAME

Comentários

Comentários

Recursos adicionais