BanditPolicy Klas

Definieert een beleid voor vroegtijdige beëindiging op basis van margecriteria en een frequentie- en vertragingsinterval voor evaluatie.

Initialiseer een BanditPolicy met slack-factor, slack_amount en evaluatie-interval.

Overname
azureml.train.hyperdrive.policy.EarlyTerminationPolicy
BanditPolicy

Constructor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parameters

Name Description
slack_factor

De verhouding die wordt gebruikt om de toegestane afstand tot de best presterende experimentuitvoering te berekenen.

standaardwaarde: None
slack_amount

De absolute afstand die is toegestaan tot de best presterende run.

standaardwaarde: None
evaluation_interval
int

De frequentie voor het toepassen van het beleid.

standaardwaarde: 1
delay_evaluation
int

Het aantal intervallen waarvoor de eerste beleidsevaluatie moet worden uitgesteld. Indien opgegeven, wordt elk veelvoud van evaluation_interval het beleid toegepast dat groter is dan of gelijk is aan delay_evaluation.

standaardwaarde: 0
slack_factor
Vereist

De verhouding die wordt gebruikt om de toegestane afstand tot de best presterende experimentuitvoering te berekenen.

slack_amount
Vereist

De absolute afstand die is toegestaan tot de best presterende run.

evaluation_interval
Vereist
int

De frequentie voor het toepassen van het beleid.

delay_evaluation
Vereist
int

Het aantal intervallen waarvoor de eerste beleidsevaluatie moet worden uitgesteld. Indien opgegeven, wordt elk veelvoud van evaluation_interval het beleid toegepast dat groter is dan of gelijk is aan delay_evaluation.

Opmerkingen

Het Bandit-beleid heeft de volgende configuratieparameters:

  • slack_factor: De hoeveelheid marge die is toegestaan met betrekking tot de best presterende trainingsuitvoering. Deze factor geeft de marge aan als een verhouding.

  • slack_amount: De hoeveelheid marge die is toegestaan met betrekking tot de best presterende trainingsuitvoering. Met deze factor wordt de marge als een absoluut bedrag opgegeven.

  • evaluation_interval:Optionele. De frequentie voor het toepassen van het beleid. Telkens wanneer het trainingsscript registreert, worden de primaire metrische gegevens als één interval geteld.

  • delay_evaluation:Optionele. Het aantal intervallen om beleidsevaluatie te vertragen. Gebruik deze parameter om voortijdige beëindiging van trainingsuitvoeringen te voorkomen. Indien opgegeven, wordt elk veelvoud van evaluation_interval het beleid toegepast dat groter is dan of gelijk is aan delay_evaluation.

Elke uitvoering die niet binnen de margefactor of margehoeveelheid van de evaluatiewaarde valt met betrekking tot de best presterende uitvoering, wordt beëindigd.

Overweeg een Bandit-beleid met slack_factor = 0,2 en evaluation_interval = 100. Stel dat run X momenteel de best presterende uitvoering is met een AUC (prestatiemetriek) van 0,8 na intervallen van 100. Stel verder dat de beste AUC die voor een uitvoering is gerapporteerd, Y is. Met dit beleid wordt de waarde (Y + Y * 0,2) vergeleken met 0,8. Als de waarde kleiner is, wordt de uitvoering geannuleerd. Als delay_evaluation = 200, is de eerste keer dat het beleid wordt toegepast op interval 200.

Overweeg nu een Bandit-beleid met slack_amount = 0,2 en evaluation_interval = 100. Als uitvoering 3 momenteel de best presterende uitvoering is met een AUC (prestatiemetriek) van 0,8 na 100 intervallen, wordt elke uitvoering met een AUC kleiner dan 0,6 (0,8 - 0,2) na 100 iteraties beëindigd. Op dezelfde manier kan de delay_evaluation ook worden gebruikt om de evaluatie van het eerste beëindigingsbeleid voor een bepaald aantal reeksen te vertragen.

Zie Hyperparameters afstemmen voor uw model voor meer informatie over het toepassen van beleid voor vroegtijdige beëindiging.

Kenmerken

delay_evaluation

Retourneert het aantal reeksen waarvoor de eerste evaluatie is vertraagd.

Retouren

Type Description
int

De vertragingsevaluatie.

evaluation_interval

Retourneer de waarde van het evaluatie-interval.

Retouren

Type Description
int

Het evaluatie-interval.

slack_factor

Retourneer de margefactor met betrekking tot de best presterende trainingsuitvoering.

Retouren

Type Description

De slack-factor.

POLICY_NAME

POLICY_NAME = 'Bandit'