Share via


Componente Regressione logistica multiclasse

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello di regressione logistica che può essere usato per stimare più valori.

La classificazione usando la regressione logistica è un metodo di apprendimento con supervisione e quindi richiede un set di dati etichettato. Si esegue il training del modello fornendo il modello e il set di dati etichettato come input a un componente, ad esempio Train Model. Il modello sottoposto a training può quindi essere usato per stimare i valori per nuovi esempi di input.

Azure Machine Learning offre anche un componente Di regressione logistica a due classi , adatto per la classificazione delle variabili binarie o dicotomiche.

Informazioni sulla regressione logistica multiclasse

La regressione logistica è un metodo noto nelle statistiche usate per stimare la probabilità di un risultato ed è popolare per le attività di classificazione. L'algoritmo stima la probabilità di occorrenza di un evento adattando i dati a una funzione logistica.

Nella regressione logistica multiclasse, il classificatore può essere usato per stimare più risultati.

Configurare una regressione logistica multiclasse

  1. Aggiungere il componente Multiclass Logistic Regression alla pipeline.

  2. Specificare la modalità di training del modello impostando l'opzione Crea modalità di training .

    • Singolo parametro: usare questa opzione se si sa come configurare il modello e specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: selezionare questa opzione se non si è sicuri dei parametri migliori e si vuole eseguire uno sweep di parametri. Selezionare un intervallo di valori per eseguire l'iterazione e l'iperparametri del modello di ottimizzazione esegue l'iterazione di tutte le possibili combinazioni delle impostazioni fornite per determinare gli iperparametri che producono i risultati ottimali.

  3. Tolleranza di ottimizzazione, specificare il valore soglia per la convergenza dell'utilità di ottimizzazione. Se il miglioramento tra le iterazioni è inferiore alla soglia, l'algoritmo si interrompe e restituisce il modello corrente.

  4. Peso di regolarizzazione L1, peso di regolarizzazione L2: digitare un valore da usare per i parametri di regolarizzazione L1 e L2. È consigliabile usare per entrambi un valore diverso da zero.

    La regolarizzazione è un metodo per impedire l'overfitting penalizzando i modelli con valori di coefficiente estremi. La regolarizzazione funziona aggiungendo la penalità associata ai valori dei coefficienti all'errore dell'ipotesi. Un modello accurato con valori di coefficiente estremi sarebbe penalizzato di più, mentre un modello meno accurato con valori più conservativi sarebbe penalizzato di meno.

    Le regolarizzazioni di tipo L1 e L2 hanno effetti e usi differenti. La regolarizzazione L1 può essere applicata a modelli di tipo sparse, caratteristica utile quando si lavora con dati a elevata dimensionalità. La regolarizzazione L2, al contrario, è preferibile per i dati non di tipo sparse. Questo algoritmo supporta una combinazione lineare di valori di regolarizzazione L1 e L2, ovvero se x = L1 e y = L2, ax + by = c definisce l'intervallo lineare dei termini di regolarizzazione.

    Diverse combinazioni lineari di termini L1 e L2 sono state concepite per i modelli di regressione logistica, ad esempio la regolarizzazione della rete elastica.

  5. Inizializzazione numero casuale: digitare un valore integer da usare come valore di inizializzazione per l'algoritmo se si desidera che i risultati siano ripetibili in esecuzione. In caso contrario, viene usato un valore dell'orologio di sistema come seed, che può produrre risultati leggermente diversi in esecuzioni della stessa pipeline.

  6. Connettere un set di dati etichettato e eseguire il training del modello:

    • Se si imposta La modalità di training suSingolo parametro, connettere un set di dati con tag e il componente Train Model .

    • Se si imposta La modalità di training suIntervallo di parametri, connettere un set di dati con tag e eseguire il training del modello usando Gli iperparametri del modello.

    Nota

    Se si passa un intervallo di parametri a Train Model, usa solo il valore predefinito nell'elenco dei parametri singoli.

    Se si passa un singolo set di valori di parametro al componente Ottimizzare gli iperparametri del modello , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per il learner.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

  7. Inviare la pipeline.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.