Condividi tramite


componente macchina a vettori di supporto Two-Class

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello basato sull'algoritmo della macchina a vettori di supporto.

Le macchine a vettori di supporto sono una classe ben studiata di metodi di apprendimento supervisionati. Questa particolare implementazione è adatta alla stima di due possibili risultati, in base a variabili continue o categoriche.

Dopo aver definito i parametri del modello, eseguire il training del modello usando i componenti di training e fornire un set di dati con tag che include un'etichetta o una colonna dei risultati.

Informazioni sulle macchine a vettori di supporto

Le macchine a vettori di supporto (SVM) sono tra gli algoritmi di Machine Learning meno recenti e i modelli SVM sono stati usati in molte applicazioni, dal recupero di informazioni alla classificazione di testo e immagini. Le macchine virtuali possono essere usate sia per le attività di classificazione che di regressione.

Questo modello SVM è un modello di apprendimento supervisionato che richiede dati etichettati. Nel processo di training l'algoritmo analizza i dati di input e riconosce i modelli in uno spazio di funzionalità multidimensionale denominato iperpiano. Tutti gli esempi di input sono rappresentati come punti in questo spazio e vengono mappati alle categorie di output in modo che le categorie siano divise per il più ampio e cancellano un gap il più possibile.

Per la stima, l'algoritmo SVM assegna nuovi esempi in una categoria o nell'altra, mappandoli nello stesso spazio.

Modalità di configurazione

Per questo tipo di modello, è consigliabile normalizzare il set di dati prima di usarlo per eseguire il training del classificatore.

  1. Aggiungere il componente Two-Class Support Vector Machine alla pipeline.

  2. Specificare la modalità di training del modello impostando l'opzione Crea modalità di training .

    • Singolo parametro: se si sa come si vuole configurare il modello, è possibile specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: se non si è certi dei parametri migliori, è possibile trovare i parametri ottimali usando il componente Ottimizza iperparametri del modello . Si specifica un intervallo di valori e il formatore esegue l'iterazione su più combinazioni delle impostazioni per determinare la combinazione di valori che producono il risultato migliore.

  3. Per Numero di iterazioni digitare un numero che indica il numero di iterazioni usate durante la compilazione del modello.

    Questo parametro può essere usato per controllare il compromesso tra velocità e precisione di training.

  4. Per Lambda digitare un valore da usare come peso per la regolarizzazione L1.

    Questo coefficiente di regolarizzazione consente di ottimizzare il modello. I valori più elevati penalizzano i modelli più complessi.

  5. Selezionare l'opzione Normalizza funzionalità se si desidera normalizzare le funzionalità prima del training.

    Se si applica la normalizzazione, prima del training, i punti dati vengono centrati sulla media e ridimensionati in modo da avere un'unità di deviazione standard.

  6. Selezionare l'opzione Project to the unit sphere (Progetto nella sfera di unità) per normalizzare i coefficienti.

    Proiettare i valori nello spazio unità significa che prima del training, i punti dati vengono centrati su 0 e ridimensionati in modo da avere un'unità di deviazione standard.

  7. In Valore di inizializzazione numero casuale digitare un valore intero da usare come valore di inizializzazione se si vuole garantire la riproducibilità tra le esecuzioni. In caso contrario, un valore di clock di sistema viene usato come valore di inizializzazione, che può comportare risultati leggermente diversi tra le esecuzioni.

  8. Connettere un set di dati etichettato ed eseguire il training del modello:

    • Se si imposta Crea modalità di training su Parametro singolo, connettere un set di dati con tag e il componente Train Model .

    • Se si imposta Crea modalità di training su Intervallo di parametri, connettere un set di dati con tag ed eseguire il training del modello usando Tune Model Hyperparameters.

    Nota

    Se si passa un intervallo di parametri a Train Model, viene usato solo il valore predefinito nell'elenco dei singoli parametri.

    Se si passa un singolo set di valori di parametro al componente Tune Model Hyperparameters , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per lo strumento di apprendimento.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

  9. Inviare la pipeline.

Risultati

Al termine del training:

  • Per salvare uno snapshot del modello sottoposto a training, selezionare la scheda Output nel pannello destro del componente Train model (Esegui training modello). Selezionare l'icona Registra set di dati per salvare il modello come componente riutilizzabile.

  • Per usare il modello per l'assegnazione dei punteggi, aggiungere il componente Score Model a una pipeline.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.