Two-Class Bayes Point Machine

Erstellt ein binären Bayes Point Machine-Klassifizierungsmodell

Kategorie: Machine Learning/Modell/Klassifizierung initialisieren

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Two-Class Bayes Point Machine in Azure Machine Learning Studio (klassisch) verwenden, um ein untrainiertes binäres Klassifizierungs Modell zu erstellen.

Der Algorithmus in diesem Modul verwendet einen Bayes-Ansatz für die lineare Klassifizierung mit dem Namen "Bayes Point Machine". Mit diesem Algorithmus wird der theoretisch optimale Bayessche Durchschnitt von linearen Klassifizierern (im Hinblick auf die Generalisierungs Leistung) effizient mit der Auswahl eines "durchschnittlichen" Klassifizierers, dem Bayes-Punkt, berechnet. Da die Bayes Point Machine ein Bayessches Klassifizierungsmodell ist, neigt sie nicht zur Überanpassung der Trainingsdaten.

Weitere Informationen finden Sie im Beitrag von Chris Bishop im Microsoft Machine Learning-Blog: einbeziehen von Ungewissheit-Probabilistic Inference.

Konfigurieren Two-Class Bayes Point Machine

  1. Fügen Sie in Azure Machine Learning Studio (klassisch) dem Experiment das Modul Two-Class Bayes Point Machine hinzu. Sie finden das Modul unter Machine Learning, Modell initialisieren, Klassifizierung.

  2. Geben Sie für die Anzahl der Trainings Iterationen eine Zahl ein, um anzugeben, wie oft der Nachrichten Übergabe Algorithmus die Trainingsdaten durchläuft. Die Anzahl der Iterationen sollte in der Regel auf einen Wert im Bereich von 5 bis 100 festgelegt werden.

    Je höher die Anzahl der Trainingsiterationen, desto genauer die Vorhersagen. Allerdings dauert das Training länger.

    Bei den meisten Datasets reicht die Standardeinstellung von 30 Trainingsiterationen für den Algorithmus aus, um exakte Vorhersagen zu treffen. Mitunter lassen sich mit weniger Iterationen exakte Vorhersagen erzielen. Datasets mit hoch korrelierte Merkmalen können von weiteren Trainingsiterationen profitieren.

  3. Wählen Sie die Option " Bias einschließen" aus, wenn jeder Instanz in Schulung und Vorhersage eine Konstante Funktion oder ein Bezeichner hinzugefügt werden soll.

    Das Einschließen eines Bias ist erforderlich, wenn die Daten nicht bereits über ein konstantes Merkmal verfügen.

  4. Wählen Sie die Option unbekannte Werte in kategorischen Features zulassen aus, um eine Gruppe für unbekannte Werte zu erstellen.

    Wenn Sie diese Option deaktivieren, akzeptiert das Modell nur Werte, die in den Trainingsdaten enthalten sind.

    Wenn Sie diese Option auswählen und unbekannte Werte zulassen, ist das Modell für bekannte Werte möglicherweise weniger präzise, bietet jedoch bessere Vorhersagen für neue (unbekannte) Werte.

  5. Fügen Sie eine Instanz des Moduls Train Model und die Trainingsdaten hinzu.

  6. Verbinden Sie die Trainingsdaten und die Ausgabe des Moduls Two-Class Bayes Point Machine mit dem Modul Train Model , und wählen Sie die Spalte Bezeichnung aus.

  7. Führen Sie das Experiment aus.

Ergebnisse

Klicken Sie nach Abschluss des Trainings mit der rechten Maustaste auf die Ausgabe des Moduls Train Model , um die Ergebnisse anzuzeigen:

  • Wählen Sie zum Anzeigen einer Zusammenfassung der Modellparameter zusammen mit den Merkmals Gewichtungen, die aus dem Training gelernt wurden, visualisieren aus.

  • Um das Modell für die spätere Verwendung zu speichern, klicken Sie mit der rechten Maustaste auf die Ausgabe des Moduls Train Model, und wählen Sie als trainiertes Modell speichern.

  • Verwenden Sie zum Treffen von Vorhersagen das trainierte Modell als Eingabe für das Modul Score Model .

    Das untrainierte Modell kann auch an das Cross-Validate-Modell zur Kreuz Validierung für ein bezeichnetes DataSet übermittelt werden.

Beispiele

Weitere Informationen zur Verwendung des Two-Class Bayes Point Machine in Machine Learning finden Sie in den folgenden Beispiel Experimenten in der Azure AI Gallery:

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails und häufig gestellte Fragen zu diesem Algorithmus.

Details aus der ursprünglichen Untersuchung und der zugrunde liegenden Theorie finden Sie in diesem Dokument (PDF): Bayes Point machines, Herbert, graepe und Campbell .

Diese Implementierung verbessert jedoch auf verschiedene Weise den ursprünglichen Algorithmus:

  • Sie verwendet den Message-Passing-Algorithmus Expectation Propagation. Weitere Informationen finden Sie unter eine Reihe von Algorithmen für einen ungefährenbayesschen Typrückschluss.

  • Ein Parameter-Sweep ist nicht erforderlich.

  • Diese Methode erfordert keine Normalisierung von Daten.

Diese Verbesserungen machen das Bayes Point Machine-Klassifizierungsmodell robuster und benutzerfreundlicher, und der zeitaufwändige Schritt der Parameteroptimierung entfällt.

Modulparameter

Name Range type Standard BESCHREIBUNG
Anzahl der Trainingsiterationen >=1 Integer 30 Geben Sie die Anzahl der Iterationen für das Training an.
Include bias Any Boolean True Geben Sie an, ob jeder Instanz ein konstantes Merkmal oder ein Bias hinzugefügt werden soll.
Allow unknown values in categorical features Any Boolean True Bei "True" wird eine zusätzliche Ebene für jede Kategoriespalte erstellt. Alle Ebenen im Testdataset, die nicht im Trainingsdataset zur Verfügung stehen, werden dieser zusätzlichen Ebene zugeordnet.

Output

Name Typ BESCHREIBUNG
Untrainiertes Modell ILearner-Schnittstelle Ein untrainiertes binäres Klassifizierungsmodell

Weitere Informationen

Liste der Klassifizierungs -A-Z-Module