LbfgsLogisticRegressionBinaryTrainer Klasse

Referenz

Definition

Namespace:: Microsoft.ML.Trainers

Assembly:: Microsoft.ML.StandardTrainers.dll

Paket:: Microsoft.ML v3.0.1

Paket:: Microsoft.ML v1.0.0

Paket:: Microsoft.ML v1.1.0

Paket:: Microsoft.ML v1.2.0

Paket:: Microsoft.ML v1.3.1

Paket:: Microsoft.ML v1.4.0

Paket:: Microsoft.ML v1.5.5

Paket:: Microsoft.ML v1.6.0

Paket:: Microsoft.ML v1.7.0

Paket:: Microsoft.ML v2.0.0

Wichtig

Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.

Das IEstimator<TTransformer> Ziel mithilfe eines linearen logistischen Regressionsmodells, das mit der L-BFGS-Methode trainiert wurde, vorherzusagen.

public sealed class LbfgsLogisticRegressionBinaryTrainer : Microsoft.ML.Trainers.LbfgsTrainerBase<Microsoft.ML.Trainers.LbfgsLogisticRegressionBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Calibrators.CalibratedModelParametersBase<Microsoft.ML.Trainers.LinearBinaryModelParameters,Microsoft.ML.Calibrators.PlattCalibrator>>,Microsoft.ML.Calibrators.CalibratedModelParametersBase<Microsoft.ML.Trainers.LinearBinaryModelParameters,Microsoft.ML.Calibrators.PlattCalibrator>>

type LbfgsLogisticRegressionBinaryTrainer = class
    inherit LbfgsTrainerBase<LbfgsLogisticRegressionBinaryTrainer.Options, BinaryPredictionTransformer<CalibratedModelParametersBase<LinearBinaryModelParameters, PlattCalibrator>>, CalibratedModelParametersBase<LinearBinaryModelParameters, PlattCalibrator>>

Public NotInheritable Class LbfgsLogisticRegressionBinaryTrainer
Inherits LbfgsTrainerBase(Of LbfgsLogisticRegressionBinaryTrainer.Options, BinaryPredictionTransformer(Of CalibratedModelParametersBase(Of LinearBinaryModelParameters, PlattCalibrator)), CalibratedModelParametersBase(Of LinearBinaryModelParameters, PlattCalibrator))

Vererbung: Object

TrainerEstimatorBase<TTransformer,TModel>

LbfgsTrainerBase<LbfgsLogisticRegressionBinaryTrainer.Options,BinaryPredictionTransformer<CalibratedModelParametersBase<LinearBinaryModelParameters,PlattCalibrator>>,CalibratedModelParametersBase<LinearBinaryModelParameters,PlattCalibrator>>
LbfgsLogisticRegressionBinaryTrainer

Hinweise

Um diesen Trainer zu erstellen, verwenden Sie LbfgsLogisticRegression oder LbfgsLogisticRegression(Options).

Eingabe- und Ausgabespalten

Die Daten in der Spalte für die Eingabezeichnung müssen Boolean sein. Die Spaltendaten der Eingabefeatures müssen ein bekannter Vektor sein Single.

Der Trainer gibt folgende Spalten aus:

Name der Ausgabespalte	Spaltentyp	BESCHREIBUNG
`Score`	Single	Die ungebundene Bewertung, die vom Modell berechnet wurde.
`PredictedLabel`	Boolean	Der vorhergesagte Bezeichnung, basierend auf dem Abzeichnen der Bewertung. Eine negative Bewertung wird `false` und eine positive Bewertung wird `true` zugeordnet.
`Probability`	Single	Die Wahrscheinlichkeit, die durch die Kalibrierung des Werts "true" als Bezeichnung berechnet wird. Der Wahrscheinlichkeitswert befindet sich im Bereich [0, 1].

Trainereigenschaften


ML-Aufgabe	Binäre Klassifizierung
Ist normalisierung erforderlich?	Yes
Ist zwischenspeichern erforderlich?	No
Erforderliches NuGet zusätzlich zu Microsoft.ML	Keine
Exportierbar in ONNX	Yes

Bewertungsfunktion

Lineare logistische Regression ist eine Variante des linearen Modells. Es ordnet featurevektor $\textbf{x} \in {\mathbb R}^n$ zu einem Skalar über $\hat{y}\left( \textbf{x} \right) = \textbf{w}^T \textbf{x} + b = \sum_{j=1}^n w_j x_j + b$, wobei $x_j$ der wert des $j$-th-Features ist, ist das $j$-th-Element von $\textbf{w}$ der $j$-th-Featurekoeffizienten, und $b$ ist eine lernbare Verzerrung. Die entsprechende Wahrscheinlichkeit des Abrufens einer echten Bezeichnung lautet $\frac{1}{1 + e^{\hat{y}\left( \textbf{x} \right)}}$.

Details des Schulungsalgorithmus

Die implementierte Optimierungstechnik basiert auf der begrenzten Speichermethode Broyden-Fletcher-Goldfarb-Shanno(L-BFGS). L-BFGS ist eine Quasi-Newton-Methode , die die kostenintensive Berechnungskosten der Hessischen Matrix durch eine Annäherung ersetzt, aber dennoch eine schnelle Konvergenzrate wie die Newton-Methode genießt, bei der die vollständige Hessische Matrix berechnet wird. Da die L-BFGS-Annäherung nur eine begrenzte Menge historischer Zustände verwendet, um die nächste Schrittrichtung zu berechnen, eignet es sich besonders für Probleme mit hochdimensionalen Featurevektoren. Die Anzahl der historischen Zustände ist ein benutzerdefinierter Parameter, der eine größere Zahl verwendet, kann zu einer besseren Annäherung an die hessische Matrix führen, aber auch eine höhere Berechnungskosten pro Schritt.

Regularisierung ist eine Methode, die ein unaufgehängtes Problem durch Einschränkungen, die Informationen bereitstellen, um die Daten zu ergänzen, und die verhindert, dass die Höhe des Modells in der Regel von einigen Normfunktionen überlastet wird. Dadurch kann die Generalisierung des erlernten Modells verbessert werden, indem die optimale Komplexität im Kompromiss zwischen Voreingenommenheit und Varianz ausgewählt wird. Regularisierung funktioniert, indem die Strafterme, die mit Koeffizientenwerten verbunden sind, zum Fehler der Hypothese hinzufügt werden. Ein genaues Modell mit extremen Koeffizientenwerten würde stärker mit Straftermen belegt, während ein weniger genaues Modell mit konservativeren Werten weniger mit Straftermen belegt würde.

Dieser Lerner unterstützt die flexible Netznormalisierung: eine lineare Kombination aus L1-Norm (LASSO), $|| \textbf{w} || _1$, und L2-Norm (Ridge), $|| \textbf{w} || _2^2$ Regularisierungen. L1-Norm- und L2-Norm-Regularisierungen haben unterschiedliche Auswirkungen und Verwendungen, die sich in bestimmten Aspekten ergänzen. Die Verwendung von L1-Norm kann die Sparsität des trainierten $\textbf{w}$erhöhen. Beim Arbeiten mit hochdimensionalen Daten verkleinern sie kleine Gewichtungen von irrelevanten Features auf 0 und daher werden keine Ressourcen bei der Erstellung von Vorhersagen auf diese schlechten Features aufgewendet. Wenn die L1-Norm-Regularisierung verwendet wird, ist der Schulungsalgorithmus OWL-QN. Die L2-Norm-Regularisierung ist für Daten bevorzugt, die nicht gering sind und die Existenz großer Gewichte weitgehend bestraft.

Eine aggressive Regularisierung (d. h. das Zuweisen großer Koeffizienten zu L1-Norm- oder L2-Norm-Regularisierungsbedingungen) kann die Prädiktivkapazität beeinträchtigen, indem wichtige Variablen aus dem Modell ausgeschlossen werden. Daher ist die Auswahl der richtigen Regularisierungskoeffizienten bei der Anwendung der logistischen Regression wichtig.

Überprüfen Sie den Abschnitt "Siehe auch", um Links zu Verwendungsbeispielen zu finden.

Felder

FeatureColumn	Die Featurespalte, die der Trainer erwartet. (Geerbt von TrainerEstimatorBase<TTransformer,TModel>)
LabelColumn	Die Beschriftungsspalte, die der Trainer erwartet. Kann sein `null`, was angibt, dass bezeichnung nicht für Schulungen verwendet wird. (Geerbt von TrainerEstimatorBase<TTransformer,TModel>)
WeightColumn	Die Gewichtungsspalte, die der Trainer erwartet. Kann sein `null`, was angibt, dass Gewicht nicht für die Schulung verwendet wird. (Geerbt von TrainerEstimatorBase<TTransformer,TModel>)

Eigenschaften

Info	Das IEstimator<TTransformer> Ziel mithilfe eines linearen logistischen Regressionsmodells, das mit der L-BFGS-Methode trainiert wurde, vorherzusagen. (Geerbt von LbfgsTrainerBase<TOptions,TTransformer,TModel>)

Methoden

Fit(IDataView)	Züge und gibt einen ITransformer. (Geerbt von TrainerEstimatorBase<TTransformer,TModel>)
Fit(IDataView, LinearModelParameters)	Setzt die Schulung einer LbfgsLogisticRegressionBinaryTrainer bereits trainierten `modelParameters` Und gibt eine BinaryPredictionTransformer<TModel>.
GetOutputSchema(SchemaShape)	Das IEstimator<TTransformer> Ziel mithilfe eines linearen logistischen Regressionsmodells, das mit der L-BFGS-Methode trainiert wurde, vorherzusagen. (Geerbt von TrainerEstimatorBase<TTransformer,TModel>)

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie einen "Zwischenspeicherungsprüfpunkt" an die Schätzkette an. Dadurch wird sichergestellt, dass die nachgelagerten Schätzer anhand zwischengespeicherter Daten trainiert werden. Es ist hilfreich, einen Cache-Prüfpunkt vor Trainern zu haben, die mehrere Datendurchläufe übernehmen.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Wenn sie eine Schätzung erhalten, geben Sie ein Umbruchobjekt zurück, das einen Delegaten aufruft, sobald Fit(IDataView) er aufgerufen wird. Es ist häufig wichtig, dass ein Schätzer Informationen darüber zurückgibt, was passt, weshalb die Fit(IDataView) Methode ein speziell typiertes Objekt zurückgibt, anstatt nur ein allgemeines ITransformerObjekt zurückzugeben. IEstimator<TTransformer> Gleichzeitig werden jedoch häufig Pipelines mit vielen Objekten gebildet, daher müssen wir möglicherweise eine Kette von Schätzern erstellen, über EstimatorChain<TLastTransformer> die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette begraben wird. Für dieses Szenario können wir über diese Methode eine Stellvertretung anfügen, die aufgerufen wird, sobald sie aufgerufen wird.

Gilt für: