Share via


CountFeatureSelectingEstimator Klasse

Definition

Wählt die Slots aus, für die die Anzahl der Nichtstandardwerte größer als oder gleich einem Schwellenwert ist.

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Vererbung
CountFeatureSelectingEstimator
Implementiert

Hinweise

Stimatoreigenschaften

Muss diese Schätzung die Daten untersuchen, um seine Parameter zu trainieren? Yes
Eingabespaltendatentyp Vektor oder Skalar von Singleoder DoubleTextdatentypen
Ausgabespaltendatentyp Identisch mit der Eingabespalte
Exportierbar in ONNX Yes

Diese Transformation verwendet eine Reihe von Aggregatoren, um die Anzahl der Werte für jeden Platz (Vektorelement) zu zählen, die nicht standardmäßig und nicht fehlen (für die Definitionen von Standard und fehlenden, siehe Abschnitt DataKind"Hinweise"). Wenn der Anzahlwert kleiner als der angegebene Anzahlparameter ist, wird dieser Steckplatz gelöscht. Diese Transformation ist nützlich, wenn sie zusammen mit einer OneHotHashEncodingTransformer. Es kann die von der Hashtransformation generierten Features entfernen, die keine Daten in den Beispielen enthalten.

Wenn wir z. B. den Anzahlparameter auf 3 festlegen und den Schätzwert anpassen, wenden Sie den Transformator auf die folgende Spalte "Features" an, wird der zweite Steckplatz angezeigt, der folgendes enthält: NaN (fehlender Wert), 5, 5, 0 (Standardwert) werte, da dieser Platz nur zwei nicht standardmäßige und nicht fehlende Werte aufweist, d. h. die beiden 5 Werte. Der dritte Platz wird beibehalten, da er die Werte 6, 6, 6, NaN aufweist; Daher hat es 3 nicht standardmäßige und nicht fehlende.

Funktionen
4,NaN,6
4,5,6
4,5,6
4,0,NaN

Dies ist, wie das obige Dataset nach der Transformation aussehen würde.

Funktionen
4,6
4,6
4,6
4,NaN

Überprüfen Sie den Abschnitt "Siehe auch", um Links zu Verwendungsbeispielen zu finden.

Methoden

Fit(IDataView)

Züge und zurückgeben eine ITransformer.

GetOutputSchema(SchemaShape)

Gibt das SchemaShape Schema zurück, das vom Transformator erzeugt wird. Wird für die Schemavermehrung und Überprüfung in einer Pipeline verwendet.

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie einen "Zwischenspeicherpunkt" an die Stimatorkette an. Dadurch wird sichergestellt, dass die nachgelagerten Stimatoren gegen zwischengespeicherte Daten trainiert werden. Es ist hilfreich, einen Cache-Prüfpunkt zu haben, bevor Trainer, die mehrere Daten übergeben.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Geben Sie aufgrund einer Schätzung ein Umbruchobjekt zurück, das einen Stellvertretung aufruft, sobald Fit(IDataView) er aufgerufen wird. Es ist oft wichtig, dass eine Schätzung Informationen zu dem zurückgibt, was passt, weshalb die Fit(IDataView) Methode ein spezifisches typiertes Objekt zurückgibt, anstatt nur ein allgemeines ITransformer. Gleichzeitig IEstimator<TTransformer> werden jedoch oft Pipelines mit vielen Objekten gebildet, sodass wir möglicherweise eine Kette von EstimatorChain<TLastTransformer> Schätzern erstellen müssen, über die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette begraben wird. Für dieses Szenario können wir über diese Methode eine Stellvertretung anfügen, die einmal aufgerufen wird, wenn die Anpassung aufgerufen wird.

Gilt für:

Weitere Informationen