microsoftml.count_select: Featureauswahl basierend auf Anzahl

Verwendung

microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)

BESCHREIBUNG

Wählt die Features aus, für die die Anzahl der nicht standardmäßigen Werte größer oder gleich einem Schwellenwert ist.

Details

Bei Verwendung des Zählmodus in der Transformation zur Auswahl von Features wird ein Feature ausgewählt, wenn die Anzahl der Beispiele mindestens die angegebene Anzahl von Beispielen mit nicht standardmäßigen Werten im Feature aufweist. Die Transformation zur Auswahl von Features im Zählmodus ist sehr nützlich, wenn sie zusammen mit einer kategorischen Hashtransformation angewendet wird (siehe auch categorical_hash). Die anzahlbasierte Auswahl von Features kann die von der Hashtransformation generierten Features entfernen, die in den Beispielen keine Daten enthalten.

Argumente

cols

Gibt eine Zeichenfolge oder Liste mit den Namen der auszuwählenden Variablen an.

count

Der Schwellenwert für die anzahlbasierte Featureauswahl. Ein Feature wird unter der Voraussetzung ausgewählt, dass mindestens count Beispiele einen nicht standardmäßigen Wert für das Feature aufweisen. Der Standardwert ist 1.

kargs

Zusätzliche Argumente, die an die Compute-Engine gesendet werden.

Gibt zurück

Ein Objekt, das die Transformation definiert.

Siehe auch

mutualinformation_select