microsoftml.count_select : sélectionne les caractéristiques en fonction du nombre

Usage

microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)

Description

Sélectionne les caractéristiques pour lesquelles le nombre de valeurs autres que les valeurs par défaut est supérieur ou égal à un seuil.

Détails

Lorsque vous utilisez le mode de comptage dans la transformation de sélection de caractéristiques, une caractéristique est sélectionnée si le nombre d’exemples possède au moins le nombre spécifié d’exemples de valeurs explicites (autres que les valeurs par défaut) dans la caractéristique. La transformation de sélection de caractéristiques du mode de comptage est très utile lorsqu’elle est appliquée avec une transformation de hachage catégorique (voir aussi categorical_hash). La sélection de caractéristiques du mode de comptage peut supprimer les caractéristiques générées par la transformation de hachage n’ayant pas de données dans les exemples.

Arguments

cols

Spécifie la chaîne de caractères ou la liste des noms des variables à sélectionner.

count

Seuil pour la sélection des caractéristiques en fonction de la valeur de comptage. Une caractéristique est sélectionnée si et seulement si elle comporte une valeur autre que la valeur par défaut dans au moins count des exemples. La valeur par défaut est 1.

kargs

Arguments supplémentaires envoyés au moteur de calcul.

Retours

Objet définissant la transformation.

Voir aussi

mutualinformation_select