Compartir a través de


TextCatalog.ProduceWordBags Método

Definición

Sobrecargas

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Parámetros

catalog
TransformsCatalog.TextTransforms

Catálogo de la transformación.

outputColumnName
String

Nombre de la columna resultante de la transformación de inputColumnName. El tipo de datos de esta columna será un vector de tamaño conocido de Single.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Nombre de la columna de la que se van a tomar los datos. Número máximo de n-gramas que se almacenarán en el diccionario.Separador utilizado para separar los pares de términos y frecuencias.Separador usado para separar los términos de su frecuencia. Este estimador funciona sobre el vector de texto.

maximumNgramsCount
Int32

Devoluciones

Comentarios

WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.

Se aplica a

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parámetros

catalog
TransformsCatalog.TextTransforms

Catálogo de la transformación.

outputColumnName
String

Nombre de la columna resultante de la transformación de inputColumnName. El tipo de datos de esta columna será un vector de tamaño conocido de Single.

inputColumnName
String

Nombre de la columna de la que se van a tomar los datos. Este estimador funciona sobre el vector de texto.

ngramLength
Int32

Longitud del ngrama.

skipLength
Int32

Número máximo de tokens que se omitirán al construir un n-grama.

useAllLengths
Boolean

Si se deben incluir todas las longitudes de n-gramas hasta ngramLength o solo ngramLength.

maximumNgramsCount
Int32

Número máximo de n-gramas que se almacenarán en el diccionario.

weighting
NgramExtractingEstimator.WeightingCriteria

Medida estadística utilizada para evaluar lo importante que una palabra es para un documento en un corpus.

Devoluciones

Comentarios

WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.

Se aplica a

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parámetros

catalog
TransformsCatalog.TextTransforms

Catálogo de la transformación.

outputColumnName
String

Nombre de la columna resultante de la transformación de inputColumnNames. El tipo de datos de esta columna será un vector de tamaño conocido de Single.

inputColumnNames
String[]

Nombres de las varias columnas de las que se van a tomar los datos. Este estimador funciona sobre el vector de texto.

ngramLength
Int32

Longitud del ngrama.

skipLength
Int32

Número máximo de tokens que se omitirán al construir un n-grama.

useAllLengths
Boolean

Si se deben incluir todas las longitudes de n-gramas hasta ngramLength o solo ngramLength.

maximumNgramsCount
Int32

Número máximo de n-gramas que se almacenarán en el diccionario.

weighting
NgramExtractingEstimator.WeightingCriteria

Medida estadística utilizada para evaluar lo importante que una palabra es para un documento en un corpus.

Devoluciones

Comentarios

WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.

Se aplica a