Partilhar via


Microsoft.ML.Transforms.Text Namespace

Namespace contendo componentes de transformação de dados de texto.

Classes

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

Use o removedores de palavras stop que podem remover a lista específica de linguagem de palavras de parada (palavras mais comuns) já definidas no sistema.

CustomStopWordsRemovingTransformer

ITransformer resultante da montagem de um CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

A transformação LDA implementa o LightLDA, uma implementação de última geração da Alocação de Dirichlet Latente.

LatentDirichletAllocationTransformer

ITransformer resultante da montagem de um LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Forneça detalhes sobre os tópicos descobertos pelo LightLDA.

NgramExtractingEstimator

Produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.

NgramExtractingTransformer

ITransformer resultante da montagem de um NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer> para o NgramHashingTransformer.

NgramHashingTransformer

Namespace contendo componentes de transformação de dados de texto.

StopWordsRemovingEstimator

IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

Use o removedores de palavras stop que podem remover a lista específica de idioma de palavras irrelevantes (palavras mais comuns) já definidas no sistema.

StopWordsRemovingTransformer

ITransformer resultante da montagem de um StopWordsRemovingEstimator.

TextFeaturizingEstimator

Um estimador que transforma uma coleção de documentos de texto em vetores de recursos numéricos. Os vetores de recurso são contagens normalizadas de n-gramas de palavra e/ou caractere (com base nas opções fornecidas).

TextFeaturizingEstimator.Options

Opções avançadas para o TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer> para o TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer resultante da montagem de um TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer> para o TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer resultante da montagem de um TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer> para o ITransformer.

WordBagEstimator.Options

Opções de como os n-gramas são extraídos.

WordEmbeddingEstimator

Recurso de texto que converte vetores de tokens de texto em um vetor numérico usando um modelo de incorporações pré-treinado.

WordEmbeddingTransformer

ITransformer resultante da montagem de um WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer> para o ITransformer.

WordTokenizingEstimator

Tokeniza o texto de entrada usando delimitadores especificados.

WordTokenizingTransformer

ITransformer resultante da montagem de um WordTokenizingEstimator.

Estruturas

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Namespace contendo componentes de transformação de dados de texto.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Namespace contendo componentes de transformação de dados de texto.

Interfaces

IStopWordsRemoverOptions

Define o tipo diferente de removedores de palavras de parada com suporte.

Enumerações

NgramExtractingEstimator.WeightingCriteria

Uma medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus. Essa enumeração é serializada.

StopWordsRemovingEstimator.Language

Linguagem stopwords. Essa enumeração é serializada.

TextFeaturizingEstimator.Language

Linguagem de texto. Essa enumeração é serializada.

TextFeaturizingEstimator.NormFunction

Tipo de normalizador de vetor de texto.

TextNormalizingEstimator.CaseMode

Modo de normalização de maiúsculas e minúsculas de texto. Essa enumeração é serializada.

WordEmbeddingEstimator.PretrainedModelKind

Especifica quais inserções de palavra usar.