Поделиться через


TextCatalog Класс

Определение

Коллекция методов расширения для TransformsCatalog.

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
Наследование
TextCatalog

Методы

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

WordEmbeddingEstimatorСоздайте объект , который является текстовым признаком, преобразующим векторы текста в числовые с помощью предварительно обученных моделей внедрения.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimatorСоздайте , который является текстовым признаком, который преобразует вектор текста в числовой вектор с помощью предварительно обученных моделей внедрения.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Создайте TextFeaturizingEstimator, преобразующий текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и символов.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и char-граммов.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Создайте LatentDirichletAllocationEstimatorобъект , который использует LightLDA для преобразования текста (представленного в виде вектора с плавающей точкой) в вектор Single , указывающий на сходство текста с каждой идентифицируемой темой.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

TextNormalizingEstimatorСоздает объект , который нормализует входящий текст в inputColumnName , при необходимости изменяя регистр, удаляя диакритические знаки, знаки препинания, числа и выводя новый текст в виде outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Создайте NgramHashingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и создает вектор количества хэшированных n-граммов.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Создайте NgramHashingEstimatorобъект , который принимает данные из нескольких столбцов, указанных в , в inputColumnNames новый столбец: outputColumnName и создает вектор количества хэшированных n-граммов.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Создайте WordHashBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором количества хэшированных n-граммов в новом столбце с именем outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Создайте WordHashBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором количества хэшированных n-граммов в новом столбце с именем outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создает объект , NgramExtractingEstimator который создает вектор количества n-граммов (последовательностей последовательных слов), встречающихся во входном тексте.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором n-граммов в новом столбце с именем outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и удаляет из него предопределенный набор текста language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и удаляет из него текст, указанный в stopwords .

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Создайте TokenizingByCharactersEstimatorобъект , который выполняет токенизацию путем разделения текста на последовательности символов с помощью скользящего окна.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Создайте WordTokenizingEstimatorобъект , который токенизирует входной текст, используя в separators качестве разделителей.

Применяется к