TextCatalog Класс

Ссылка

Определение

Пространство имен:: Microsoft.ML

Сборка:: Microsoft.ML.Transforms.dll

Пакет:: Microsoft.ML v3.0.1

Пакет:: Microsoft.ML v1.0.0

Пакет:: Microsoft.ML v1.1.0

Пакет:: Microsoft.ML v1.2.0

Пакет:: Microsoft.ML v1.3.1

Пакет:: Microsoft.ML v1.4.0

Пакет:: Microsoft.ML v1.5.5

Пакет:: Microsoft.ML v1.6.0

Пакет:: Microsoft.ML v1.7.0

Пакет:: Microsoft.ML v2.0.0

Важно!

Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.

Коллекция методов расширения для TransformsCatalog.

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

Наследование: Object
TextCatalog

Методы

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	WordEmbeddingEstimatorСоздайте объект , который является текстовым признаком, преобразующим векторы текста в числовые с помощью предварительно обученных моделей внедрения.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	WordEmbeddingEstimatorСоздайте , который является текстовым признаком, который преобразует вектор текста в числовой вектор с помощью предварительно обученных моделей внедрения.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Создайте TextFeaturizingEstimator, преобразующий текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и символов.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и char-граммов.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Создайте LatentDirichletAllocationEstimatorобъект , который использует LightLDA для преобразования текста (представленного в виде вектора с плавающей точкой) в вектор Single , указывающий на сходство текста с каждой идентифицируемой темой.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	TextNormalizingEstimatorСоздает объект , который нормализует входящий текст в `inputColumnName` , при необходимости изменяя регистр, удаляя диакритические знаки, знаки препинания, числа и выводя новый текст в виде `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Создайте NgramHashingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и создает вектор количества хэшированных n-граммов.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Создайте NgramHashingEstimatorобъект , который принимает данные из нескольких столбцов, указанных в , в `inputColumnNames` новый столбец: `outputColumnName` и создает вектор количества хэшированных n-граммов.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Создайте WordHashBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором количества хэшированных n-граммов в новом столбце с именем `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Создайте WordHashBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , `inputColumnNames` с вектором количества хэшированных n-граммов в новом столбце с именем `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создает объект , NgramExtractingEstimator который создает вектор количества n-граммов (последовательностей последовательных слов), встречающихся во входном тексте.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором n-граммов в новом столбце с именем `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором n-граммов в новом столбце с именем `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , `inputColumnNames` с вектором n-граммов в новом столбце с именем `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и удаляет из него предопределенный набор текста `language` .
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и удаляет из него текст, указанный в `stopwords` .
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Создайте TokenizingByCharactersEstimatorобъект , который выполняет токенизацию путем разделения текста на последовательности символов с помощью скользящего окна.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Создайте WordTokenizingEstimatorобъект , который токенизирует входной текст, используя в `separators` качестве разделителей.

Применяется к

Поделиться через

TextCatalog Класс

Определение

Методы

Применяется к

Обратная связь

Дополнительные ресурсы