TransformsCatalog.TextTransforms Klasse

Definition

Klasse, die von verwendet wird MLContext , um Instanzen von Textdatentransformationskomponenten zu erstellen.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Vererbung
TransformsCatalog.TextTransforms

Erweiterungsmethoden

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Erstellen Sie eine WordEmbeddingEstimator, bei der es sich um einen Textfeaturizer handelt, der einen Textvektor mithilfe vortrainierter Einbettungsmodelle in einen numerischen Vektor konvertiert.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Erstellen Sie eine WordEmbeddingEstimator, bei der es sich um einen Text featurizer handelt, der Textvektoren mithilfe von vortrainierten Einbettungsmodellen in numerische Vektoren konvertiert.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Erstellen Sie eine TextFeaturizingEstimator, die eine Textspalte in einen featurisierten Vektor von transformiert, der Single normalisierte Zähler von n-Gramm und Char-Gramm darstellt.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Erstellen Sie eine TextFeaturizingEstimator, die eine Textspalte in einen featurisierten Vektor von transformiert, der Single normalisierte Zähler von n-Gramm und Char-Gramm darstellt.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Erstellen Sie eine LatentDirichletAllocationEstimator, die LightLDA verwendet, um Text (dargestellt als Vektor von Floats) in einen Vektor zu transformieren, Single der die Ähnlichkeit des Texts mit jedem identifizierten Thema angibt.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Erstellt eine TextNormalizingEstimator, die eingehenden Text in inputColumnName normalisiert, indem die Groß-/Kleinschreibung optional geändert wird, diakritische Markierungen, Satzzeichen, Zahlen entfernt und neuer Text als outputColumnNameausgegeben wird.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Erstellen Sie einen NgramHashingEstimator, der die Daten aus der in angegebenen Spalte in inputColumnName eine neue Spalte kopiert und outputColumnName einen Vektor der Anzahl von n-Gramm-Hashs erzeugt.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Erstellen Sie einen NgramHashingEstimator, der die Daten aus den in angegebenen inputColumnNames spalten in einer neuen Spalte outputColumnName übernimmt und einen Vektor der Anzahl von n-Gramm-Hashs erzeugt.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Erstellen Sie eine WordHashBagEstimator, die die in inputColumnName angegebene Spalte einem Vektor von n-Gramm-Hashs in einer neuen Spalte namens outputColumnNamezuordnet.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Erstellen Sie ein WordHashBagEstimator, das die in angegebenen inputColumnNames spalten einem Vektor von n-Gramm-Hashwert in einer neuen Spalte namens outputColumnNamezuordnet.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellt einen NgramExtractingEstimator , der einen Vektor der Anzahl von n-Grammen (Sequenzen aufeinanderfolgender Wörter) erzeugt, die im Eingabetext gefunden werden.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Erstellen Sie ein WordBagEstimator, das die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens outputColumnNamezuordnet.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie ein WordBagEstimator, das die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens outputColumnNamezuordnet.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie ein WordBagEstimator, das die in inputColumnNames angegebenen spalten einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens outputColumnNamezuordnet.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Erstellen Sie einen CustomStopWordsRemovingEstimator, der die Daten aus der in angegebenen Spalte in inputColumnName eine neue Spalte kopiert und outputColumnName einen vordefinierten Textsatz entfernt, für den spezifisch ist language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Erstellen Sie einen CustomStopWordsRemovingEstimator, der die Daten aus der in angegebenen Spalte in inputColumnName eine neue Spalte outputColumnName kopiert und den in stopwords angegebenen Text daraus entfernt.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Erstellen Sie eine TokenizingByCharactersEstimator, die tokenisiert, indem Sie Text mithilfe eines gleitenden Fensters in Zeichensequenzen aufteilen.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Erstellen Sie eine WordTokenizingEstimator, die Eingabetext mithilfe von separators Trennzeichen tokenisiert.

Gilt für: