TransformsCatalog.TextTransforms Klasse

Referenz

Definition

Namespace:: Microsoft.ML

Assembly:: Microsoft.ML.Data.dll

Paket:: Microsoft.ML v3.0.1

Paket:: Microsoft.ML v1.0.0

Paket:: Microsoft.ML v1.1.0

Paket:: Microsoft.ML v1.2.0

Paket:: Microsoft.ML v1.3.1

Paket:: Microsoft.ML v1.4.0

Paket:: Microsoft.ML v1.5.5

Paket:: Microsoft.ML v1.6.0

Paket:: Microsoft.ML v1.7.0

Paket:: Microsoft.ML v2.0.0

Wichtig

Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.

Klasse, die von verwendet wird MLContext , um Instanzen von Textdatentransformationskomponenten zu erstellen.

public sealed class TransformsCatalog.TextTransforms

type TransformsCatalog.TextTransforms = class

Public NotInheritable Class TransformsCatalog.TextTransforms

Vererbung: Object
TransformsCatalog.TextTransforms

Erweiterungsmethoden

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Erstellen Sie eine WordEmbeddingEstimator, bei der es sich um einen Textfeaturizer handelt, der einen Textvektor mithilfe vortrainierter Einbettungsmodelle in einen numerischen Vektor konvertiert.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Erstellen Sie eine WordEmbeddingEstimator, bei der es sich um einen Text featurizer handelt, der Textvektoren mithilfe von vortrainierten Einbettungsmodellen in numerische Vektoren konvertiert.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Erstellen Sie eine TextFeaturizingEstimator, die eine Textspalte in einen featurisierten Vektor von transformiert, der Single normalisierte Zähler von n-Gramm und Char-Gramm darstellt.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Erstellen Sie eine TextFeaturizingEstimator, die eine Textspalte in einen featurisierten Vektor von transformiert, der Single normalisierte Zähler von n-Gramm und Char-Gramm darstellt.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Erstellen Sie eine LatentDirichletAllocationEstimator, die LightLDA verwendet, um Text (dargestellt als Vektor von Floats) in einen Vektor zu transformieren, Single der die Ähnlichkeit des Texts mit jedem identifizierten Thema angibt.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Erstellt eine TextNormalizingEstimator, die eingehenden Text in `inputColumnName` normalisiert, indem die Groß-/Kleinschreibung optional geändert wird, diakritische Markierungen, Satzzeichen, Zahlen entfernt und neuer Text als `outputColumnName`ausgegeben wird.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Erstellen Sie einen NgramHashingEstimator, der die Daten aus der in angegebenen Spalte in `inputColumnName` eine neue Spalte kopiert und `outputColumnName` einen Vektor der Anzahl von n-Gramm-Hashs erzeugt.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Erstellen Sie einen NgramHashingEstimator, der die Daten aus den in angegebenen `inputColumnNames` spalten in einer neuen Spalte `outputColumnName` übernimmt und einen Vektor der Anzahl von n-Gramm-Hashs erzeugt.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Erstellen Sie eine WordHashBagEstimator, die die in `inputColumnName` angegebene Spalte einem Vektor von n-Gramm-Hashs in einer neuen Spalte namens `outputColumnName`zuordnet.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Erstellen Sie ein WordHashBagEstimator, das die in angegebenen `inputColumnNames` spalten einem Vektor von n-Gramm-Hashwert in einer neuen Spalte namens `outputColumnName`zuordnet.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Erstellt einen NgramExtractingEstimator , der einen Vektor der Anzahl von n-Grammen (Sequenzen aufeinanderfolgender Wörter) erzeugt, die im Eingabetext gefunden werden.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Erstellen Sie ein WordBagEstimator, das die in `inputColumnName` angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens `outputColumnName`zuordnet.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Erstellen Sie ein WordBagEstimator, das die in `inputColumnName` angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens `outputColumnName`zuordnet.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Erstellen Sie ein WordBagEstimator, das die in `inputColumnNames` angegebenen spalten einem Vektor der n-Gramm-Anzahl in einer neuen Spalte namens `outputColumnName`zuordnet.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Erstellen Sie einen CustomStopWordsRemovingEstimator, der die Daten aus der in angegebenen Spalte in `inputColumnName` eine neue Spalte kopiert und `outputColumnName` einen vordefinierten Textsatz entfernt, für den spezifisch ist `language` .
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Erstellen Sie einen CustomStopWordsRemovingEstimator, der die Daten aus der in angegebenen Spalte in `inputColumnName` eine neue Spalte `outputColumnName` kopiert und den in `stopwords` angegebenen Text daraus entfernt.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Erstellen Sie eine TokenizingByCharactersEstimator, die tokenisiert, indem Sie Text mithilfe eines gleitenden Fensters in Zeichensequenzen aufteilen.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Erstellen Sie eine WordTokenizingEstimator, die Eingabetext mithilfe von `separators` Trennzeichen tokenisiert.

Gilt für:

TransformsCatalog.TextTransforms Klasse

Definition

Erweiterungsmethoden

Gilt für:

Feedback

Zusätzliche Ressourcen