TextCatalog クラス

リファレンス

定義

名前空間:: Microsoft.ML

アセンブリ:: Microsoft.ML.Transforms.dll

パッケージ:: Microsoft.ML v3.0.1

パッケージ:: Microsoft.ML v1.0.0

パッケージ:: Microsoft.ML v1.1.0

パッケージ:: Microsoft.ML v1.2.0

パッケージ:: Microsoft.ML v1.3.1

パッケージ:: Microsoft.ML v1.4.0

パッケージ:: Microsoft.ML v1.5.5

パッケージ:: Microsoft.ML v1.6.0

パッケージ:: Microsoft.ML v1.7.0

パッケージ:: Microsoft.ML v2.0.0

重要

一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。

の拡張メソッドの TransformsCatalogコレクション。

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

継承: Object
TextCatalog

メソッド

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	を WordEmbeddingEstimator作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクトルに変換するテキスト特徴付け器です。
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	WordEmbeddingEstimatorを作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクターに変換するテキスト特徴付け器です。
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	テキスト列を TextFeaturizingEstimator、n-gram と char-gram の正規化されたカウントを表す特徴付きベクター Single に変換するを作成します。
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	を TextFeaturizingEstimator作成します。これにより、テキスト列が、n-gram と char-gram の正規化されたカウントを表すの特徴付きベクター Single に変換されます。
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	LatentDirichletAllocationEstimator LightLDA を使用してテキスト (floats のベクターとして表される) を、特定された各トピックとのテキストのSingle類似性を示すベクターに変換するを作成します。
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	必要に応じて大文字と小文字を TextNormalizingEstimator変更して受信テキスト `inputColumnName` を正規化し、ダイアクリティカルマーク、句読点、数字を削除し、新しいテキストをとして `outputColumnName`出力するを作成します。
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	で NgramHashingEstimator指定された `inputColumnName` 列から新しい列にデータをコピーし、 `outputColumnName` ハッシュされた n-gram の数のベクトルを生成するを作成します。
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	で NgramHashingEstimator指定された `inputColumnNames` 複数の列から新しい列にデータを受け取り、 `outputColumnName` ハッシュされた n-gram の数のベクトルを生成するを作成します。
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	で WordHashBagEstimator指定された `inputColumnName` 列を、という名前 `outputColumnName`の新しい列でハッシュされた n-gram の数のベクターにマップするを作成します。
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	で WordHashBagEstimator指定された `inputColumnNames` 複数の列をという名前 `outputColumnName`の新しい列にハッシュされた n-gram の数のベクトルにマップするを作成します。
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	入力テキストで NgramExtractingEstimator 検出された n-gram (連続する単語のシーケンス) の数のベクトルを生成するを作成します。
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	で WordBagEstimator指定された `inputColumnName` 列をという名前 `outputColumnName`の新しい列の n-gram カウントのベクターにマップするを作成します。
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	で WordBagEstimator指定された `inputColumnName` 列をという名前 `outputColumnName`の新しい列の n-gram カウントのベクターにマップするを作成します。
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	で WordBagEstimator指定された `inputColumnNames` 複数の列をという名前 `outputColumnName`の新しい列の n-gram カウントのベクターにマップするを作成します。
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	で CustomStopWordsRemovingEstimator指定された `inputColumnName` 列から新しい列にデータをコピーし、 `outputColumnName` に固有のテキストセットを削除する `language` を作成します。
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	でCustomStopWordsRemovingEstimator指定された列から新しい`outputColumnName`列にデータをコピーし、で`inputColumnNamestopwords`指定されたテキストを削除するを作成します。
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	スライディングウィンドウを TokenizingByCharactersEstimator使用してテキストを文字のシーケンスに分割してトークン化するを作成します。
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	を WordTokenizingEstimator作成します。これにより、区切り記号としてを使用して入力テキストが `separators` トークン化されます。

適用対象

TextCatalog クラス

定義

メソッド

適用対象

フィードバック

その他のリソース