Share via


Microsoft.ML.Transforms.Text 名前空間

テキスト データ変換コンポーネントを含む名前空間。

クラス

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> for the CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

システムで既に定義されているストップ ワード (最も一般的な単語) の言語固有のリストを削除できるストップ ワード リムーバーを使用します。

CustomStopWordsRemovingTransformer

ITransformer 合わせ CustomStopWordsRemovingEstimatorから生じる .

LatentDirichletAllocationEstimator

LDA 変換は、潜在ディリクレ割り当ての最新の実装である LightLDA を実装します。

LatentDirichletAllocationTransformer

ITransformer 合わせ LatentDirichletAllocationEstimatorから生じる .

LatentDirichletAllocationTransformer.ModelParameters

LightLDA によって検出されたトピックの詳細を 指定します。

NgramExtractingEstimator

入力テキストで検出された n-gram (連続する単語のシーケンス) の数のベクトルを生成します。

NgramExtractingTransformer

ITransformer は、.のフィッティング NgramExtractingEstimatorによって得られる.

NgramHashingEstimator

IEstimator<TTransformer> for the NgramHashingTransformer.

NgramHashingTransformer

テキスト データ変換コンポーネントを含む名前空間。

StopWordsRemovingEstimator

IEstimator<TTransformer> for the CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

システムで既に定義されているストップ ワード (最も一般的な単語) の言語固有のリストを削除できるストップ ワード リムーバーを使用します。

StopWordsRemovingTransformer

ITransformer 合わせ StopWordsRemovingEstimatorから生じる .

TextFeaturizingEstimator

テキスト ドキュメントのコレクションを数値特徴ベクトルに変換するエスティメーター。 特徴ベクトルは、(指定されたオプションに基づいて) 単語や文字 n-gram の正規化された数です。

TextFeaturizingEstimator.Options

の詳細オプションTextFeaturizingEstimator

TextNormalizingEstimator

IEstimator<TTransformer> for the TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer 合わせ TextNormalizingEstimatorから生じる .

TokenizingByCharactersEstimator

IEstimator<TTransformer> for the TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer 合わせ TokenizingByCharactersEstimatorから生じる .

WordBagEstimator

IEstimator<TTransformer> for the ITransformer.

WordBagEstimator.Options

n グラムを抽出する方法のオプション。

WordEmbeddingEstimator

事前トレーニング済みの埋め込みモデルを使用して、テキスト トークンのベクターを数値ベクターに変換するテキスト 特徴付け器。

WordEmbeddingTransformer

ITransformer は、.のフィッティング WordEmbeddingEstimatorによって得られる.

WordHashBagEstimator

IEstimator<TTransformer> for the ITransformer.

WordTokenizingEstimator

指定した区切り記号を使用して入力テキストをトークン化します。

WordTokenizingTransformer

ITransformer は、.のフィッティング WordTokenizingEstimatorによって得られる.

構造体

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

テキスト データ変換コンポーネントを含む名前空間。

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

テキスト データ変換コンポーネントを含む名前空間。

インターフェイス

IStopWordsRemoverOptions

サポートされるさまざまな種類のストップ ワード リムーバーを定義します。

列挙型

NgramExtractingEstimator.WeightingCriteria

コーパス内の文書に対して単語がどれほど重要であるかを評価するために使用される統計的尺度。 この列挙体はシリアル化されます。

StopWordsRemovingEstimator.Language

ストップワード言語。 この列挙体はシリアル化されます。

TextFeaturizingEstimator.Language

テキスト言語。 この列挙体はシリアル化されます。

TextFeaturizingEstimator.NormFunction

テキスト ベクター ノーマライザーの種類。

TextNormalizingEstimator.CaseMode

テキストの大文字と小文字の正規化モード。 この列挙体はシリアル化されます。

WordEmbeddingEstimator.PretrainedModelKind

使用する単語の埋め込みを指定します。