Share via


NGramTokenizer interface

入力が指定サイズの n グラムにトークン化されます。 このトークナイザーは、Apache Lucene を使用して実装されます。

Extends

プロパティ

maxGram

最大 n グラムの長さ。 既定値は 2 です。 最大値は 300 です。

minGram

n グラムの最小長。 既定値は 1 です。 最大値は 300 です。 maxGram の値より小さくする必要があります。

odatatype

ポリモーフィック判別器。このオブジェクトで使用できるさまざまな型を指定します。

tokenChars

トークンに保持する文字クラス。

継承されたプロパティ

name

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

プロパティの詳細

maxGram

最大 n グラムの長さ。 既定値は 2 です。 最大値は 300 です。

maxGram?: number

プロパティ値

number

minGram

n グラムの最小長。 既定値は 1 です。 最大値は 300 です。 maxGram の値より小さくする必要があります。

minGram?: number

プロパティ値

number

odatatype

ポリモーフィック判別器。このオブジェクトで使用できるさまざまな型を指定します。

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

プロパティ値

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

トークンに保持する文字クラス。

tokenChars?: TokenCharacterKind[]

プロパティ値

継承されたプロパティの詳細

name

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

name: string

プロパティ値

string

BaseLexicalTokenizer.name から継承