Share via


DictionaryDecompounderTokenFilter interface

Zerlegt zusammengesetzte Wörter, die in vielen germanischen Sprachen vorkommen. Dieser Tokenfilter wird mit Apache Lucene implementiert.

Extends

Eigenschaften

maxSubwordSize

Die maximale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die kürzer sind. Der Standardwert ist 15. Der Höchstwert ist 300.

minSubwordSize

Die minimale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die länger sind. Standard ist 2. Der Höchstwert ist 300.

minWordSize

Die minimale Wortgröße. Nur Wörter, die länger sind, werden verarbeitet. Der Standardwert ist 5. Der Höchstwert ist 300.

odatatype

Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

onlyLongestMatch

Ein Wert, der angibt, ob der Ausgabe nur das längste übereinstimmende Unterwort hinzugefügt werden soll. Der Standardwert ist "false".

wordList

Die Liste der Wörter, mit der abgeglichen werden soll.

Geerbte Eigenschaften

name

Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

Details zur Eigenschaft

maxSubwordSize

Die maximale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die kürzer sind. Der Standardwert ist 15. Der Höchstwert ist 300.

maxSubwordSize?: number

Eigenschaftswert

number

minSubwordSize

Die minimale Unterwortgröße. Es werden nur Unterwörter ausgegeben, die länger sind. Standard ist 2. Der Höchstwert ist 300.

minSubwordSize?: number

Eigenschaftswert

number

minWordSize

Die minimale Wortgröße. Nur Wörter, die länger sind, werden verarbeitet. Der Standardwert ist 5. Der Höchstwert ist 300.

minWordSize?: number

Eigenschaftswert

number

odatatype

Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"

Eigenschaftswert

"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"

onlyLongestMatch

Ein Wert, der angibt, ob der Ausgabe nur das längste übereinstimmende Unterwort hinzugefügt werden soll. Der Standardwert ist "false".

onlyLongestMatch?: boolean

Eigenschaftswert

boolean

wordList

Die Liste der Wörter, mit der abgeglichen werden soll.

wordList: string[]

Eigenschaftswert

string[]

Geerbte Eigenschaftsdetails

name

Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

name: string

Eigenschaftswert

string

Geerbt vonBaseTokenFilter.name