Share via


CjkBigramTokenFilter interface

Bildet Bigrams von CJK-Begriffen, die aus dem Standardtokenizer generiert werden. Dieser Tokenfilter wird mithilfe von Apache Lucene implementiert.

Extends

Eigenschaften

ignoreScripts

Die zu ignorierenden Skripts.

odatatype

Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

outputUnigrams

Ein Wert, der angibt, ob sowohl Unigramme als auch Bigrams (wenn true) oder nur Bigrams (wenn false) ausgegeben werden sollen. Der Standardwert ist "false".

Geerbte Eigenschaften

name

Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

Details zur Eigenschaft

ignoreScripts

Die zu ignorierenden Skripts.

ignoreScripts?: CjkBigramTokenFilterScripts[]

Eigenschaftswert

odatatype

Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"

Eigenschaftswert

"#Microsoft.Azure.Search.CjkBigramTokenFilter"

outputUnigrams

Ein Wert, der angibt, ob sowohl Unigramme als auch Bigrams (wenn true) oder nur Bigrams (wenn false) ausgegeben werden sollen. Der Standardwert ist "false".

outputUnigrams?: boolean

Eigenschaftswert

boolean

Geerbte Eigenschaftsdetails

name

Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

name: string

Eigenschaftswert

string

Geerbt vonBaseTokenFilter.name