CjkBigramTokenFilter interface
Bildet Bigrams von CJK-Begriffen, die aus dem Standardtokenizer generiert werden. Dieser Tokenfilter wird mithilfe von Apache Lucene implementiert.
- Extends
Eigenschaften
ignore |
Die zu ignorierenden Skripts. |
odatatype | Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann |
output |
Ein Wert, der angibt, ob sowohl Unigramme als auch Bigrams (wenn true) oder nur Bigrams (wenn false) ausgegeben werden sollen. Der Standardwert ist "false". |
Geerbte Eigenschaften
name | Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. |
Details zur Eigenschaft
ignoreScripts
Die zu ignorierenden Skripts.
ignoreScripts?: CjkBigramTokenFilterScripts[]
Eigenschaftswert
odatatype
Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
odatatype: "#Microsoft.Azure.Search.CjkBigramTokenFilter"
Eigenschaftswert
"#Microsoft.Azure.Search.CjkBigramTokenFilter"
outputUnigrams
Ein Wert, der angibt, ob sowohl Unigramme als auch Bigrams (wenn true) oder nur Bigrams (wenn false) ausgegeben werden sollen. Der Standardwert ist "false".
outputUnigrams?: boolean
Eigenschaftswert
boolean
Geerbte Eigenschaftsdetails
name
Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.
name: string
Eigenschaftswert
string
Geerbt vonBaseTokenFilter.name