Share via


PatternTokenizer interface

Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Questo tokenizer viene implementato usando Apache Lucene.

Proprietà

flags

Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

group

Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre in token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1.

name

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

odatatype

Discriminare polimorfico

pattern

Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: \W+.

Dettagli proprietà

flags

Flag di espressione regolare. I valori possibili includono: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

flags?: RegexFlags[]

Valore della proprietà

group

Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre in token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1. Valore predefinito: -1.

group?: number

Valore della proprietà

number

name

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminare polimorfico

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Valore della proprietà

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri di spazio vuoto. Valore predefinito: \W+.

pattern?: string

Valore della proprietà

string