Поделиться через


ClassicTokenizer interface

Грамматический создатель маркеров, который подходит для обработки большинства документов на европейском языке. Этот создатель маркеров реализуется с помощью Apache Lucene.

Extends

Свойства

maxTokenLength

Максимальная длина маркера. Значение по умолчанию — 255. Маркеры, размер которых превышает максимальную длину, разделяются. Максимальная длина маркера, которую можно использовать, составляет 300 символов.

odatatype

Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.

Унаследованные свойства

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

Сведения о свойстве

maxTokenLength

Максимальная длина маркера. Значение по умолчанию — 255. Маркеры, размер которых превышает максимальную длину, разделяются. Максимальная длина маркера, которую можно использовать, составляет 300 символов.

maxTokenLength?: number

Значение свойства

number

odatatype

Полиморфный дискриминатор, который указывает различные типы, которые могут быть у этого объекта.

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

Значение свойства

"#Microsoft.Azure.Search.ClassicTokenizer"

Сведения об унаследованном свойстве

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

name: string

Значение свойства

string

Наследуется отBaseLexicalTokenizer.name