Indexes - Analyze

Çözümleyicinin metni belirteçlere nasıl bölerken bunu gösterir.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2023-11-01

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Arama hizmetinin uç nokta URL'si.

indexName
path True

string

Çözümleyicinin testine yönelik dizinin adı.

api-version
query True

string

İstemci Api Sürümü.

İstek Başlığı

Name Gerekli Tür Description
x-ms-client-request-id

string

uuid

Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name Gerekli Tür Description
text True

string

Belirteçlere bölünecek metin.

analyzer

LexicalAnalyzerName

Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

charFilters

CharFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenFilters

TokenFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenizer

LexicalTokenizerName

Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

Yanıtlar

Name Tür Description
200 OK

AnalyzeResult

Other Status Codes

SearchError

Hata yanıtı.

Örnekler

SearchServiceIndexAnalyze

Sample Request

POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2023-11-01

{
  "text": "Text to analyze",
  "analyzer": "standard.lucene"
}

Sample Response

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Tanımlar

Name Description
AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkında bilgi.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

SearchError

API için bir hata koşulu açıklar.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkında bilgi.

Name Tür Description
endOffset

integer

Giriş metnindeki belirtecin son karakterinin dizini.

position

integer

Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak bazı belirteçler, örneğin birbirlerinin eş anlamlılarıysa aynı konuma sahip olabilir.

startOffset

integer

Giriş metnindeki belirtecin ilk karakterinin dizini.

token

string

Çözümleyici tarafından döndürülen belirteç.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

Name Tür Description
analyzer

LexicalAnalyzerName

Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

charFilters

CharFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

text

string

Belirteçlere bölünecek metin.

tokenFilters

TokenFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenizer

LexicalTokenizerName

Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

Name Tür Description
tokens

AnalyzedTokenInfo[]

İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name Tür Description
html_strip

string

HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name Tür Description
ar.lucene

string

Arapça için Lucene çözümleyicisi.

ar.microsoft

string

Arapça için Microsoft çözümleyicisi.

bg.lucene

string

Bulgarca için Lucene çözümleyicisi.

bg.microsoft

string

Bulgarca için Microsoft çözümleyicisi.

bn.microsoft

string

Bangla için Microsoft çözümleyicisi.

ca.lucene

string

Katalan için Lucene çözümleyicisi.

ca.microsoft

string

Katalalan için Microsoft çözümleyicisi.

cs.lucene

string

Çekçe için Lucene çözümleyicisi.

cs.microsoft

string

Çekçe için Microsoft çözümleyicisi.

da.lucene

string

Danca için Lucene çözümleyicisi.

da.microsoft

string

Danca için Microsoft çözümleyicisi.

de.lucene

string

Almanca için Lucene çözümleyicisi.

de.microsoft

string

Almanca için Microsoft çözümleyicisi.

el.lucene

string

Yunanca için Lucene çözümleyicisi.

el.microsoft

string

Yunanca için Microsoft çözümleyicisi.

en.lucene

string

İngilizce için Lucene çözümleyicisi.

en.microsoft

string

İngilizce için Microsoft çözümleyicisi.

es.lucene

string

İspanyolca için Lucene çözümleyicisi.

es.microsoft

string

İspanyolca için Microsoft çözümleyicisi.

et.microsoft

string

Estonca için Microsoft çözümleyicisi.

eu.lucene

string

Bask için Lucene çözümleyicisi.

fa.lucene

string

Farsça için Lucene çözümleyicisi.

fi.lucene

string

Fince için Lucene çözümleyicisi.

fi.microsoft

string

Fince için Microsoft çözümleyicisi.

fr.lucene

string

Fransızca için Lucene çözümleyicisi.

fr.microsoft

string

Fransızca için Microsoft çözümleyicisi.

ga.lucene

string

İrlandalı için Lucene çözümleyicisi.

gl.lucene

string

Galiçyalı için Lucene analizörü.

gu.microsoft

string

Gujarati için Microsoft çözümleyicisi.

he.microsoft

string

İbranice için Microsoft çözümleyicisi.

hi.lucene

string

Hintçe için Lucene çözümleyicisi.

hi.microsoft

string

Hintçe için Microsoft çözümleyicisi.

hr.microsoft

string

Hırvat dili için Microsoft çözümleyicisi.

hu.lucene

string

Macarca için Lucene çözümleyicisi.

hu.microsoft

string

Macarca için Microsoft çözümleyicisi.

hy.lucene

string

Ermeniler için Lucene çözümleyicisi.

id.lucene

string

Endonezya dili için Lucene çözümleyicisi.

id.microsoft

string

Endonezya dili (Bahasa) için Microsoft çözümleyicisi.

is.microsoft

string

İzlanda dili için Microsoft çözümleyicisi.

it.lucene

string

İtalyanca için Lucene çözümleyicisi.

it.microsoft

string

İtalyanca için Microsoft çözümleyicisi.

ja.lucene

string

Japonca için Lucene çözümleyicisi.

ja.microsoft

string

Japonca için Microsoft çözümleyicisi.

keyword

string

Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

string

Kannada için Microsoft çözümleyicisi.

ko.lucene

string

Korece için Lucene çözümleyicisi.

ko.microsoft

string

Korece için Microsoft çözümleyicisi.

lt.microsoft

string

Litvanca için Microsoft çözümleyicisi.

lv.lucene

string

Letonca için Lucene çözümleyicisi.

lv.microsoft

string

Letonca için Microsoft çözümleyicisi.

ml.microsoft

string

Malayalam için Microsoft çözümleyicisi.

mr.microsoft

string

Marathi için Microsoft çözümleyicisi.

ms.microsoft

string

Malay dili (Latin) için Microsoft çözümleyicisi.

nb.microsoft

string

Norveççe (Bokmål) için Microsoft çözümleyicisi.

nl.lucene

string

Felemenkçe için Lucene çözümleyicisi.

nl.microsoft

string

Felemenkçe için Microsoft çözümleyicisi.

no.lucene

string

Norveçli lucene çözümleyicisi.

pa.microsoft

string

Punjabi için Microsoft çözümleyicisi.

pattern

string

Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

string

Polonyalı lucene çözümleyicisi.

pl.microsoft

string

Lehçe için Microsoft çözümleyicisi.

pt-BR.lucene

string

Portekizce (Brezilya) için Lucene çözümleyicisi.

pt-BR.microsoft

string

Portekizce (Brezilya) için Microsoft çözümleyicisi.

pt-PT.lucene

string

Portekizce (Portekiz) için Lucene çözümleyicisi.

pt-PT.microsoft

string

Portekizce (Portekiz) için Microsoft çözümleyicisi.

ro.lucene

string

Rumence lucene çözümleyicisi.

ro.microsoft

string

Rumence için Microsoft çözümleyicisi.

ru.lucene

string

Rus için Lucene çözümleyicisi.

ru.microsoft

string

Rusça için Microsoft çözümleyicisi.

simple

string

Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

string

Slovakça için Microsoft çözümleyicisi.

sl.microsoft

string

Slovence için Microsoft çözümleyicisi.

sr-cyrillic.microsoft

string

Sırplık (Kiril) için Microsoft çözümleyicisi.

sr-latin.microsoft

string

Sırplık (Latin) için Microsoft çözümleyicisi.

standard.lucene

string

Standart Lucene çözümleyicisi.

standardasciifolding.lucene

string

Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

string

Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

string

İsveççe için Lucene çözümleyicisi.

sv.microsoft

string

İsveççe için Microsoft çözümleyicisi.

ta.microsoft

string

Tamil için Microsoft çözümleyicisi.

te.microsoft

string

Telugu için Microsoft çözümleyicisi.

th.lucene

string

Tayca için Lucene çözümleyicisi.

th.microsoft

string

Tay dili için Microsoft çözümleyicisi.

tr.lucene

string

Türkçe için Lucene çözümleyicisi.

tr.microsoft

string

Türkçe için Microsoft çözümleyicisi.

uk.microsoft

string

Ukrayna dili için Microsoft çözümleyicisi.

ur.microsoft

string

Urduca için Microsoft çözümleyicisi.

vi.microsoft

string

Vietnam dili için Microsoft çözümleyicisi.

whitespace

string

Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

string

Çince için Lucene çözümleyicisi (Basitleştirilmiş).

zh-Hans.microsoft

string

Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.

zh-Hant.lucene

string

Çince (Geleneksel) için Lucene çözümleyicisi.

zh-Hant.microsoft

string

Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name Tür Description
classic

string

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

string

Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

string

Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

string

Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

string

Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

string

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

microsoft_language_tokenizer

string

Dile özgü kuralları kullanarak metni böler.

nGram

string

Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

string

Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

string

Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

string

Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

string

URL'leri ve e-postaları tek bir belirteç olarak belirteç haline alır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

string

Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

SearchError

API için bir hata koşulu açıklar.

Name Tür Description
code

string

Sunucu tanımlı hata kodları kümesinden biri.

details

SearchError[]

Bu bildirilen hataya yol açan belirli hatalarla ilgili ayrıntılar dizisi.

message

string

Hatanın insan tarafından okunabilen bir gösterimi.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name Tür Description
apostrophe

string

Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) çıkarır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

string

Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

string

İlk 127 ASCII karakterinde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, böyle eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

string

Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

string

CJK genişlik farklarını normalleştirir. Tam ASCII çeşitlemelerini eşdeğer temel Latinceye ve yarım genişlikte Katakana değişkenlerini eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

string

İngilizce sahipliklerini ve kısaltmalardan noktaları kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

string

Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

string

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

string

elisyonu kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

string

Alman karakterlerini German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

string

Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçedeki metni normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

string

Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

string

Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan belirteç olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

string

İngilizce için yüksek performanslı bir kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

string

Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

string

Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

string

Belirteç metnini küçük harfe normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm

nGram_v2

string

Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

string

Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

string

Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

string

Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer

reverse

string

Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

string

İskandinav karakterlerini katlar åÅäæÄÆ-a> ve öÖøØ-o>. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

string

Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

string

Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

string

Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

string

Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

string

Dile özgü köklendirme filtresi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

string

Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

string

Belirteçlerden baştaki ve sondaki boşluğu keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

string

Terimleri belirli bir uzunlukta kısaltılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

string

Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

string

Belirteç metnini büyük harfe göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

string

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.