Indexes - Analyze

Başvuru

Service:: Search Service

API Version:: 2023-11-01

Çözümleyicinin metni belirteçlere nasıl bölerken bunu gösterir.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2023-11-01

URI Parametreleri

Name	İçinde	Gerekli	Tür	Description
endpoint	path	True	string	Arama hizmetinin uç nokta URL'si.
indexName	path	True	string	Çözümleyicinin testine yönelik dizinin adı.
api-version	query	True	string	İstemci Api Sürümü.

İstek Başlığı

Name	Gerekli	Tür	Description
x-ms-client-request-id		string uuid	Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name	Gerekli	Tür	Description
text	True	string	Belirteçlere bölünecek metin.
analyzer		LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.
charFilters		CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenFilters		TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenizer		LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

Yanıtlar

Name	Tür	Description
200 OK	AnalyzeResult
Other Status Codes	SearchError	Hata yanıtı.

Örnekler

SearchServiceIndexAnalyze

Sample Request

HTTP

POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2023-11-01

{
  "text": "Text to analyze",
  "analyzer": "standard.lucene"
}

Sample Response

Status code:: 200

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Tanımlar

Name	Description
AnalyzedTokenInfo	Çözümleyici tarafından döndürülen belirteç hakkında bilgi.
AnalyzeRequest	Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.
AnalyzeResult	Bir çözümleyicinin metin üzerinde test edilmesi sonucu.
CharFilterName	Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
LexicalAnalyzerName	Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
LexicalTokenizerName	Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
SearchError	API için bir hata koşulu açıklar.
TokenFilterName	Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkında bilgi.

Name	Tür	Description
endOffset	integer	Giriş metnindeki belirtecin son karakterinin dizini.
position	integer	Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak bazı belirteçler, örneğin birbirlerinin eş anlamlılarıysa aynı konuma sahip olabilir.
startOffset	integer	Giriş metnindeki belirtecin ilk karakterinin dizini.
token	string	Çözümleyici tarafından döndürülen belirteç.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

Name	Tür	Description
analyzer	LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.
charFilters	CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
text	string	Belirteçlere bölünecek metin.
tokenFilters	TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenizer	LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

Name	Tür	Description
tokens	AnalyzedTokenInfo[]	İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name	Tür	Description
html_strip	string	HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name	Tür	Description
ar.lucene	string	Arapça için Lucene çözümleyicisi.
ar.microsoft	string	Arapça için Microsoft çözümleyicisi.
bg.lucene	string	Bulgarca için Lucene çözümleyicisi.
bg.microsoft	string	Bulgarca için Microsoft çözümleyicisi.
bn.microsoft	string	Bangla için Microsoft çözümleyicisi.
ca.lucene	string	Katalan için Lucene çözümleyicisi.
ca.microsoft	string	Katalalan için Microsoft çözümleyicisi.
cs.lucene	string	Çekçe için Lucene çözümleyicisi.
cs.microsoft	string	Çekçe için Microsoft çözümleyicisi.
da.lucene	string	Danca için Lucene çözümleyicisi.
da.microsoft	string	Danca için Microsoft çözümleyicisi.
de.lucene	string	Almanca için Lucene çözümleyicisi.
de.microsoft	string	Almanca için Microsoft çözümleyicisi.
el.lucene	string	Yunanca için Lucene çözümleyicisi.
el.microsoft	string	Yunanca için Microsoft çözümleyicisi.
en.lucene	string	İngilizce için Lucene çözümleyicisi.
en.microsoft	string	İngilizce için Microsoft çözümleyicisi.
es.lucene	string	İspanyolca için Lucene çözümleyicisi.
es.microsoft	string	İspanyolca için Microsoft çözümleyicisi.
et.microsoft	string	Estonca için Microsoft çözümleyicisi.
eu.lucene	string	Bask için Lucene çözümleyicisi.
fa.lucene	string	Farsça için Lucene çözümleyicisi.
fi.lucene	string	Fince için Lucene çözümleyicisi.
fi.microsoft	string	Fince için Microsoft çözümleyicisi.
fr.lucene	string	Fransızca için Lucene çözümleyicisi.
fr.microsoft	string	Fransızca için Microsoft çözümleyicisi.
ga.lucene	string	İrlandalı için Lucene çözümleyicisi.
gl.lucene	string	Galiçyalı için Lucene analizörü.
gu.microsoft	string	Gujarati için Microsoft çözümleyicisi.
he.microsoft	string	İbranice için Microsoft çözümleyicisi.
hi.lucene	string	Hintçe için Lucene çözümleyicisi.
hi.microsoft	string	Hintçe için Microsoft çözümleyicisi.
hr.microsoft	string	Hırvat dili için Microsoft çözümleyicisi.
hu.lucene	string	Macarca için Lucene çözümleyicisi.
hu.microsoft	string	Macarca için Microsoft çözümleyicisi.
hy.lucene	string	Ermeniler için Lucene çözümleyicisi.
id.lucene	string	Endonezya dili için Lucene çözümleyicisi.
id.microsoft	string	Endonezya dili (Bahasa) için Microsoft çözümleyicisi.
is.microsoft	string	İzlanda dili için Microsoft çözümleyicisi.
it.lucene	string	İtalyanca için Lucene çözümleyicisi.
it.microsoft	string	İtalyanca için Microsoft çözümleyicisi.
ja.lucene	string	Japonca için Lucene çözümleyicisi.
ja.microsoft	string	Japonca için Microsoft çözümleyicisi.
keyword	string	Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	string	Kannada için Microsoft çözümleyicisi.
ko.lucene	string	Korece için Lucene çözümleyicisi.
ko.microsoft	string	Korece için Microsoft çözümleyicisi.
lt.microsoft	string	Litvanca için Microsoft çözümleyicisi.
lv.lucene	string	Letonca için Lucene çözümleyicisi.
lv.microsoft	string	Letonca için Microsoft çözümleyicisi.
ml.microsoft	string	Malayalam için Microsoft çözümleyicisi.
mr.microsoft	string	Marathi için Microsoft çözümleyicisi.
ms.microsoft	string	Malay dili (Latin) için Microsoft çözümleyicisi.
nb.microsoft	string	Norveççe (Bokmål) için Microsoft çözümleyicisi.
nl.lucene	string	Felemenkçe için Lucene çözümleyicisi.
nl.microsoft	string	Felemenkçe için Microsoft çözümleyicisi.
no.lucene	string	Norveçli lucene çözümleyicisi.
pa.microsoft	string	Punjabi için Microsoft çözümleyicisi.
pattern	string	Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	string	Polonyalı lucene çözümleyicisi.
pl.microsoft	string	Lehçe için Microsoft çözümleyicisi.
pt-BR.lucene	string	Portekizce (Brezilya) için Lucene çözümleyicisi.
pt-BR.microsoft	string	Portekizce (Brezilya) için Microsoft çözümleyicisi.
pt-PT.lucene	string	Portekizce (Portekiz) için Lucene çözümleyicisi.
pt-PT.microsoft	string	Portekizce (Portekiz) için Microsoft çözümleyicisi.
ro.lucene	string	Rumence lucene çözümleyicisi.
ro.microsoft	string	Rumence için Microsoft çözümleyicisi.
ru.lucene	string	Rus için Lucene çözümleyicisi.
ru.microsoft	string	Rusça için Microsoft çözümleyicisi.
simple	string	Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	string	Slovakça için Microsoft çözümleyicisi.
sl.microsoft	string	Slovence için Microsoft çözümleyicisi.
sr-cyrillic.microsoft	string	Sırplık (Kiril) için Microsoft çözümleyicisi.
sr-latin.microsoft	string	Sırplık (Latin) için Microsoft çözümleyicisi.
standard.lucene	string	Standart Lucene çözümleyicisi.
standardasciifolding.lucene	string	Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	string	Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	string	İsveççe için Lucene çözümleyicisi.
sv.microsoft	string	İsveççe için Microsoft çözümleyicisi.
ta.microsoft	string	Tamil için Microsoft çözümleyicisi.
te.microsoft	string	Telugu için Microsoft çözümleyicisi.
th.lucene	string	Tayca için Lucene çözümleyicisi.
th.microsoft	string	Tay dili için Microsoft çözümleyicisi.
tr.lucene	string	Türkçe için Lucene çözümleyicisi.
tr.microsoft	string	Türkçe için Microsoft çözümleyicisi.
uk.microsoft	string	Ukrayna dili için Microsoft çözümleyicisi.
ur.microsoft	string	Urduca için Microsoft çözümleyicisi.
vi.microsoft	string	Vietnam dili için Microsoft çözümleyicisi.
whitespace	string	Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	string	Çince için Lucene çözümleyicisi (Basitleştirilmiş).
zh-Hans.microsoft	string	Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.
zh-Hant.lucene	string	Çince (Geleneksel) için Lucene çözümleyicisi.
zh-Hant.microsoft	string	Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name	Tür	Description
classic	string	Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	string	Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	string	Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	string	Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	string	Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	string	Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.
microsoft_language_tokenizer	string	Dile özgü kuralları kullanarak metni böler.
nGram	string	Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	string	Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	string	Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	string	Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	string	URL'leri ve e-postaları tek bir belirteç olarak belirteç haline alır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	string	Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

SearchError

API için bir hata koşulu açıklar.

Name	Tür	Description
code	string	Sunucu tanımlı hata kodları kümesinden biri.
details	SearchError[]	Bu bildirilen hataya yol açan belirli hatalarla ilgili ayrıntılar dizisi.
message	string	Hatanın insan tarafından okunabilen bir gösterimi.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name	Tür	Description
apostrophe	string	Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) çıkarır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	string	Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	string	İlk 127 ASCII karakterinde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, böyle eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	string	Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	string	CJK genişlik farklarını normalleştirir. Tam ASCII çeşitlemelerini eşdeğer temel Latinceye ve yarım genişlikte Katakana değişkenlerini eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	string	İngilizce sahipliklerini ve kısaltmalardan noktaları kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	string	Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	string	Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	string	elisyonu kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	string	Alman karakterlerini German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	string	Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçedeki metni normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	string	Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	string	Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan belirteç olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	string	İngilizce için yüksek performanslı bir kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	string	Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	string	Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	string	Belirteç metnini küçük harfe normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm
nGram_v2	string	Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	string	Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	string	Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	string	Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer
reverse	string	Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	string	İskandinav karakterlerini katlar åÅäæÄÆ-a> ve öÖøØ-o>. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	string	Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	string	Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	string	Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	string	Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	string	Dile özgü köklendirme filtresi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	string	Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	string	Belirteçlerden baştaki ve sondaki boşluğu keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	string	Terimleri belirli bir uzunlukta kısaltılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	string	Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	string	Belirteç metnini büyük harfe göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	string	Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.