Indexes - Create

Referencia

Service:: Search Service

API Version:: 2023-11-01

Új keresési indexet hoz létre.

POST {endpoint}/indexes?api-version=2023-11-01

URI-paraméterek

Name	In	Kötelező	Típus	Description
endpoint	path	True	string	A keresési szolgáltatás végponti URL-címe.
api-version	query	True	string	Ügyfél API-verziója.

Kérelem fejléce

Name	Kötelező	Típus	Description
x-ms-client-request-id		string uuid	A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben.

Kérelem törzse

Name	Kötelező	Típus	Description
fields	True	SearchField[]	Az index mezői.
name	True	string	Az index neve.
@odata.etag		string	Az index ETagje.
analyzers		LexicalAnalyzer[]: CustomAnalyzer[] PatternAnalyzer[] LuceneStandardAnalyzer[] StopAnalyzer[]	Az index elemzői.
charFilters		CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Az index karakterszűrői.
corsOptions		CorsOptions	Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.
defaultScoringProfile		string	A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.
encryptionKey		SearchResourceEncryptionKey	Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.
scoringProfiles		ScoringProfile[]	Az index pontozási profiljai.
semantic		SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
similarity		Similarity: ClassicSimilarity BM25Similarity	A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.
suggesters		Suggester[]	Az index javaslattevői.
tokenFilters		TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerTokenFilter[] StemmerOverrideTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Az index jogkivonat-szűrői.
tokenizers		LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] MicrosoftLanguageTokenizer[] MicrosoftLanguageStemmingTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] UaxUrlEmailTokenizer[]	Az index jogkivonat-szabályzói.
vectorSearch		VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

Válaszok

Name	Típus	Description
201 Created	SearchIndex
Other Status Codes	SearchError	Hibaválasz.

Példák

SearchServiceCreateIndex

Sample Request

HTTP

POST https://myservice.search.windows.net/indexes?api-version=2023-11-01

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine"
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ]
  }
}

Sample Response

Status code:: 201

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "fieldName": "location",
          "interpolation": "logarithmic",
          "type": "distance",
          "boost": 5,
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenFilters": [],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": null
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}

Definíciók

Name	Description
AsciiFoldingTokenFilter	Az első 127 ASCII-karakterben (az "Egyszerű latin" Unicode-blokkban) nem szereplő alfabetikus, numerikus és szimbolikus Unicode-karaktereket ASCII-megfelelőjükké alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
AzureActiveDirectoryApplicationCredentials	A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
BM25Similarity	Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).
CharFilterName	Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
CjkBigramTokenFilter	A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
CjkBigramTokenFilterScripts	A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.
ClassicSimilarity	Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.
ClassicTokenizer	Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.
CommonGramTokenFilter	Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, a bigramok átfedésben vannak. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
CorsOptions	Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.
CustomAnalyzer	Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket.
DictionaryDecompounderTokenFilter	A számos német nyelven megtalálható összetett szavakat bontja fel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
DistanceScoringFunction	Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.
DistanceScoringParameters	Paraméterértékeket biztosít egy távolsági pontozási függvénynek.
EdgeNGramTokenFilter	A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
EdgeNGramTokenFilterSide	Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.
EdgeNGramTokenFilterV2	A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
EdgeNGramTokenizer	Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.
ElisionTokenFilter	Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
ExhaustiveKnnParameters	A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
ExhaustiveKnnVectorSearchAlgorithmConfiguration	A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.
FreshnessScoringFunction	Egy olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.
FreshnessScoringParameters	Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.
HnswParameters	A HNSW algoritmusra jellemző paramétereket tartalmazza.
HnswVectorSearchAlgorithmConfiguration	Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.
KeepTokenFilter	Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveget tartalmazó jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
KeywordMarkerTokenFilter	Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
KeywordTokenizer	A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
KeywordTokenizerV2	A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
LengthTokenFilter	Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
LexicalAnalyzerName	Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
LexicalTokenizerName	Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
LimitTokenFilter	Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
LuceneStandardAnalyzer	Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll.
LuceneStandardTokenizer	A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
LuceneStandardTokenizerV2	A Unicode-szövegszegmentálási szabályok szerint töri a szöveget. Ez a tokenizer az Apache Lucene használatával van implementálva.
MagnitudeScoringFunction	Olyan függvényt határoz meg, amely egy numerikus mező nagyságrendje alapján növeli a pontszámokat.
MagnitudeScoringParameters	Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.
MappingCharFilter	Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
MicrosoftLanguageStemmingTokenizer	Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.
MicrosoftLanguageTokenizer	Nyelvspecifikus szabályokkal osztja el a szöveget.
MicrosoftStemmingTokenizerLanguage	Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket.
MicrosoftTokenizerLanguage	Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.
NGramTokenFilter	A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
NGramTokenFilterV2	A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
NGramTokenizer	Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
PathHierarchyTokenizerV2	Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
PatternAnalyzer	A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva.
PatternCaptureTokenFilter	Java-regexek használatával több tokent bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PatternReplaceCharFilter	Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.
PatternReplaceTokenFilter	Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PatternTokenizer	Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
PhoneticEncoder	A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.
PhoneticTokenFilter	Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PrioritizedFields	A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.
RegexFlags	Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben.
ScoringFunctionAggregation	Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.
ScoringFunctionInterpolation	Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál.
ScoringProfile	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.
SearchError	Az API hibafeltételét ismerteti.
SearchField	Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.
SearchFieldDataType	Meghatározza egy mező adattípusát egy keresési indexben.
SearchIndex	A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.
SearchResourceEncryptionKey	Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti a keresési szolgáltatás inaktív adatait, például indexeket és szinonimaleképeket.
SemanticConfiguration	Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.
SemanticField	A szemantikai konfiguráció részeként használt mező.
SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
ShingleTokenFilter	Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
SnowballTokenFilter	Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
SnowballTokenFilterLanguage	A Snowball-tokenszűrőhöz használandó nyelv.
StemmerOverrideTokenFilter	Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
StemmerTokenFilter	Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
StemmerTokenFilterLanguage	A stemmer token szűrőhöz használandó nyelv.
StopAnalyzer	A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.
StopwordsList	A nyelvspecifikus stopszók előre definiált listáját azonosítja.
StopwordsTokenFilter	Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Suggester	Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.
SuggesterSearchMode	A javaslattevő képességeit jelző érték.
SynonymTokenFilter	Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
TagScoringFunction	Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.
TagScoringParameters	Paraméterértékeket biztosít egy címkepontozási függvénynek.
TextWeights	Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.
TokenCharacterKind	Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.
TokenFilterName	Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.
TruncateTokenFilter	Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
UaxUrlEmailTokenizer	Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva.
UniqueTokenFilter	Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.
VectorSearchAlgorithmKind	Az indexeléshez és lekérdezéshez használt algoritmus.
VectorSearchAlgorithmMetric	A vektorok összehasonlításához használandó hasonlósági metrika.
VectorSearchProfile	A vektorkereséssel használható konfigurációk kombinációját határozza meg.
WordDelimiterTokenFilter	A szavakat alszavakra osztja fel, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben (az "Egyszerű latin" Unicode-blokkban) nem szereplő alfabetikus, numerikus és szimbolikus Unicode-karaktereket ASCII-megfelelőjükké alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.AsciiFoldingTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
preserveOriginal	boolean	False	Egy érték, amely azt jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték a false (hamis).

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

Name	Típus	Description
applicationId	string	Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vault, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával.
applicationSecret	string	A megadott AAD-alkalmazás hitelesítési kulcsa.

BM25Similarity

Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.BM25Similarity
b	number	Ez a tulajdonság határozza meg, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75 értéket használ. A 0,0 érték azt jelenti, hogy nincs hossz normalizálás alkalmazva, míg az 1,0 érték azt jelenti, hogy a pontszám teljesen normalizálódik a dokumentum hosszával.
k1	number	Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével.

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

Name	Típus	Description
html_strip	string	Karakterszűrő, amely HTML-szerkezeteket próbál szétszedni. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.CjkBigramTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
ignoreScripts	CjkBigramTokenFilterScripts[]		A figyelmen kívül hagyandó szkriptek.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
outputUnigrams	boolean	False	Egy érték, amely azt jelzi, hogy az unigramokat és a bigramokat is ki kell-e adni (ha igaz), vagy csak bigramokat (ha hamis). Az alapértelmezett érték a false (hamis).

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

Name	Típus	Description
han	string	CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Han-szkriptet.
hangul	string	Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.
hiragana	string	Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.
katakana	string	Hagyja figyelmen kívül a Katakana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicTokenizer		A tokenizer típusát meghatározó URI-töredék.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, a bigramok átfedésben vannak. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.CommonGramTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
commonWords	string[]		A közös szavak halmaza.
ignoreCase	boolean	False	Egy érték, amely azt jelzi, hogy az egyező közös szavak nem különböztetik-e meg a kis- és nagybetűket. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
queryMode	boolean	False	Egy érték, amely azt jelzi, hogy a jogkivonatszűrő lekérdezési módban van-e. Lekérdezési módban a jogkivonatszűrő bigramokat hoz létre, majd eltávolítja a gyakori szavakat és az egyszeres kifejezéseket, amelyeket egy közös szó követ. Az alapértelmezett érték a false (hamis).

CorsOptions

Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.

Name	Típus	Description
allowedOrigins	string[]	Azoknak a forrásoknak a listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljesen minősített-tartománynév}[:{port#}] formátumú gazdagépek listáját, vagy egyetlen `*` elemet tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott).
maxAgeInSeconds	integer	Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc.

CustomAnalyzer

Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.CustomAnalyzer	Az elemző típusát meghatározó URI-töredék.
charFilters	CharFilterName[]	A bemeneti szövegnek a tokenizer általi feldolgozása előtti előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.
name	string	Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenFilters	TokenFilterName[]	A tokenizáló által létrehozott jogkivonatok kiszűrésére vagy módosítására használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak.
tokenizer	LexicalTokenizerName	A jogkivonat-megosztó neve, amelyet a folyamatos szöveg jogkivonatok sorozatára való felosztásához használ, például egy mondat szavakra törése.

DictionaryDecompounderTokenFilter

A számos német nyelven megtalálható összetett szavakat bontja fel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.DictionaryDecompounderTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
maxSubwordSize	integer	15	Az alszó maximális mérete. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300.
minSubwordSize	integer	2	A minimális alszóméret. Csak az ennél hosszabb alszavak lesznek kimenetben. Az alapértelmezett érték 2. A maximális érték 300.
minWordSize	integer	5	A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
onlyLongestMatch	boolean	False	Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót szeretné-e hozzáadni a kimenethez. Az alapértelmezett érték a false (hamis).
wordList	string[]		Az egyező szavak listája.

DistanceScoringFunction

Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
distance	DistanceScoringParameters	A távolságpontozási függvény paraméterértékei.
fieldName	string	A pontozófüggvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".
type	string: distance	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

Name	Típus	Description
boostingDistance	number	Az a távolság, amely kilométerben van attól a referenciahelytől, ahol a kiemelési tartomány véget ér.
referencePointParameter	string	A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához.

EdgeNGramTokenFilter

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2.
minGram	integer	1	A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
side	EdgeNGramTokenFilterSide	front	Meghatározza, hogy az n-gram bemenetének melyik oldaláról kell generálni. Az alapértelmezett érték az "előtér".

EdgeNGramTokenFilterSide

Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

Name	Típus	Description
back	string	Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni.
front	string	Azt adja meg, hogy az n-gramot a bemenet elejéről kell létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilterV2		A tokenszűrő típusát meghatározó URI-töredék.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
side	EdgeNGramTokenFilterSide	front	Meghatározza, hogy az n-gram bemenetének melyik oldaláról kell generálni. Az alapértelmezett érték az "előtér".

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenChars	TokenCharacterKind[]		A tokenekben megtartandó karakterosztályok.

ElisionTokenFilter

Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.ElisionTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
articles	string[]	Az eltávolítandó cikkek halmaza.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

Name	Típus	Description
metric	VectorSearchAlgorithmMetric	A vektorok összehasonlításához használandó hasonlósági metrika.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

Name	Típus	Description
exhaustiveKnnParameters	ExhaustiveKnnParameters	A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
kind	string: exhaustiveKnn	A vektorkereséshez konfigurált algoritmus neve.
name	string	Az adott konfigurációhoz társítandó név.

FreshnessScoringFunction

Egy olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozófüggvény bemeneteként használt mező neve.
freshness	FreshnessScoringParameters	A frissesség-pontozási függvény paraméterértékei.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".
type	string: freshness	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

Name	Típus	Description
boostingDuration	string	Az a lejárati időszak, amely után a kiemelés leáll egy adott dokumentum esetében.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

Name	Típus	Alapértelmezett érték	Description
efConstruction	integer	400	A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az indexidő alatt használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet.
efSearch	integer	500	A keresési idő alatt használt legközelebbi szomszédokat tartalmazó dinamikus lista mérete. A paraméter növelése javíthatja a keresési eredményeket, a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet.
m	integer	4	Az összes új elemhez létrehozott kétirányú kapcsolatok száma az építés során. A paraméterérték növelése javíthatja a nagy belső dimenziójú adathalmazok visszahívási és lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására.
metric	VectorSearchAlgorithmMetric		A vektorok összehasonlításához használandó hasonlósági metrika.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

Name	Típus	Description
hnswParameters	HnswParameters	A HNSW-algoritmusra jellemző paramétereket tartalmazza.
kind	string: hnsw	A vektorkereséshez konfigurált algoritmus neve.
name	string	Az adott konfigurációhoz társítandó név.

KeepTokenFilter

Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveget tartalmazó jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeepTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
keepWords	string[]		A megtartandó szavak listája.
keepWordsCase	boolean	False	Egy érték, amely azt jelzi, hogy az összes szót kisbetűvel kell-e kisbetűsíteni. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordMarkerTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
ignoreCase	boolean	False	A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).
keywords	string[]		Kulcsszavakként megjelölendő szavak listája.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizer

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
bufferSize	integer	256	Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizerV2

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizerV2		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	256	A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.LengthTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
max	integer	300	A karakterek maximális hossza. Az alapértelmezett és a maximális érték 300.
min	integer	0	A karakterek minimális hossza. Az alapértelmezett érték 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

Name	Típus	Description
ar.lucene	string	Lucene analyzer arab nyelven.
ar.microsoft	string	Microsoft Analyzer arab nyelven.
bg.lucene	string	Lucene-elemző bolgárnak.
bg.microsoft	string	Microsoft analyzer for Bolgár.
bn.microsoft	string	A Bangla Microsoft-elemzője.
ca.lucene	string	Lucene elemző katalánnak.
ca.microsoft	string	A Microsoft elemzője katalán nyelven.
cs.lucene	string	Lucene elemző csehnek.
cs.microsoft	string	A Microsoft elemzője csehül.
da.lucene	string	Lucene analyzer dánnak.
da.microsoft	string	Microsoft analyzer dán nyelven.
de.lucene	string	Lucene-elemző németül.
de.microsoft	string	Microsoft analyzer német nyelven.
el.lucene	string	Lucene elemző göröghöz.
el.microsoft	string	Microsoft Analyzer görög nyelven.
en.lucene	string	Lucene analyzer angol nyelven.
en.microsoft	string	Microsoft Analyzer angol nyelven.
es.lucene	string	Lucene elemző spanyolra.
es.microsoft	string	Microsoft Analyzer spanyol nyelven.
et.microsoft	string	Microsoft analyzer az észtekhez.
eu.lucene	string	Lucene-elemző Baszknak.
fa.lucene	string	Lucene elemző perzsa.
fi.lucene	string	Lucene analyzer finnhez.
fi.microsoft	string	Microsoft analyzer for Finn.
fr.lucene	string	Lucene elemző francia nyelvre.
fr.microsoft	string	Microsoft analyzer francia nyelven.
ga.lucene	string	Lucene-elemző írnek.
gl.lucene	string	Lucene-elemző a galíciaiaknak.
gu.microsoft	string	Microsoft analyzer for Gujarati.
he.microsoft	string	Microsoft Analyzer héber nyelven.
hi.lucene	string	Lucene elemző hindinek.
hi.microsoft	string	Microsoft analyzer for Hindi.
hr.microsoft	string	Microsoft analyzer for Horvát.
hu.lucene	string	Lucene-elemző magyarra.
hu.microsoft	string	Microsoft-elemző magyar nyelven.
hy.lucene	string	Lucene-elemző örménynek.
id.lucene	string	Lucene analyzer indonéz.
id.microsoft	string	Indonéz Microsoft-elemző (Bahasa).
is.microsoft	string	Izlandi Microsoft-elemző.
it.lucene	string	Lucene elemző olasznak.
it.microsoft	string	Microsoft Analyzer olasz nyelven.
ja.lucene	string	Lucene-elemző japánhoz.
ja.microsoft	string	Microsoft analyzer japán nyelven.
keyword	string	A mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	string	A Kannada Microsoft-elemzője.
ko.lucene	string	Lucene elemző koreaihoz.
ko.microsoft	string	Microsoft-elemző koreaihoz.
lt.microsoft	string	Microsoft-elemző litvánhoz.
lv.lucene	string	Lucene-elemző lettnek.
lv.microsoft	string	Microsoft Analyzer lett nyelvhez.
ml.microsoft	string	Microsoft analyzer for Malayalam.
mr.microsoft	string	Microsoft analyzer for Marathi.
ms.microsoft	string	Microsoft-elemző malájhoz (latin betűs).
nb.microsoft	string	Microsoft analyzer for Norwegian (Bokmål).
nl.lucene	string	Lucene analyzer hollandra.
nl.microsoft	string	Microsoft Analyzer holland nyelven.
no.lucene	string	Lucene-elemző norvégra.
pa.microsoft	string	Microsoft-elemző Punjabihoz.
pattern	string	A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	string	Lucene-elemző a lengyelhez.
pl.microsoft	string	Microsoft Analyzer lengyel nyelven.
pt-BR.lucene	string	Lucene analyzer portugál (Brazília).
pt-BR.microsoft	string	Microsoft analyzer for Portuguese (Brazília).
pt-PT.lucene	string	Lucene analyzer for Portugál (Portugália).
pt-PT.microsoft	string	Microsoft analyzer for Portuguese (Portugália).
ro.lucene	string	Lucene elemző románhoz.
ro.microsoft	string	Microsoft analyzer for Román.
ru.lucene	string	Lucene elemző orosznak.
ru.microsoft	string	Microsoft-elemző oroszhoz.
simple	string	Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	string	Microsoft analyzer for Szlovák.
sl.microsoft	string	Microsoft-elemző szlovén nyelvhez.
sr-cyrillic.microsoft	string	Szerb (cirill betűs) Microsoft-elemző.
sr-latin.microsoft	string	Microsoft-elemző szerb (latin betűs) nyelven.
standard.lucene	string	Standard Lucene-elemző.
standardasciifolding.lucene	string	Standard ASCII összecsukható Lucene-elemző. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	string	A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	string	Lucene elemző svédnek.
sv.microsoft	string	Microsoft analyzer for Svéd.
ta.microsoft	string	Microsoft analyzer for Tamil.
te.microsoft	string	Microsoft analyzer for Telugu.
th.lucene	string	Lucene elemző thaihoz.
th.microsoft	string	Microsoft Analyzer thai nyelven.
tr.lucene	string	Lucene elemző törökhöz.
tr.microsoft	string	Microsoft analyzer for Török.
uk.microsoft	string	Microsoft analyzer for Ukrán.
ur.microsoft	string	Microsoft analyzer for Urdu.
vi.microsoft	string	A Vietnami Microsoft elemzője.
whitespace	string	Egy elemző, amely a térbeli jogkivonat-jelölőt használja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	string	Lucene analyzer kínaihoz (egyszerűsített).
zh-Hans.microsoft	string	Microsoft Analyzer kínaihoz (egyszerűsített).
zh-Hant.lucene	string	Lucene analyzer kínaihoz (hagyományos).
zh-Hant.microsoft	string	Microsoft Analyzer kínaihoz (hagyományos).

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

Name	Típus	Description
classic	string	Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	string	Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	string	A teljes bemenetet egyetlen tokenként bocsátja ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	string	A szöveget nem betűkkel osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	string	Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	string	Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapűrlapokra csökkenti.
microsoft_language_tokenizer	string	Nyelvspecifikus szabályokkal osztja el a szöveget.
nGram	string	Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	string	Tokenizer elérésiút-szerű hierarchiákhoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	string	Tokenizer, amely regex mintaegyeztetés használatával hoz létre különböző jogkivonatokat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	string	Standard Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	string	Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	string	Elosztja a szöveget a térköznél. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.LimitTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
consumeAllTokens	boolean	False	Egy érték, amely azt jelzi, hogy a bemenet összes jogkivonatát akkor is fel kell-e használni, ha eléri a maxTokenCount értéket. Az alapértelmezett érték a false (hamis).
maxTokenCount	integer	1	A létrehozandó tokenek maximális száma. Az alapértelmezett érték 1.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardAnalyzer		Az elemző típusát meghatározó URI-töredék.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
stopwords	string[]		A stopszavak listája.

LuceneStandardTokenizer

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardTokenizerV2

A Unicode-szövegszegmentálási szabályok szerint töri a szöveget. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizerV2		A tokenizer típusát meghatározó URI-töredék.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MagnitudeScoringFunction

Olyan függvényt határoz meg, amely egy numerikus mező nagyságrendje alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozófüggvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".
magnitude	MagnitudeScoringParameters	A nagyságrendi pontozási függvény paraméterértékei.
type	string: magnitude	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

MagnitudeScoringParameters

Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.

Name	Típus	Description
boostingRangeEnd	number	Az a mezőérték, amelynél a kiemelés véget ér.
boostingRangeStart	number	Az a mezőérték, amelynél a kiemelés elindul.
constantBoostBeyondRange	boolean	Érték, amely azt jelzi, hogy a tartományvégértéken túli mezőértékek esetében állandó lökést kell-e alkalmazni; alapértelmezett értéke hamis.

MappingCharFilter

Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.MappingCharFilter	A karakterszűrő típusát meghatározó URI-töredék.
mappings	string[]	A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása a "b" karakterrel lesz helyettesítve).
name	string	A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
isSearchTokenizer	boolean	False	A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis).
language	MicrosoftStemmingTokenizerLanguage		A használni kívánt nyelv. Az alapértelmezett érték az angol.
maxTokenLength	integer	255	A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
isSearchTokenizer	boolean	False	A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis).
language	MicrosoftTokenizerLanguage		A használni kívánt nyelv. Az alapértelmezett érték az angol.
maxTokenLength	integer	255	A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftStemmingTokenizerLanguage

Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket.

Name	Típus	Description
arabic	string	Kiválasztja a Microsoft stemming tokenizert arab nyelven.
bangla	string	A Bangla microsoftos jogkivonat-jelölőjének kiválasztása.
bulgarian	string	Kiválasztja a microsoftos jogkivonat-kezelőt bolgár nyelven.
catalan	string	Kiválasztja a KatalánHoz tartozó Microsoft-jogkivonat-kezelőt.
croatian	string	Kiválasztja a Microsoft stemming tokenizert horvát nyelvhez.
czech	string	Kiválasztja a Microsoft stemming tokenizert csehhez.
danish	string	Kiválasztja a Microsoft stemming tokenizert dánul.
dutch	string	Kiválasztja a Microsoft stemming tokenizer for Dutch (Microsoft stemming tokenizer for Dutch) lehetőséget.
english	string	Kiválasztja az angol nyelvű Microsoft stemming tokenizert.
estonian	string	Kiválasztja a Microsoft stemming tokenizert az észthez.
finnish	string	Kiválasztja a Microsoft stemming tokenizer for Finn (Microsoft stemming tokenizer for Finn) lehetőséget.
french	string	Kiválasztja a Microsoft stemming tokenizert francia nyelven.
german	string	Kiválasztja a Microsoft stemming tokenizert a német nyelvhez.
greek	string	Kiválasztja a microsoftos jogkivonat-kezelőt a göröghöz.
gujarati	string	A Gujaratihoz tartozó Microsoft stemming tokenizer kiválasztása.
hebrew	string	Kiválasztja a Héber nyelvhez tartozó Microsoft stemming tokenizert.
hindi	string	Kiválasztja a Hindihez tartozó Microsoft stemming tokenizert.
hungarian	string	Kiválasztja a Microsoft stemming tokenizert magyarra.
icelandic	string	Kiválasztja az izlandi Microsoft stemming tokenizert.
indonesian	string	Kiválasztja az indonéz microsoftos jogkivonat-kezelőt.
italian	string	Kiválasztja a Microsoft stemming tokenizer for Italian (Microsoft stemming tokenizer for Italian) lehetőséget.
kannada	string	A Kannada microsoftos jogkivonat-kezelőjének kiválasztása.
latvian	string	A Lett nyelvhez tartozó Microsoft stemming tokenizer kiválasztása.
lithuanian	string	Kiválasztja a Microsoft stemming tokenizert litvánhoz.
malay	string	Kiválasztja a Maláj microsoftos jogkivonat-jelölőt.
malayalam	string	Kiválasztja a Malayalamhoz tartozó Microsoft-jogkivonat-jelölőt.
marathi	string	Kiválasztja a Marathihoz tartozó Microsoft stemming tokenizert.
norwegianBokmaal	string	Kiválasztja a Microsoft stemming tokenizert norvég (Bokmål) nyelvhez.
polish	string	Kiválasztja a Microsoft stemming tokenizer for Polish (Microsoft stemming tokenizer for Lengyel) lehetőséget.
portuguese	string	Kiválasztja a Portugál nyelvhez tartozó Microsoft stemming tokenizert.
portugueseBrazilian	string	Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-jelölőt.
punjabi	string	Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-kezelőt.
romanian	string	Kiválasztja a Microsoft stemming tokenizert a román nyelvhez.
russian	string	Kiválasztja az orosz nyelvű Microsoft stemming tokenizert.
serbianCyrillic	string	A Szerb (cirill betűs) Microsoft stemming tokenizert választja ki.
serbianLatin	string	A Szerb (latin betűs) Microsoft stemming tokenizert választja.
slovak	string	Kiválasztja a Microsoft stemming tokenizert a szlovák nyelvhez.
slovenian	string	Kiválasztja a Microsoft stemming tokenizert szlovén nyelvhez.
spanish	string	Kiválasztja a microsoftos jogkivonat-kezelőt a spanyol nyelvhez.
swedish	string	Kiválasztja a Microsoft stemming tokenizert svéd nyelven.
tamil	string	Kiválasztja a Microsoft stemming tokenizert a Tamilhez.
telugu	string	Kiválasztja a Teluguhoz készült Microsoft stemming tokenizert.
turkish	string	Kiválasztja a Törökhöz készült Microsoft stemming tokenizert.
ukrainian	string	Kiválasztja az ukrán microsoftos jogkivonat-kezelőt.
urdu	string	Kiválasztja az Urduhoz tartozó Microsoft stemming tokenizert.

MicrosoftTokenizerLanguage

Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.

Name	Típus	Description
bangla	string	A Bangla Microsoft tokenizer elemét választja ki.
bulgarian	string	Kiválasztja a Bolgár Microsoft tokenizert.
catalan	string	Kiválasztja a Katalánhoz készült Microsoft tokenizert.
chineseSimplified	string	Kiválasztja a Microsoft tokenizer kínai (egyszerűsített) beállítását.
chineseTraditional	string	Kiválasztja a Kínai (hagyományos) Microsoft tokenizert.
croatian	string	Kiválasztja a Horvát Microsoft tokenizert.
czech	string	Kiválasztja a Microsoft tokenizert csehhez.
danish	string	Kiválasztja a Microsoft tokenizert dánul.
dutch	string	Kiválasztja a Microsoft tokenizert hollandra.
english	string	A Microsoft angol jogkivonat-jelölőjének kiválasztása.
french	string	Kiválasztja a Microsoft tokenizert francia nyelven.
german	string	A Microsoft tokenizer (német) lehetőséget választja.
greek	string	Kiválasztja a Microsoft tokenizert a göröghöz.
gujarati	string	Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz.
hindi	string	Kiválasztja a Hindihez készült Microsoft tokenizert.
icelandic	string	Kiválasztja az izlandi Microsoft tokenizert.
indonesian	string	Kiválasztja az indonéz Microsoft tokenizert.
italian	string	Kiválasztja az olasz microsoft jogkivonat-jelölőt.
japanese	string	Kiválasztja a Japánhoz készült Microsoft tokenizert.
kannada	string	A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása.
korean	string	Kiválasztja a Koreaihoz készült Microsoft tokenizert.
malay	string	Kiválasztja a Microsoft tokenizert malájhoz.
malayalam	string	Kiválasztja a Microsoft tokenizert a malajalamhoz.
marathi	string	Kiválasztja a Marathihoz készült Microsoft tokenizert.
norwegianBokmaal	string	Kiválasztja a Microsoft tokenizert norvég (Bokmål) számára.
polish	string	Kiválasztja a Microsoft tokenizert a lengyelhez.
portuguese	string	Kiválasztja a Microsoft portugál jogkivonat-jelölőt.
portugueseBrazilian	string	Kiválasztja a Microsoft tokenizert portugál (Brazília) nyelvhez.
punjabi	string	Kiválasztja a Punjabihoz tartozó Microsoft tokenizert.
romanian	string	Kiválasztja a Microsoft tokenizert a román nyelvhez.
russian	string	Kiválasztja a Microsoft tokenizert oroszra.
serbianCyrillic	string	Kiválasztja a Szerb (cirill betűs) Microsoft tokenizert.
serbianLatin	string	Kiválasztja a Microsoft tokenizert szerb (latin betűs) nyelvhez.
slovenian	string	Kiválasztja a Szlovén microsoft tokenizert.
spanish	string	Kiválasztja a Microsoft tokenizert spanyolul.
swedish	string	Kiválasztja a Microsoft tokenizert svéd nyelven.
tamil	string	Kiválasztja a Microsoft tokenizert a Tamilhez.
telugu	string	Kiválasztja a Teluguhoz készült Microsoft tokenizert.
thai	string	Kiválasztja a Thai microsoft tokenizert.
ukrainian	string	Kiválasztja az ukrán Microsoft tokenizert.
urdu	string	Kiválasztja a Microsoft tokenizert az Urduhoz.
vietnamese	string	Kiválasztja a vietnami Microsoft tokenizert.

NGramTokenFilter

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2.
minGram	integer	1	A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenFilterV2

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilterV2		A tokenszűrő típusát meghatározó URI-töredék.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenChars	TokenCharacterKind[]		A tokenekben megtartandó karakterosztályok.

PathHierarchyTokenizerV2

Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PathHierarchyTokenizerV2		Egy URI-töredék, amely a tokenizer típusát határozza meg.
delimiter	string	/	A használni kívánt elválasztó karakter. Az alapértelmezett érték a "/".
maxTokenLength	integer	300	A jogkivonat maximális hossza. Az alapértelmezett és a maximális érték 300.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
replacement	string	/	Egy érték, amely ha be van állítva, lecseréli a határoló karaktert. Az alapértelmezett érték a "/".
reverse	boolean	False	Egy érték, amely azt jelzi, hogy fordított sorrendben kell-e létrehozni a jogkivonatokat. Az alapértelmezett érték a false (hamis).
skip	integer	0	A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték a 0.

PatternAnalyzer

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternAnalyzer		Az elemző típusát meghatározó URI-töredék.
flags	RegexFlags		Reguláris kifejezésjelölők.
lowercase	boolean	True	Egy érték, amely azt jelzi, hogy a kifejezések kisbetűsek-e. Alapértelmezett érték: true (igaz).
name	string		Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	\W+	Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett egy olyan kifejezés, amely egy vagy több nem szó karakternek felel meg.
stopwords	string[]		A stopszavak listája.

PatternCaptureTokenFilter

Java-regexek használatával több tokent bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternCaptureTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
patterns	string[]		Az egyes tokenekhez illeszkedő minták listája.
preserveOriginal	boolean	True	Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta megegyezik. Alapértelmezett érték: true (igaz).

PatternReplaceCharFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceCharFilter	A karakterszűrő típusát meghatározó URI-töredék.
name	string	A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	Egy reguláris kifejezésminta.
replacement	string	A helyettesítő szöveg.

PatternReplaceTokenFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	Egy reguláris kifejezésminta.
replacement	string	A helyettesítő szöveg.

PatternTokenizer

Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
flags	RegexFlags		Reguláris kifejezésjelölők.
group	integer	-1	Az egyező csoport nulla alapú sorszáma a reguláris kifejezésmintában, amely tokenekké nyerhető ki. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	\W+	Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés.

PhoneticEncoder

A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.

Name	Típus	Description
beiderMorse	string	Kódol egy jogkivonatot egy Beider-Morse értékre.
caverphone1	string	Kódol egy tokent egy Caverphone 1.0 értékre.
caverphone2	string	Kódol egy tokent egy Caverphone 2.0 értékre.
cologne	string	Kódol egy jogkivonatot egy kölni fonetikus értékre.
doubleMetaphone	string	Egy tokent dupla metafonértékké kódol.
haasePhonetik	string	Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase-finomításával.
koelnerPhonetik	string	Kódol egy jogkivonatot a Kölner Phonetik algoritmussal.
metaphone	string	Kódol egy tokent egy Metaphone-értékbe.
nysiis	string	Kódol egy jogkivonatot EGY NYSIIS-értékbe.
refinedSoundex	string	Egy jogkivonatot pontosított Soundex-értékké kódol.
soundex	string	Egy jogkivonatot Soundex-értékké kódol.

PhoneticTokenFilter

Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PhoneticTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
encoder	PhoneticEncoder	metaphone	A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone".
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
replace	boolean	True	Egy érték, amely azt jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Alapértelmezett érték: true (igaz).

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.

Name	Típus	Description
prioritizedContentFields	SemanticField[]	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.
prioritizedKeywordsFields	SemanticField[]	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.
titleField	SemanticField	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nincs címmező az indexben, hagyja üresen ezt a mezőt.

RegexFlags

Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben.

Name	Típus	Description
CANON_EQ	string	Engedélyezi a canonikus egyenértékűséget.
CASE_INSENSITIVE	string	Engedélyezi a kis- és nagybetűk megkülönböztetése nélküli egyeztetést.
COMMENTS	string	Engedélyezi a térközt és a megjegyzéseket a mintában.
DOTALL	string	Engedélyezi a dotall módot.
LITERAL	string	Lehetővé teszi a minta literális elemzését.
MULTILINE	string	Engedélyezi a többsoros módot.
UNICODE_CASE	string	Lehetővé teszi a Unicode-ra képes kis- és nagybetűk összecsukását.
UNIX_LINES	string	Engedélyezi a Unix-vonalak üzemmódot.

ScoringFunctionAggregation

Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.

Name	Típus	Description
average	string	A pontszámok növelése az összes pontozófüggvény eredményének átlagával.
firstMatching	string	Pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével.
maximum	string	A pontszámok növelése az összes pontozófüggvény eredményének maximális értékével.
minimum	string	A pontszámok növelése az összes pontozófüggvény eredményének minimumával.
sum	string	A pontszámok növelése az összes pontozófüggvény eredményének összegével.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál.

Name	Típus	Description
constant	string	Állandó tényezővel növeli a pontszámokat.
linear	string	Lineárisan csökkenő mennyiséggel növeli a pontszámokat. Ez a pontozási függvények alapértelmezett interpolációja.
logarithmic	string	A pontszámokat olyan mennyiséggel növeli, amely logaritmikusan csökken. A magasabb pontszámok esetén a kiemelések gyorsan csökkennek, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben.
quadratic	string	A pontszámokat egy olyan összeggel növeli, amely kvadráns módon csökken. A kiemelések lassabban csökkennek a magasabb pontszámok esetén, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

Name	Típus	Description
functionAggregation	ScoringFunctionAggregation	Az egyes pontozófüggvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint a "Sum" (Összeg) értékre van kapcsolva. Figyelmen kívül hagyja, ha nincsenek pontozófüggvények.
functions	ScoringFunction[]: DistanceScoringFunction[] FreshnessScoringFunction[] MagnitudeScoringFunction[] TagScoringFunction[]	A dokumentumok pontozását befolyásoló függvények gyűjteménye.
name	string	A pontozási profil neve.
text	TextWeights	Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást.

SearchError

Az API hibafeltételét ismerteti.

Name	Típus	Description
code	string	A kiszolgáló által definiált hibakódok egyike.
details	SearchError[]	A jelentett hibához vezető konkrét hibák részleteinek tömbje.
message	string	A hiba emberi olvasásra alkalmas ábrázolása.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.

Name	Típus	Description
analyzer	LexicalAnalyzerName	A mezőhöz használandó elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be a searchAnalyzer vagy az indexAnalyzer paraméterrel együtt. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.
dimensions	integer	A vektormező dimenziója.
facetable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. Általában a találatok kategória szerinti számát (például digitális kamerák keresését és a találatok márka, megapixelek, ár stb. szerinti megtekintését) tartalmazó keresési eredmények bemutatójában használatos. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection(Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz.
fields	SearchField[]	Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie.
filterable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető a sztringek kezelésének módjában különbözik a kereshetőtől. A szűrhető Edm.String vagy Collection(Edm.String) típusú mezők nem esnek szótörésbe, így az összehasonlítások csak pontos egyezésekre használhatók. Ha például egy ilyen f mezőt "napos nap" értékre állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig a null értékre vonatkozik.
indexAnalyzer	LexicalAnalyzerName	A mező indexelésekor használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.
key	boolean	Egy érték, amely azt jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null.
name	string	A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében.
retrievable	boolean	Egy érték, amely azt jelzi, hogy a mező visszaadható-e egy keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság meglévő mezőkön módosítható. A tulajdonság engedélyezése nem okozza az indextárolási követelmények növekedését. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig a null értékre vonatkozik.
searchAnalyzer	LexicalAnalyzerName	A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőn. Komplex mezők esetén null értékűnek kell lennie.
searchable	boolean	Egy érték, amely azt jelzi, hogy a mező kereshető-e. Ez azt jelenti, hogy az indexelés során olyan elemzések mennek végbe, mint a szótörés. Ha egy kereshető mező értékének például a „sunny day” szöveget adja meg, akkor az két különálló tokenre lesz bontva: „sunny” és „day”. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection(Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben, hogy a teljes szöveges keresésekhez a mezőérték további jogkivonatos verzióit is elférjenek. Ha helyet szeretne menteni az indexben, és nincs szükség arra, hogy egy mező szerepeljen a keresésekben, állítsa a kereshető értéket false (hamis) értékre.
sortable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Az egyszerű mezők csak akkor rendezhetők, ha egyértékűek (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez akkor is igaz, ha egy közvetlen szülőmezőről vagy egy elődmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezők esetében. A rendezhető alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre.
synonymMaps	string[]	A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimatérkép mezőhöz rendelése biztosítja, hogy a mezőt megcélzó lekérdezési kifejezések a szinonimatérkép szabályainak használatával lekérdezéskor ki legyenek bontva. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie.
type	SearchFieldDataType	A mező adattípusa.
vectorSearchProfile	string	Annak a vektorkeresési profilnak a neve, amely meghatározza a vektormezőben való kereséshez használandó algoritmust.

SearchFieldDataType

Meghatározza egy mező adattípusát egy keresési indexben.

Name	Típus	Description
Edm.Boolean	string	Azt jelzi, hogy egy mező logikai értéket (igaz vagy hamis) tartalmaz.
Edm.ComplexType	string	Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek.
Edm.DateTimeOffset	string	Azt jelzi, hogy egy mező dátum-/időértéket tartalmaz, beleértve az időzónával kapcsolatos információkat is.
Edm.Double	string	Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz.
Edm.GeographyPoint	string	Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából.
Edm.Int32	string	Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz.
Edm.Int64	string	Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz.
Edm.Single	string	Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Gyűjtemény (Edm.Single) használatakor érvényes.
Edm.String	string	Azt jelzi, hogy egy mező tartalmaz egy sztringet.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.

Name	Típus	Description
@odata.etag	string	Az index ETagje.
analyzers	LexicalAnalyzer[]: CustomAnalyzer[] LuceneStandardAnalyzer[] PatternAnalyzer[] StopAnalyzer[]	Az index elemzői.
charFilters	CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Az index karakterszűrői.
corsOptions	CorsOptions	Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.
defaultScoringProfile	string	A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.
encryptionKey	SearchResourceEncryptionKey	Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.
fields	SearchField[]	Az index mezői.
name	string	Az index neve.
scoringProfiles	ScoringProfile[]	Az index pontozási profiljai.
semantic	SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
similarity	Similarity: BM25Similarity ClassicSimilarity	A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.
suggesters	Suggester[]	Az index javaslattevői.
tokenFilters	TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerOverrideTokenFilter[] StemmerTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Az index jogkivonat-szűrői.
tokenizers	LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] MicrosoftLanguageStemmingTokenizer[] MicrosoftLanguageTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] UaxUrlEmailTokenizer[]	Az index jogkivonat-szabályzói.
vectorSearch	VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti a keresési szolgáltatás inaktív adatait, például indexeket és szinonimaleképeket.

Name	Típus	Description
accessCredentials	AzureActiveDirectoryApplicationCredentials	Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem kötelező, ha felügyelt identitást használ helyette.
keyVaultKeyName	string	Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs neve.
keyVaultKeyVersion	string	Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs verziója.
keyVaultUri	string	Az Azure Key Vault ( más néven DNS-név) URI-ja, amely az inaktív adatok titkosításához használandó kulcsot tartalmazza. Példa URI-ra: `https://my-keyvault-name.vault.azure.net`.

SemanticConfiguration

Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.

Name	Típus	Description
name	string	A szemantikai konfiguráció neve.
prioritizedFields	PrioritizedFields	A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság közül legalább egyet (titleField, prioritizedKeywordsFields és prioritizedContentFields) be kell állítani.

SemanticField

A szemantikai konfiguráció részeként használt mező.

Name	Típus	Description
fieldName	string

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

Name	Típus	Description
configurations	SemanticConfiguration[]	Az index szemantikai konfigurációi.
defaultConfiguration	string	Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni.

ShingleTokenFilter

Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.ShingleTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
filterToken	string	_	A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_").
maxShingleSize	integer	2	A maximális zsindelyméret. Az alapértelmezett és minimális érték 2.
minShingleSize	integer	2	A minimális zsindelyméret. Az alapértelmezett és minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
outputUnigrams	boolean	True	Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és a zsindelyeket. Alapértelmezett érték: true (igaz).
outputUnigramsIfNoShingles	boolean	False	Egy érték, amely azt jelzi, hogy egygrammot kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre zsindely. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték a false (hamis).
tokenSeparator	string		A szomszédos tokenek összekapcsolásakor használandó sztring zsindely létrehozásához. Az alapértelmezett érték egyetlen szóköz (" ").

SnowballTokenFilter

Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.SnowballTokenFilter	Egy URI-töredék, amely megadja a tokenszűrő típusát.
language	SnowballTokenFilterLanguage	A használni kívánt nyelv.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

SnowballTokenFilterLanguage

A Snowball-tokenszűrőhöz használandó nyelv.

Name	Típus	Description
armenian	string	Kiválasztja a Lucene Snowball stemming tokenizer örmény.
basque	string	Kiválasztja a Lucene Snowball stemming tokenizert Baszk számára.
catalan	string	Kiválasztja a Lucene Snowball szárító tokenizer katalán.
danish	string	Kiválasztja a Lucene Snowball stemming tokenizert dánul.
dutch	string	Kiválasztja a Lucene Snowball stemming tokenizert hollandul.
english	string	Kiválasztja a Lucene Snowball stemming tokenizert angol nyelven.
finnish	string	Kiválasztja a Lucene Snowball stemming tokenizert a finn nyelvhez.
french	string	Kiválasztja a Francia Lucene Snowball-jogkivonat-jelölőt.
german	string	Kiválasztja a Lucene Snowball stemming tokenizer német nyelven.
german2	string	Kiválasztja a Lucene Snowball-alapú jogkivonat-készítőt, amely a német variáns algoritmust használja.
hungarian	string	Kiválasztja a Lucene Snowball stemming tokenizer for Hungarian (Lucene Snowball stemming tokenizer for Hungarian) lehetőséget.
italian	string	Kiválasztja az olasz Lucene Snowball-jogkivonat-jelölőt.
kp	string	Kiválasztja a Lucene Snowball származtatási jogkivonat-készítőt hollandul, amely a Kraaij-Pohlmann stemming algoritmust használja.
lovins	string	Kiválasztja a Lovins-eredeti algoritmust használó angol nyelvhez készült Lucene Snowball-jogkivonat-készítőt.
norwegian	string	Kiválasztja a Lucene Snowball stemming tokenizert a norvég nyelvhez.
porter	string	Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Porter stemming algoritmust használja.
portuguese	string	Kiválasztja a Lucene Snowball stemming tokenizert portugálul.
romanian	string	Kiválasztja a Lucene Snowball stemming tokenizer a román.
russian	string	Kiválasztja a Lucene Snowball-alapú jogkivonat-jelölőt az oroszhoz.
spanish	string	Kiválasztja a Lucene Snowball szárító tokenizer spanyol.
swedish	string	Kiválasztja a Lucene Snowball stemming tokenizer svéd.
turkish	string	Kiválasztja a Lucene Snowball stemming tokenizer for Török.

StemmerOverrideTokenFilter

Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerOverrideTokenFilter	Egy URI-töredék, amely megadja a tokenszűrő típusát.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
rules	string[]	A stemming szabályok listája a következő formátumban: "word => stem", például: "ran => run".

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerTokenFilter	Egy URI-töredék, amely megadja a tokenszűrő típusát.
language	StemmerTokenFilterLanguage	A használni kívánt nyelv.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

Name	Típus	Description
arabic	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt arabul.
armenian	string	Kiválasztja az örmény Lucene-alapú jogkivonat-jelölőt.
basque	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt Baszk számára.
brazilian	string	Kiválasztja a Lucene-ből származó jogkivonat-jelölőt a portugál (Brazília) számára.
bulgarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a bolgárhoz.
catalan	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a katalánhoz.
czech	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a csehhez.
danish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a dánhoz.
dutch	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a hollandhoz.
dutchKp	string	Kiválasztja a Lucene-alapú jogkivonat-készítőt a holland nyelvhez, amely a Kraaij-Pohlmann származtatási algoritmust használja.
english	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez.
finnish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez.
french	string	Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt.
galician	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz.
german	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez.
german2	string	Kiválasztja a német variáns algoritmust használó Lucene-alapú jogkivonat-készítőt.
greek	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a göröghöz.
hindi	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt Hindi számára.
hungarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz.
indonesian	string	Kiválasztja az indonéz Lucene-alapú jogkivonat-jelölőt.
irish	string	Kiválasztja az ír Lucene-alapú jogkivonat-jelölőt.
italian	string	Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt.
latvian	string	Kiválasztja a Lett lucene-alapú jogkivonat-jelölőt.
lightEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely könnyű leszármaztatást végez.
lightFinnish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez, amely könnyű leszármaztatást végez.
lightFrench	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a francia nyelvhez, amely könnyű leszármaztatást végez.
lightGerman	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely könnyű leszármaztatást végez.
lightHungarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz, amely könnyű leszármaztatást végez.
lightItalian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az olaszhoz, amely könnyű leszármaztatást végez.
lightNorwegian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára, amely könnyű leszármaztatást végez.
lightNynorsk	string	Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely könnyű leszármaztatást végez.
lightPortuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely könnyű leszármaztatást végez.
lightRussian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az oroszhoz, amely könnyű leszármaztatást végez.
lightSpanish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a spanyolhoz, amely könnyű leszármaztatást végez.
lightSwedish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svédhez, amely könnyű leszármaztatást végez.
lovins	string	Kiválasztja a Lovins-származtatási algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt.
minimalEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely minimálisan száraz.
minimalFrench	string	Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt, amely minimálisan száraz.
minimalGalician	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz, amely minimálisan száraz.
minimalGerman	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely minimálisan hajtja a szárat.
minimalNorwegian	string	Kiválasztja a Lucene stemming tokenizert norvég (Bokmål) számára, amely minimálisan száraz.
minimalNynorsk	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Nynorsk) számára, amely minimálisan száraz.
minimalPortuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely minimálisan szárít.
norwegian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára.
porter2	string	Kiválasztja a Porter2 stemming algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt.
portuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugál nyelvhez.
portugueseRslp	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt portugálul, amely az RSLP-származtatási algoritmust használja.
possessiveEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely eltávolítja a záró birtokosokat a szavakból.
romanian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a román nyelvhez.
russian	string	Kiválasztja az orosz Lucene-alapú jogkivonat-jelölőt.
sorani	string	A Sorani lucene-alapú jogkivonat-jelölőjének kiválasztása.
spanish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt spanyolul.
swedish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svéd nyelvhez.
turkish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a törökhöz.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StopAnalyzer	Az elemző típusát meghatározó URI-töredék.
name	string	Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
stopwords	string[]	A stopszavak listája.

StopwordsList

A nyelvspecifikus stopszók előre definiált listáját azonosítja.

Name	Típus	Description
arabic	string	Kiválasztja az arab nyelvű stopword listát.
armenian	string	Kiválasztja az örmények stopszólistáját.
basque	string	Kiválasztja a baszk stopszólistát.
brazilian	string	Kiválasztja a portugál (Brazília) stopword listáját.
bulgarian	string	Kiválasztja a bolgár stopword listát.
catalan	string	Kiválasztja a katalán stopword listát.
czech	string	Kiválasztja a cseh stopword listát.
danish	string	Kiválasztja a dán stopword listát.
dutch	string	Kiválasztja a holland stopword listát.
english	string	Kiválasztja az angol nyelvű stopword listát.
finnish	string	Kiválasztja a finn stopword listát.
french	string	Kiválasztja a francia stopword listát.
galician	string	Kiválasztja a galíciai stopword listát.
german	string	A német nyelvhez tartozó stopword listát választja ki.
greek	string	Kiválasztja a göröghöz tartozó stopszólistát.
hindi	string	Kiválasztja a hindi stopword listát.
hungarian	string	Kiválasztja a magyar nyelvű stopszólistát.
indonesian	string	Kiválasztja az indonéz stopword listát.
irish	string	Kiválasztja az írek stopword listáját.
italian	string	Kiválasztja az olasz stopword listát.
latvian	string	Kiválasztja a lett stopword listát.
norwegian	string	Kiválasztja a norvég nyelvhez tartozó stopword listát.
persian	string	Kiválasztja a perzsa stopword listát.
portuguese	string	Kiválasztja a portugál stopword listát.
romanian	string	Kiválasztja a román nyelvű stopword listát.
russian	string	Kiválasztja az orosz nyelvű stopword listát.
sorani	string	A Sorani stopword listájának kiválasztása.
spanish	string	Kiválasztja a spanyol nyelvű stopword listát.
swedish	string	Kiválasztja a svéd stopword listát.
thai	string	Kiválasztja a thai nyelvhez tartozó stopword listát.
turkish	string	Kiválasztja a törökhöz tartozó stopword listát.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StopwordsTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
ignoreCase	boolean	False	A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
removeTrailing	boolean	True	Egy érték, amely azt jelzi, hogy figyelmen kívül kell-e hagyni az utolsó keresési kifejezést, ha az egy stop szó. Alapértelmezett érték: true (igaz).
stopwords	string[]		A stopszavak listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be.
stopwordsList	StopwordsList	english	A használni kívánt stopszavak előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol.

Suggester

Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.

Name	Típus	Description
name	string	A javaslattevő neve.
searchMode	SuggesterSearchMode	A javaslattevő képességeit jelző érték.
sourceFields	string[]	Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

Name	Típus	Description
analyzingInfixMatching	string	Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "fast" és a "leggyorsabb brow" lekérdezések is egyeznek.

SynonymTokenFilter

Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.SynonymTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
expand	boolean	True	Egy érték, amely azt jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nincs használva) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha => jelölést nem használ) megfelelteti egymásnak. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Alapértelmezett érték: true (igaz).
ignoreCase	boolean	False	Egy érték, amely azt jelzi, hogy a bemenetet kis- és nagybetűvel kell-e összehajtani az egyeztetéshez. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
synonyms	string[]		A szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - a = szimbólum bal oldalán> lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés kerül; 2. hihetetlen, hihetetlen, mesés, csodálatos - az egyenértékű szavak vesszővel elválasztott listája. A kibontás beállításával módosíthatja a lista értelmezését.

TagScoringFunction

Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozófüggvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".
tag	TagScoringParameters	A címkepontozási függvény paraméterértékei.
type	string: tag	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

Name	Típus	Description
tagsParameter	string	A keresési lekérdezésekben átadott paraméter neve, amely megadja a célmezővel összehasonlítandó címkék listáját.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.

Name	Típus	Description
weights	object	A mezőnkénti súlyozás szótára a dokumentumok pontozásának növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

Name	Típus	Description
digit	string	A számjegyeket tokenekben tárolja.
letter	string	Jogkivonatokban tárolja a leveleket.
punctuation	string	A tokenekben tárolja az írásjeleket.
symbol	string	A szimbólumokat tokenekben tárolja.
whitespace	string	Jogkivonatokban tárolja a térközt.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

Name	Típus	Description
apostrophe	string	Az aposztróf utáni összes karaktert (beleértve magát az aposztrófot is) eltávolítja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	string	Jogkivonatszűrő, amely az arab normalizálót alkalmazza az ortográfia normalizálására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	string	Az első 127 ASCII-karakterben (az "Egyszerű latin" Unicode-blokkban) nem szereplő alfabetikus, numerikus és szimbolikus Unicode-karaktereket ASCII-megfelelőjükké alakítja, ha léteznek ilyenek. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	string	A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	string	Normalizálja a CJK szélességi különbségeit. A teljes körű ASCII-variánsokat a megfelelő egyszerű latin betűsre, a félszélességű Katakana-változatokat pedig a megfelelő Kana-ra hajtja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	string	Eltávolítja az angol birtokosokat és a betűszavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	string	Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, a bigramok átfedésben vannak. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	string	A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	string	Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	string	Normalizálja a német karaktereket a német 2. hógolyó algoritmus heurisztika szerint. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	string	Normalizálja a hindi nyelvű szöveget, hogy eltávolítson néhány különbséget a helyesírási változatokban. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	string	Normalizálja a szöveg Unicode-ábrázolását indiai nyelveken. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	string	Minden bejövő jogkivonatot kétszer, egyszer kulcsszóként, egyszer pedig nem kulcsszóként bocsát ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	string	Nagy teljesítményű kstem szűrő angolra. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	string	Eltávolítja a túl hosszú vagy túl rövid szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	string	Korlátozza a tokenek számát az indexelés során. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	string	Normalizálja a token szövegét kisbetűsre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm
nGram_v2	string	A megadott méret(ek) n-grammját hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	string	Perzsa normalizálást alkalmaz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	string	Jogkivonatok létrehozása fonetikus egyezésekhez. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	string	A Porter forráskezelő algoritmusával átalakítja a jogkivonat-adatfolyamot. Lásd: http://tartarus.org/~martin/PorterStemmer
reverse	string	A jogkivonat sztringjének megfordítása. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	string	Folds Skandináv karakterek åÅäæÄÆ-a> és öÖøØ-o>. Emellett hátrányosan megkülönbözteti az aa, ae, ao, oe és oo magánhangzók használatát, így csak az első. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	string	Normalizálja a felcserélhető skandináv karakterek használatát. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	string	Tokenkombinációkat hoz létre egyetlen tokenként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	string	Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	string	Normalizálja a Sorani-szöveg Unicode-ábrázolását. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	string	Nyelvspecifikus eredetszűrő. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	string	Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	string	Levágja a kezdő és a záró szóközt a jogkivonatokból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	string	A kifejezéseket adott hosszúságúra csonkítja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	string	Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	string	A token szövegének normalizálása nagybetűsre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	string	A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon.

TruncateTokenFilter

Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.TruncateTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
length	integer	300	A kifejezések csonkításának hossza. Az alapértelmezett és a maximális érték 300.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UaxUrlEmailTokenizer

Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.UaxUrlEmailTokenizer		A tokenizer típusát meghatározó URI-töredék.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UniqueTokenFilter

Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.UniqueTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
onlyOnSamePosition	boolean	False	Egy érték, amely azt jelzi, hogy a duplikált elemeket csak ugyanabban a pozícióban szeretné-e eltávolítani. Az alapértelmezett érték a false (hamis).

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

Name	Típus	Description
algorithms	VectorSearchAlgorithmConfiguration[]: ExhaustiveKnnVectorSearchAlgorithmConfiguration[] HnswVectorSearchAlgorithmConfiguration[]	Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz.
profiles	VectorSearchProfile[]	A vektorkereséshez használandó konfigurációk kombinációit határozza meg.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

Name	Típus	Description
exhaustiveKnn	string	Kimerítő KNN-algoritmus, amely találgatásos keresést hajt végre.
hnsw	string	HNSW (Hierarchikus Navigable Small World), a legközelebbi szomszéd algoritmus típusa.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

Name	Típus	Description
cosine	string
dotProduct	string
euclidean	string

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

Name	Típus	Description
algorithm	string	A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket.
name	string	Az adott vektoros keresési profilhoz társítandó név.

WordDelimiterTokenFilter

A szavakat alszavakra osztja fel, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.WordDelimiterTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
catenateAll	boolean	False	Egy érték, amely azt jelzi, hogy az összes alszórész be lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search-1" "AzureSearch1" lesz. Az alapértelmezett érték a false (hamis).
catenateNumbers	boolean	False	Egy érték, amely azt jelzi, hogy a rendszer a számrészek maximális futásait fogja-e kiszolgálni. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték a false (hamis).
catenateWords	boolean	False	Egy érték, amely azt jelzi, hogy a szórészek maximális futása lesz-e beszúrva. Ha például ez igaz értékre van állítva, az "Azure-Search" "AzureSearch" lesz. Az alapértelmezett érték a false (hamis).
generateNumberParts	boolean	True	Érték, amely azt jelzi, hogy létre kell-e hozni szám alszavak. Alapértelmezett érték: true (igaz).
generateWordParts	boolean	True	Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak részei létrejönnek; például az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
preserveOriginal	boolean	False	Érték, amely azt jelzi, hogy az eredeti szavak megmaradnak-e, és hozzá lesznek-e adva az alszavak listájához. Az alapértelmezett érték a false (hamis).
protectedWords	string[]		A tagolástól védendő jogkivonatok listája.
splitOnCaseChange	boolean	True	Érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange függvényben. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz).
splitOnNumerics	boolean	True	Érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Alapértelmezett érték: true (igaz).
stemEnglishPossessive	boolean	True	Egy érték, amely jelzi, hogy el szeretné-e távolítani az egyes alszavak záró "'s"-jét. Alapértelmezett érték: true (igaz).

Share via