Partager via


TokenFilterName Structure

Définition

Définit les noms de tous les filtres de jetons pris en charge par Recherche cognitive Azure.

public readonly struct TokenFilterName : IEquatable<Azure.Search.Documents.Indexes.Models.TokenFilterName>
type TokenFilterName = struct
Public Structure TokenFilterName
Implements IEquatable(Of TokenFilterName)
Héritage
TokenFilterName
Implémente

Constructeurs

TokenFilterName(String)

Initialise une nouvelle instance de TokenFilterName.

Propriétés

Apostrophe

Supprime tous les caractères suivant une apostrophe (y compris l’apostrophe elle-même). Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html.

ArabicNormalization

Un filtre de jetons qui applique le normaliseur arabe pour normaliser l’orthographe. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html.

AsciiFolding

Convertit les caractères Unicode alphabétiques, numériques et symboliques qui ne figurent pas dans les 127 premiers caractères ASCII (le bloc Unicode « latin de base ») en équivalents ASCII, si de tels équivalents existent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html.

CjkBigram

Forme des bigrams de termes CJK générés à partir du générateur de jetons standard. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html.

CjkWidth

Normalise les différences de largeur de CJC. Plie les variantes ASCII fullwidth dans le latin de base équivalent et les variantes katakana demi-largeur dans le Kana équivalent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html.

Classic

Supprime les possessifs en anglais et les points des acronymes. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html.

CommonGram

Construit des digrammes pour les termes d’occurrence fréquente lors de l’indexation. Les termes uniques sont néanmoins aussi indexés, avec des digrammes superposés. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html.

EdgeNGram

Génère n-grammes de la ou des tailles données à partir de l’avant ou de l’arrière d’un jeton d’entrée. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html.

Elision

Supprime les élisions. Par exemple, « l’avion » (l’avion) sera converti en « avion ». Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html.

GermanNormalization

Normalise les caractères allemands selon l’heuristique de l’algorithme de boule de neige German2. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html.

HindiNormalization

Normalise le texte dans Hindi de façon à supprimer des différences dans les variations orthographiques. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html.

IndicNormalization

Normalise la représentation Unicode du texte dans les langues indiennes. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html.

KeywordRepeat

Émet chaque jeton entrant deux fois, une fois en tant que mot clé et une fois en tant que jeton non mot clé. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html.

KStem

Un filtre kstem à hautes performances pour l’anglais. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html.

Length

Supprime les mots qui sont trop longs ou trop courts. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html.

Limit

Limite le nombre de jetons lors de l’indexation. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html.

Lowercase

Normalise le texte des jetons en minuscules. Consultez https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html.

NGram

Génère des n-grammes de la taille donnée. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html.

PersianNormalization

Applique la normalisation pour le persan. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html.

Phonetic

Crée des jetons pour les correspondances phonétiques. Consultez https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html.

PorterStem

Utilise l’algorithme de chiffrement Porter pour transformer le flux de jetons. Consultez http://tartarus.org/~martin/PorterStemmer.

Reverse

Inverse la chaîne des jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html.

ScandinavianFoldingNormalization

Convertit les caractères scandinaves åÅäæÄÆ->a et öÖøØ->o. Il identifie aussi l’utilisation des voyelles doubles aa, ae, ao, oe et oo, et conserve seulement la première voyelle. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html.

ScandinavianNormalization

Normalise l’utilisation des caractères scandinaves interchangeables. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html.

Shingle

Crée des combinaisons de jetons sous la forme d’un unique jeton. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html.

Snowball

Filtre qui permet d’endiguer les mots à l’aide d’un stemmer généré par Snowball. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html.

SoraniNormalization

Normalise la représentation Unicode du texte en sorani. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html.

Stemmer

Filtre de stemming spécifique au langage. Consultez https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters.

Stopwords

Supprime les mots vides d’un flux de jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html.

Trim

Supprime les espaces de début et de fin des jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html.

Truncate

Tronque les termes à une longueur spécifique. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html.

Unique

Élimine les jetons avec le même texte que le jeton précédent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html.

Uppercase

Normalise le texte des jetons en majuscules. Consultez https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html.

WordDelimiter

Divise les mots en sous-mots et effectue des transformations facultatives sur les groupes de sous-mots.

Méthodes

Equals(TokenFilterName)

Indique si l'objet actuel est égal à un autre objet du même type.

ToString()

Retourne le nom de type qualifié complet de cette instance.

Opérateurs

Equality(TokenFilterName, TokenFilterName)

Détermine si deux TokenFilterName valeurs sont identiques.

Implicit(String to TokenFilterName)

Convertit une chaîne en TokenFilterName.

Inequality(TokenFilterName, TokenFilterName)

Détermine si deux TokenFilterName valeurs ne sont pas identiques.

S’applique à