Share via


Azure.Search.Documents.Indexes.Models Espace de noms

Classes

AnalyzedTokenInfo

Informations sur un jeton retourné par un analyseur.

AnalyzeTextOptions

Spécifie certains composants de texte et d’analyse utilisés pour décomposer ce texte en jetons.

AsciiFoldingTokenFilter

Convertit les caractères Unicode alphabétiques, numériques et symboliques qui ne figurent pas dans les 127 premiers caractères ASCII (le bloc Unicode « Latin de base ») en leurs équivalents ASCII, s’ils existent. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

AzureMachineLearningSkill

La compétence AML vous permet d’étendre l’enrichissement par IA à l’aide d’un modèle Azure Machine Learning (AML) personnalisé. Une fois qu’un modèle AML est formé et déployé, une compétence AML l’intègre dans l’enrichissement par IA.

AzureOpenAIEmbeddingSkill

Vous permet de générer une incorporation vectorielle pour une entrée de texte donnée à l’aide du service Azure Open AI.

AzureOpenAIParameters

Contient les paramètres spécifiques à l’utilisation d’un service Azure Open AI pour la vectorisation au moment de la requête.

AzureOpenAIVectorizer

Contient les paramètres spécifiques à l’utilisation d’un service Azure Open AI pour la vectorisation au moment de la requête.

BM25Similarity

Fonction de classement basée sur l’algorithme de similarité Okapi BM25. BM25 est un algorithme de type TF-IDF qui inclut la normalisation de longueur (contrôlée par le paramètre « b ») ainsi que la saturation de la fréquence de terme (contrôlée par le paramètre « k1 »).

CharFilter

Type de base pour les filtres de caractères. Veuillez noter qu’il CharFilter s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut avoir besoin d’être affectée ici, ou cette propriété doit être convertie en une des classes dérivées possibles. Les classes dérivées disponibles incluent MappingCharFilter et PatternReplaceCharFilter.

CjkBigramTokenFilter

Forme des bigrams de termes CJK générés à partir du générateur de jetons standard. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

ClassicSimilarity

Algorithme de similarité hérité qui utilise l’implémentation Lucene TFIDFSimilarity de TF-IDF. Cette variante de TF-IDF introduit une normalisation statique de la longueur des documents ainsi que des facteurs de coordination qui pénalisent les documents qui ne correspondent que partiellement aux requêtes recherchées.

ClassicTokenizer

Générateur de jetons basé sur la grammaire adapté au traitement de la plupart des documents en langue européenne. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

CognitiveServicesAccount

Type de base pour décrire toute ressource de service cognitif attachée à un ensemble de compétences. Veuillez noter qu’il CognitiveServicesAccount s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut avoir besoin d’être affectée ici, ou cette propriété doit être convertie en une des classes dérivées possibles. Les classes dérivées disponibles incluent CognitiveServicesAccountKey et DefaultCognitiveServicesAccount.

CognitiveServicesAccountKey

Ressource de service cognitif approvisionnée avec une clé attachée à un ensemble de compétences.

CommonGramTokenFilter

Construit des digrammes pour les termes d’occurrence fréquente lors de l’indexation. Les termes uniques sont néanmoins aussi indexés, avec des digrammes superposés. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

ComplexField

Champ ou collection complexe de champs complexes qui contiennent des champs enfants. Les champs enfants peuvent être SimpleField ou ComplexField.

ConditionalSkill

Compétence qui permet aux scénarios nécessitant une opération booléenne de déterminer les données à affecter à une sortie.

CorsOptions

Définit des options pour contrôler le partage de ressources cross-origin (CORS) pour un index.

CustomAnalyzer

Vous permet de prendre le contrôle du processus de conversion du texte en jetons indexables/pouvant faire l’objet d’une recherche. Il s’agit d’une configuration définie par l’utilisateur composée d’un générateur de jetons unique prédéfini et d’un ou plusieurs filtres. Le générateur de jetons est responsable de la fractionnement du texte en jetons et des filtres pour la modification des jetons émis par le générateur de jetons.

CustomEntity

Objet qui contient des informations sur les correspondances trouvées et les métadonnées associées.

CustomEntityAlias

Objet complexe qui peut être utilisé pour spécifier d’autres orthographes ou synonymes au nom de l’entité racine.

CustomEntityLookupSkill

Une compétence recherche du texte à partir d’une liste personnalisée définie par l’utilisateur de mots et d’expressions.

CustomNormalizer

Vous permet de configurer la normalisation pour les champs filtrables, triables et facetables, qui fonctionnent par défaut avec une correspondance stricte. Il s’agit d’une configuration définie par l’utilisateur composée d’au moins un ou plusieurs filtres, qui modifient le jeton stocké.

CustomVectorizer

Contient les paramètres spécifiques à la génération d’incorporations vectorielles via un point de terminaison personnalisé.

CustomVectorizerParameters

Contient les paramètres spécifiques à la génération d’incorporations vectorielles via un point de terminaison personnalisé.

DataChangeDetectionPolicy

Type de base pour les stratégies de détection des modifications de données. Veuillez noter qu’il DataChangeDetectionPolicy s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut avoir besoin d’être affectée ici, ou cette propriété doit être convertie en une des classes dérivées possibles. Les classes dérivées disponibles incluent HighWaterMarkChangeDetectionPolicy et SqlIntegratedChangeTrackingPolicy.

DataDeletionDetectionPolicy

Type de base pour les stratégies de détection de suppression de données. Veuillez noter qu’il DataDeletionDetectionPolicy s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut avoir besoin d’être affectée ici, ou cette propriété doit être convertie en une des classes dérivées possibles. Les classes dérivées disponibles incluent NativeBlobSoftDeleteDeletionDetectionPolicy et SoftDeleteColumnDeletionDetectionPolicy.

DefaultCognitiveServicesAccount

Objet vide qui représente la ressource de service cognitif par défaut pour un ensemble de compétences.

DictionaryDecompounderTokenFilter

Décompose les mots composés trouvés dans beaucoup de langues germaniques. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

DistanceScoringFunction

Définit une fonction qui augmente les scores en fonction de la distance d’un emplacement géographique.

DistanceScoringParameters

Fournit des valeurs de paramètre à une fonction de scoring de distance.

DocumentExtractionSkill

Compétence qui extrait le contenu d’un fichier dans le pipeline d’enrichissement.

EdgeNGramTokenFilter

Génère des n-grammes de la ou des tailles données à partir de l’avant ou de l’arrière d’un jeton d’entrée. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

EdgeNGramTokenizer

Tokenise l’entrée d’un bord en n-grammes de la ou des tailles données. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

ElisionTokenFilter

Supprime les élisions. Par exemple, « l’avion » sera converti en « avion ». Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

EntityLinkingSkill

À l’aide de l’API Analyse de texte, extrait les entités liées du texte.

EntityRecognitionSkill

Cette compétence est déconseillée. Utilisez la version V3. EntityRecognitionSkill à la place.

ExhaustiveKnnParameters

Contient les paramètres spécifiques à l’algorithme KNN exhaustif.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Contient des options de configuration spécifiques à l’algorithme KNN exhaustif utilisé lors de l’interrogation, qui effectue une recherche par force brute sur l’ensemble de l’index vectoriel.

FieldMapping

Définit un mappage entre un champ dans une source de données et un champ cible dans un index.

FieldMappingFunction

Représente une fonction qui transforme une valeur à partir d’une source de données avant l’indexation.

FreshnessScoringFunction

Définit une fonction qui augmente les scores en fonction de la valeur d’un champ date-heure.

FreshnessScoringParameters

Fournit des valeurs de paramètres à une fonction de scoring d’actualisation.

HighWaterMarkChangeDetectionPolicy

Définit une stratégie de détection des modifications de données qui capture les modifications en fonction de la valeur d’une colonne de limite élevée.

HnswParameters

Contient les paramètres spécifiques à l’algorithme hnsw.

HnswVectorSearchAlgorithmConfiguration

Contient des options de configuration spécifiques à l’algorithme hnsw approximatif le plus proche voisin utilisé lors de l’indexation et de l’interrogation. L’algorithme hnsw offre un compromis entre la vitesse de recherche et la précision.

ImageAnalysisSkill

Compétence qui analyse les fichiers image. Il extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image.

IndexerChangeTrackingState

Représente l’état de suivi des modifications pendant l’exécution d’un indexeur.

IndexerExecutionResult

Représente le résultat de l’exécution d’un indexeur individuel.

IndexerState

Représente tout l’état qui définit et dicte l’exécution actuelle de l’indexeur.

IndexingParameters

Représente les paramètres pour l'exécution d'indexeur.

IndexingParametersConfiguration

Dictionnaire de propriétés de configuration spécifiques à l’indexeur. Chaque nom est le nom d’une propriété spécifique. Chaque valeur doit être d’un type primitif.

IndexingSchedule

Représente une planification pour l'exécution d'indexeur.

InputFieldMappingEntry

Mappage de champ d’entrée pour une compétence.

KeepTokenFilter

Filtre de jeton qui conserve uniquement les jetons avec du texte contenu dans une liste de mots spécifiée. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

KeyPhraseExtractionSkill

Compétence qui utilise l’analyse de texte pour l’extraction d’expressions clés.

KeywordMarkerTokenFilter

Marque les termes comme mots clés. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

KeywordTokenizer

Génère la totalité de l’entrée sous la forme d’un unique jeton. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

KnowledgeStore

Définition de projections supplémentaires pour azure blob, table ou fichiers, de données enrichies.

KnowledgeStoreFileProjectionSelector

Définition de projection pour les données à stocker dans Azure Files.

KnowledgeStoreObjectProjectionSelector

Définition de projection pour les données à stocker dans Azure Blob.

KnowledgeStoreProjection

Objet conteneur pour différents sélecteurs de projection.

KnowledgeStoreProjectionSelector

Classe abstraite pour partager des propriétés entre des sélecteurs concrets.

KnowledgeStoreStorageProjectionSelector

Classe abstraite pour partager des propriétés entre des sélecteurs concrets.

KnowledgeStoreTableProjectionSelector

Description des données à stocker dans les tables Azure.

LanguageDetectionSkill

Compétence qui détecte la langue du texte d’entrée et signale un code de langue unique pour chaque document soumis lors de la demande. Le code de langage est associé à un score indiquant la confiance de l’analyse.

LengthTokenFilter

Supprime les mots qui sont trop longs ou trop courts. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

LexicalAnalyzer

Type de base pour les analyseurs. Veuillez noter qu’il LexicalAnalyzer s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent CustomAnalyzer, LuceneStandardAnalyzerPatternAnalyzeret StopAnalyzer.

LexicalAnalyzerName.Values

Valeurs de toutes les propriétés déclarées LexicalAnalyzerName en tant que constantes de chaîne. Celles-ci peuvent être utilisées dans SearchableFieldAttribute et n’importe où d’autres constantes sont requises.

LexicalNormalizer

Type de base pour les normaliseurs. Veuillez noter qu’il LexicalNormalizer s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent CustomNormalizer.

LexicalNormalizerName.Values

Valeurs de toutes les propriétés déclarées LexicalNormalizerName en tant que constantes de chaîne. Ces constantes peuvent être utilisées dans SimpleFieldAttribute, SearchableFieldAttribute et n’importe où ailleurs sont requises.

LexicalTokenizer

Type de base pour les générateurs de jetons. Veuillez noter qu’il LexicalTokenizer s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent ClassicTokenizer, EdgeNGramTokenizer, KeywordTokenizer, MicrosoftLanguageStemmingTokenizerKeywordTokenizer, MicrosoftLanguageTokenizer, NGramTokenizer, PathHierarchyTokenizer, , , PatternTokenizer, , , LuceneStandardTokenizeret LuceneStandardTokenizerUaxUrlEmailTokenizer.

LimitTokenFilter

Limite le nombre de jetons lors de l’indexation. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

LuceneStandardAnalyzer

Analyseur Apache Lucene standard ; Composé du générateur de jetons standard, du filtre en minuscules et du filtre d’arrêt.

LuceneStandardTokenizer

Décompose le texte en suivant les règles de segmentation du texte Unicode. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

MagnitudeScoringFunction

Définit une fonction qui augmente les scores en fonction de la magnitude d’un champ numérique.

MagnitudeScoringParameters

Fournit des valeurs de paramètre à une fonction de scoring de magnitude.

MappingCharFilter

Filtre de caractères qui applique des mappages définis avec l’option mappages. La mise en correspondance est gourmande en ressources (la correspondance du modèle le plus long à un point donné l’emporte). La chaîne vide est autorisée comme remplacement. Ce filtre de caractères est implémenté à l’aide d’Apache Lucene.

MergeSkill

Compétence permettant de fusionner deux chaînes ou plus en une seule chaîne unifiée, avec un délimiteur facultatif défini par l’utilisateur qui sépare chaque composant.

MicrosoftLanguageStemmingTokenizer

Divise le texte en utilisant des règles spécifiques à la langue et réduit les mots à leurs formes de base.

MicrosoftLanguageTokenizer

Divise le texte en utilisant des règles spécifiques à la langue.

NativeBlobSoftDeleteDeletionDetectionPolicy

Définit une stratégie de détection de suppression de données utilisant la fonctionnalité de suppression réversible native de Stockage Blob Azure pour la détection de suppression.

NGramTokenFilter

Génère des n-grammes de la taille donnée. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

NGramTokenizer

Génère des jetons à partir de l’entrée en n-grammes d’une ou plusieurs tailles données. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

OcrSkill

Compétence qui extrait le texte des fichiers image.

OutputFieldMappingEntry

Mappage de champ de sortie pour une compétence.

PathHierarchyTokenizer

Générateur de jetons pour les hiérarchies de type chemin. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

PatternAnalyzer

Sépare le texte de façon flexible en termes via un modèle d’expression régulière. Cet analyseur est implémenté à l’aide d’Apache Lucene.

PatternCaptureTokenFilter

Utilise des regex java pour émettre plusieurs jetons, un pour chaque groupe de capture dans un ou plusieurs modèles. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

PatternReplaceCharFilter

Filtre de caractères qui remplace les caractères de la chaîne d’entrée. Il utilise une expression régulière pour identifier les séquences de caractères à conserver et un modèle de remplacement pour identifier les caractères à remplacer. Par exemple, étant donné le texte d’entrée « aa bb aa bb », le modèle « (aa)\s+(bb) » et le remplacement de « $1#$2 », le résultat serait « aa#bb aa#bb ». Ce filtre de caractères est implémenté à l’aide d’Apache Lucene.

PatternReplaceTokenFilter

Filtre de caractères qui remplace les caractères de la chaîne d’entrée. Il utilise une expression régulière pour identifier les séquences de caractères à conserver et un modèle de remplacement pour identifier les caractères à remplacer. Par exemple, étant donné le texte d’entrée « aa bb aa bb », le modèle « (aa)\s+(bb) » et le remplacement de « $1#$2 », le résultat serait « aa#bb aa#bb ». Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

PatternTokenizer

Tokenizer qui utilise la correspondance de modèle regex pour construire des jetons distincts. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

PhoneticTokenFilter

Crée des jetons pour les correspondances phonétiques. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

PiiDetectionSkill

À l’aide de l’API Analyse de texte, extrait les informations personnelles d’un texte d’entrée et vous permet de les masquer.

PrioritizedFields

Décrit les champs titre, contenu et mots clés à utiliser pour le classement sémantique, les légendes, les mises en évidence et les réponses.

ScoringFunction

Type de base pour les fonctions qui peuvent modifier les scores de document pendant le classement. Veuillez noter qu’il ScoringFunction s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent DistanceScoringFunction, MagnitudeScoringFunctionFreshnessScoringFunctionet TagScoringFunction.

ScoringProfile

Définit les paramètres d’un index de recherche qui influencent le scoring dans les requêtes de recherche.

SearchableField

Champ String ou « Collection(String) » qui peut faire l’objet d’une recherche.

SearchAlias

Représente un alias d’index, qui décrit un mappage du nom de l’alias à un index. Le nom de l’alias peut être utilisé à la place du nom d’index pour les opérations prises en charge.

SearchField

Représente un champ dans une définition d’index, qui décrit le nom, le type de données et le comportement de recherche d’un champ.

SearchFieldTemplate

Type de champ de base pour les classes d’assistance afin de créer plus facilement un SearchIndex.

SearchIndex

Représente une définition d’index de recherche, qui décrit les champs et le comportement de recherche d’un index.

SearchIndexer

Représente un indexeur.

SearchIndexerCache

The SearchIndexerCache.

SearchIndexerDataContainer

Représente des informations sur l’entité (telles que Azure SQL table ou la collection CosmosDB) qui sera indexée.

SearchIndexerDataIdentity

Type de base abstrait pour les identités de données. Veuillez noter qu’il SearchIndexerDataIdentity s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent SearchIndexerDataNoneIdentity et SearchIndexerDataUserAssignedIdentity.

SearchIndexerDataNoneIdentity

Efface la propriété d’identité d’une source de données.

SearchIndexerDataSourceConnection

Représente une définition de source de données, qui peut être utilisée pour configurer un indexeur.

SearchIndexerDataUserAssignedIdentity

Spécifie l’identité d’une source de données à utiliser.

SearchIndexerError

Représente une erreur d'indexation de niveau élément ou document.

SearchIndexerIndexProjections

Définition de projections supplémentaires pour les index de recherche secondaires.

SearchIndexerIndexProjectionSelector

Description des données à stocker dans l’index de recherche désigné.

SearchIndexerIndexProjectionsParameters

Dictionnaire de propriétés de configuration spécifiques à la projection d’index. Chaque nom est le nom d’une propriété spécifique. Chaque valeur doit être d’un type primitif.

SearchIndexerKnowledgeStoreParameters

Dictionnaire des propriétés de configuration spécifiques à la base de connaissances. Chaque nom est le nom d’une propriété spécifique. Chaque valeur doit être d’un type primitif.

SearchIndexerLimits

The SearchIndexerLimits.

SearchIndexerSkill

Type de base pour les compétences. Veuillez noter qu’il SearchIndexerSkill s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent AzureMachineLearningSkill, WebApiSkill, CustomEntityLookupSkillMergeSkillAzureOpenAIEmbeddingSkillLanguageDetectionSkillEntityRecognitionSkillKeyPhraseExtractionSkill, SentimentSkillSplitSkillTextTranslationSkillEntityLinkingSkillPiiDetectionSkillAzure.Search.Documents.Indexes.Models.EntityRecognitionSkillV3Azure.Search.Documents.Indexes.Models.SentimentSkillV3ConditionalSkill, DocumentExtractionSkill, ShaperSkillet . ImageAnalysisSkillOcrSkill

SearchIndexerSkillset

Liste des compétences.

SearchIndexerStatus

Represente le statut actuel et l'historique d'exécution d'un indexeur.

SearchIndexerWarning

Représente un avertissement au niveau de l’élément.

SearchIndexStatistics

Statistiques pour un index donné. Les statistiques sont collectées régulièrement et ne sont pas garanties d’être toujours à jour.

SearchResourceCounter

Représente l’utilisation et le quota d’une ressource.

SearchResourceEncryptionKey

Une clé de chiffrement gérée par le client dans Azure Key Vault. Les clés que vous créez et gérez peuvent être utilisées pour chiffrer ou déchiffrer les données au repos dans Recherche cognitive Azure, telles que les index et les mappages de synonymes.

SearchServiceCounters

Représente les compteurs de ressources et les quotas de niveau de service.

SearchServiceLimits

Représente différentes limites de niveau de service.

SearchServiceStatistics

Réponse d’une demande de statistiques de service get. Si elle réussit, elle inclut des compteurs et des limites de niveau de service.

SearchSuggester

Définit la façon dont l’API Suggest doit s’appliquer à un groupe de champs dans l’index.

SemanticConfiguration

Définit une configuration spécifique à utiliser dans le contexte des fonctionnalités sémantiques.

SemanticField

Champ utilisé dans le cadre de la configuration sémantique.

SemanticSettings

Définit les paramètres d’un index de recherche qui influencent les fonctionnalités sémantiques.

SentimentSkill

Cette compétence est déconseillée. Utilisez la V3. SentimentSkill à la place.

ShaperSkill

Une compétence pour remodeler les sorties. Il crée un type complexe pour prendre en charge les champs composites (également appelés champs à parties multiples).

ShingleTokenFilter

Crée des combinaisons de jetons sous la forme d’un unique jeton. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

SimilarityAlgorithm

Type de base pour les algorithmes de similarité. Les algorithmes de similarité sont utilisés pour calculer les scores qui lient des requêtes à des documents. Plus le score est élevé, plus le document est pertinent pour cette requête spécifique. Ces scores sont utilisés pour classer les résultats de la recherche. Veuillez noter qu’il SimilarityAlgorithm s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent BM25Similarity et ClassicSimilarity.

SimpleField

Champ simple utilisant un type primitif ou une collection d’un type primitif.

SnowballTokenFilter

Filtre qui permet d’endiguer les mots à l’aide d’un stemmer généré par Snowball. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

SoftDeleteColumnDeletionDetectionPolicy

Définit une stratégie de détection de suppression des données qui implémente une stratégie de suppression réversible. Il détermine si un élément doit être supprimé en fonction de la valeur d’une colonne « suppression réversible » désignée.

SplitSkill

Compétence permettant de diviser une chaîne en blocs de texte.

SqlIntegratedChangeTrackingPolicy

Définit une stratégie de détection des modifications de données qui capture les modifications à l’aide de la fonctionnalité de Change Tracking intégrée de Azure SQL Database.

StemmerOverrideTokenFilter

Offre la possibilité de remplacer d’autres filtres de base de données par un suivi basé sur un dictionnaire personnalisé. Tous les termes dérivés d’un dictionnaire seront marqués en tant que mots clés afin qu’ils ne soient pas enserrés avec des stemmers en aval de la chaîne. Doit être placé avant les filtres de recherche de radical. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

StemmerTokenFilter

Filtre de stemming spécifique au langage. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

StopAnalyzer

Divise le texte en non-lettres ; Applique les filtres de jeton en minuscules et en mots vides. Cet analyseur est implémenté à l’aide d’Apache Lucene.

StopwordsTokenFilter

Supprime les mots vides d’un flux de jetons. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

SynonymMap

Représente une définition de carte de synonymes.

SynonymTokenFilter

Correspond à des synonymes uniques ou à plusieurs mots dans un flux de jetons. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

TagScoringFunction

Définit une fonction qui augmente les scores de documents avec des valeurs de chaîne correspondant à une liste donnée de balises.

TagScoringParameters

Fournit des valeurs de paramètre à une fonction de scoring d’étiquettes.

TextTranslationSkill

Une compétence pour traduire du texte d’une langue à une autre.

TextWeights

Définit des pondérations sur les champs d’index pour lesquels les correspondances doivent augmenter le score dans les requêtes de recherche.

TokenFilter

Type de base pour les filtres de jetons. Veuillez noter qu’il TokenFilter s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent AsciiFoldingTokenFilter, CjkBigramTokenFilter, DictionaryDecompounderTokenFilterEdgeNGramTokenFilterKeepTokenFilterElisionTokenFilterKeywordMarkerTokenFilterEdgeNGramTokenFilterLimitTokenFilterNGramTokenFilterNGramTokenFilterLengthTokenFilterPatternReplaceTokenFilterCommonGramTokenFilterPatternCaptureTokenFilterPhoneticTokenFilter, SnowballTokenFilterShingleTokenFilterSynonymTokenFilterStopwordsTokenFilterStemmerOverrideTokenFilterStemmerTokenFilter, TruncateTokenFilteret . UniqueTokenFilterWordDelimiterTokenFilter

TruncateTokenFilter

Tronque les termes à une longueur spécifique. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

UaxUrlEmailTokenizer

Génère des jetons pour des URL et des e-mails sous la forme d’un seul jeton. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

UniqueTokenFilter

Élimine les jetons avec le même texte que le jeton précédent. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

VectorSearch

Contient des options de configuration liées à la recherche vectorielle.

VectorSearchAlgorithmConfiguration

Contient des options de configuration spécifiques à l’algorithme utilisé lors de l’indexation et/ou de l’interrogation. Veuillez noter qu’il VectorSearchAlgorithmConfiguration s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent ExhaustiveKnnVectorSearchAlgorithmConfiguration et HnswVectorSearchAlgorithmConfiguration.

VectorSearchProfile

Définit une combinaison de configurations à utiliser avec la recherche vectorielle.

VectorSearchVectorizer

Contient des détails spécifiques pour une méthode de vectorisation à utiliser pendant l’heure de requête. Veuillez noter qu’il VectorSearchVectorizer s’agit de la classe de base. Selon le scénario, une classe dérivée de la classe de base peut devoir être affectée ici, ou cette propriété doit être castée en une des classes dérivées possibles. Les classes dérivées disponibles incluent AzureOpenAIVectorizer et CustomVectorizer.

WebApiSkill

Compétence qui peut appeler un point de terminaison d’API web, ce qui vous permet d’étendre un ensemble de compétences en appelant votre code personnalisé.

WordDelimiterTokenFilter

Divise les mots en sous-mots et effectue des transformations facultatives sur les groupes de sous-mots. Ce filtre de jeton est implémenté à l’aide d’Apache Lucene.

Structures

BlobIndexerDataToExtract

Spécifie les données à extraire du stockage Blob Azure et indique à l’indexeur les données à extraire du contenu de l’image lorsque « imageAction » est défini sur une valeur autre que « none ». Cela s’applique au contenu d’image incorporé dans un .PDF ou une autre application, ou aux fichiers image tels que .jpg et .png, dans les objets blob Azure.

BlobIndexerImageAction

Détermine comment traiter les images incorporées et les fichiers image dans le stockage Blob Azure. La définition de la configuration « imageAction » sur une valeur autre que « none » nécessite qu’un ensemble de compétences soit également attaché à cet indexeur.

BlobIndexerParsingMode

Représente le mode d’analyse pour l’indexation à partir d’une source de données d’objets blob Azure.

BlobIndexerPdfTextRotationAlgorithm

Détermine l’algorithme pour l’extraction de texte à partir de fichiers PDF dans le stockage Blob Azure.

CharFilterName

Définit les noms de tous les filtres de caractères pris en charge par Recherche cognitive Azure.

CustomEntityLookupSkillLanguage

Codes de langue pris en charge pour le texte d’entrée par CustomEntityLookupSkill.

EntityCategory

Chaîne indiquant les catégories d’entités à retourner.

EntityRecognitionSkill.SkillVersion

Représente les informations de version de service d’un EntityRecognitionSkill.

EntityRecognitionSkillLanguage

Action déconseillée. Codes de langue pris en charge pour le texte d’entrée par EntityRecognitionSkill.

ImageAnalysisSkillLanguage

Codes de langue pris en charge pour l’entrée par ImageAnalysisSkill.

ImageDetail

Chaîne indiquant les détails spécifiques au domaine à retourner.

IndexerExecutionEnvironment

Spécifie l’environnement dans lequel l’indexeur doit s’exécuter.

IndexerExecutionStatusDetail

Détaille la status de l’exécution d’un indexeur individuel.

IndexingMode

Représente le mode dans lequel l’indexeur s’exécute.

IndexProjectionMode

Définit le comportement des projections d’index par rapport au reste de l’indexeur.

KeyPhraseExtractionSkillLanguage

Codes de langue pris en charge pour le texte d’entrée par KeyPhraseExtractionSkill.

LexicalAnalyzerName

Définit les noms de tous les analyseurs de texte pris en charge par Recherche cognitive Azure.

LexicalNormalizerName

Définit les noms de tous les normaliseurs de texte pris en charge par Recherche cognitive Azure.

LexicalTokenizerName

Définit les noms de tous les générateurs de jetons pris en charge par Recherche cognitive Azure.

LineEnding

Définit la séquence de caractères à utiliser entre les lignes de texte reconnues par la compétence OCR. La valeur par défaut est « space ».

OcrSkillLanguage

Codes de langue pris en charge pour l’entrée par OcrSkill.

PiiDetectionSkillMaskingMode

Chaîne indiquant le maskingMode à utiliser pour masquer les informations personnelles détectées dans le texte d’entrée.

RegexFlag

Définit des indicateurs qui peuvent être combinés pour contrôler la façon dont les expressions régulières sont utilisées dans l’analyseur de modèles et le générateur de jetons de modèle.

SearchFieldDataType

Définit le type de données d’un champ dans un index de recherche.

SearchIndexerDataSourceType

Définit le type d’une source de données.

SentimentSkill.SkillVersion

Représente les informations de version de service d’un SentimentSkill.

SentimentSkillLanguage

Action déconseillée. Codes de langue pris en charge pour le texte d’entrée par SentimentSkill.

SplitSkillLanguage

Codes de langue pris en charge pour le texte d’entrée par SplitSkill.

TextSplitMode

Valeur indiquant le mode fractionné à effectuer.

TextTranslationSkillLanguage

Codes de langue pris en charge pour le texte d’entrée par TextTranslationSkill.

TokenFilterName

Définit les noms de tous les filtres de jetons pris en charge par Recherche cognitive Azure.

VectorSearchAlgorithmKind

Algorithme utilisé pour l’indexation et l’interrogation.

VectorSearchAlgorithmMetric

Métrique de similarité à utiliser pour les comparaisons de vecteurs.

VectorSearchVectorizerKind

Méthode de vectorisation à utiliser pendant l’heure de requête.

VisualFeature

Chaînes indiquant les types de caractéristiques visuelles à retourner.

Énumérations

CjkBigramTokenFilterScripts

Scripts qui peuvent être ignorés par CjkBigramTokenFilter.

EdgeNGramTokenFilterSide

Spécifie le côté de l’entrée à partir duquel un n-gramme doit être généré.

IndexerExecutionStatus

Représente l'état d'exécution d'un indexeur individuel.

IndexerStatus

Représente l'état global de l'indexeur.

MicrosoftStemmingTokenizerLanguage

Répertorie les langues prises en charge par le générateur de jetons de base de langue Microsoft.

MicrosoftTokenizerLanguage

Répertorie les langues prises en charge par le générateur de jetons de langue Microsoft.

PhoneticEncoder

Identifie le type d’encodeur phonétique à utiliser avec un PhoneticTokenFilter.

ScoringFunctionAggregation

Définit la fonction d’agrégation utilisée pour combiner les résultats de toutes les fonctions de scoring dans un profil de scoring.

ScoringFunctionInterpolation

Définit la fonction utilisée pour interpoler l’augmentation du score dans une plage de documents.

SnowballTokenFilterLanguage

Langue à utiliser pour un filtre de jeton Snowball.

StemmerTokenFilterLanguage

Langue à utiliser pour un filtre de jeton stemmer.

StopwordsList

Identifie une liste prédéfinie de mots vides spécifiques à la langue.

TokenCharacterKind

Représente les classes de caractères sur lesquelles un filtre de jeton peut fonctionner.