Qu’est-ce que la recherche Azure AI ?

Recherche Azure AI (anciennement appelé Recherche cognitive Azure) fournit une solution de récupération sécurisée des informations à grande échelle sur le contenu appartenant à l’utilisateur dans les applications de recherche traditionnelles et génératives.

La récupération des informations est fondamentale pour n’importe quelle application qui expose du texte et des vecteurs. Les scénarios courants incluent la recherche de catalogues ou de documents, l’exploration des données et, de plus en plus, les applications de style conversationnel basées sur des données propriétaires. Lorsque vous créez un service de recherche, vous utilisez les fonctionnalités suivantes :

D’un point de vue architectural, un service de recherche se trouve entre les magasins de données externes qui contiennent vos données non indexées et votre application cliente qui envoie des demandes de requête à un index de recherche et gère la réponse.

Azure AI Search architecture

Dans votre application cliente, l’expérience de recherche est définie au moyen d’API provenant de la recherche Azure AI ; elle peut inclure le paramétrage de la pertinence, le classement sémantique, la saisie semi-automatique, la correspondance des synonymes, la correspondance approximative, les critères spéciaux, le filtrage et le tri.

Dans la plateforme Azure, la recherche Azure AI peut s’intégrer à d’autres services Azure. Elle le fait sous la forme d’indexeurs qui automatisent l’ingestion ou la récupération des données à partir de sources de données Azure, et sous la forme d’ensembles de compétences qui incorporent l’IA consommable des Azure AI services (comme l’analyse des images et le traitement en langage naturel) ou l’IA personnalisée que vous créez dans Azure Machine Learning ou incluez dans un wrapper dans Azure Functions.

À l’intérieur d’un service de recherche

Sur le service de recherche proprement dit, les deux charges de travail principales sont l’indexation et l’interrogation.

  • L’indexation est un processus d’entrée qui charge du contenu dans votre service de recherche et le rend consultable. En interne, le texte entrant est traité en jetons et stocké dans des index inversés, et les vecteurs entrants sont stockés dans des index vectoriels. Le format de document que la recherche Azure AI peut indexer est JSON. Vous pouvez charger des documents JSON que vous avez assemblés, ou utiliser un indexeur pour récupérer et sérialiser vos données en JSON.

    L’enrichissement par IA via les compétences cognitives est une extension de l’indexation. Si vous avez des images ou du texte non structuré volumineux dans le document source, vous pouvez attacher des compétences qui effectuent l’OCR, décrivent des images, déduisent la structure, traduisent du texte et bien plus encore. Vous pouvez également attacher des compétences qui effectuent une segmentation et une vectorisation des données.

  • L’interrogation peut avoir lieu une fois qu’un index est rempli avec du texte pouvant faire l’objet d’une recherche, quand votre application cliente envoie des demandes de requête à un service de recherche et gère les réponses. Toutes les exécutions de requête se situent sur un index de recherche que vous contrôlez.

    Le classement sémantique est une extension de l’exécution de requête. Elle ajoute la compréhension du langage au traitement des résultats de recherche, en plaçant en haut les résultats les plus sémantiquement pertinents.

La recherche Azure AI est adapté aux scénarios d’application suivants :

  • Utilisez-le pour la recherche en texte intégral traditionnel et la recherche vectorielle de similarité nouvelle génération. Revenez à vos applications d’IA générative avec récupération d’informations qui tire parti de la force du mot clé et de la recherche de similarité. Utilisez les deux modalités pour récupérer les résultats les plus pertinents.

  • Consolidez le contenu hétérogène dans un index de recherche défini par l’utilisateur et rempli composé de vecteurs et de texte. Vous possédez et contrôlez les éléments pouvant faire l’objet d’une recherche.

  • Intégrer la segmentation et la vectorisation des données pour les applications IA et RAG génératives.

  • Appliquer un contrôle d’accès granulaire au niveau du document.

  • Déchargez les charges de travail d’indexation et de requête sur un service de recherche dédié.

  • Implémentez facilement les fonctionnalités de recherche : le réglage de la pertinence, la navigation par facettes, les filtres (y compris la recherche géospatiale), le mappage de synonymes et la saisie semi-automatique.

  • Transformez en segments recherchables de volumineux fichiers image ou texte indifférenciés ou des fichiers d’application stockés dans Stockage Blob Azure ou Azure Cosmos DB. Cette opération est effectuée pendant l’indexation en utilisant des compétences cognitives qui ajoutent un traitement externe à partir d’Azure AI.

  • Ajoutez une analyse de texte linguistique ou personnalisée. Si vous disposez d’un contenu autre que l’anglais, la recherche Azure AI prend en charge les analyseurs Lucene et les processeurs de langage naturel de Microsoft. Vous pouvez également configurer des analyseurs pour obtenir un traitement spécialisé de contenu brut, tel que le filtrage des signes diacritiques, ou la reconnaissance et la conservation de modèles dans les chaînes.

Pour plus d’informations sur les fonctionnalités spécifiques, consultez Fonctionnalités de la recherche Azure AI

Pour commencer

Cette fonctionnalité est exposée par le biais du portail Azure, d’une simple API REST ou de SDK Azure tels que le SDK Azure pour .NET. Le portail Azure prend en charge l’administration de service et la gestion de contenu, avec des outils de prototypage et d’interrogation de vos index et votre ensemble de compétences.

Une exploration de bout en bout des fonctionnalités de recherche de base peut être effectuée en quatre étapes :

  1. Choisissez un niveau et une région. Un seul service de recherche est autorisé par abonnement. Tous les démarrages rapides peuvent être effectués au niveau gratuit. Pour plus de capacités et de fonctionnalités, vous aurez besoin d'un niveau facturable.

  2. Créer un service de recherche dans le portail.

  3. Démarrez l’Assistant Importation de données. Choisissez un échantillon intégré ou une source de données prise en charge pour créer, charger et interroger un index en quelques minutes.

  4. Terminez avec l’Explorateur de recherche, en utilisant un client de portail pour interroger l'index de recherche que vous venez de créer.

Vous pouvez également créer, charger et interroger un index de recherche de manière atomique :

  1. Créez un index de recherche à l’aide du portail, de l’API REST, du SDK .NET ou d’un autre SDK. Le schéma d’index définit la structure du contenu pouvant être recherché.

  2. Chargez du contenu à l’aide du modèle « Push » pour envoyer (push) des documents JSON à partir de n’importe quelle source, ou utilisez le modèle « Pull » (indexeurs) si vos données sont d’un type pris en charge.

  3. Interrogez un index avec l’Explorateur de recherche dans le portail, l’API REST, le SDK .NET ou un autre SDK.

Conseil

Pour obtenir de l’aide sur les solutions complexes ou personnalisées, contactez un partenaire disposant d’une expertise approfondie de la technologie de recherche Azure AI.

Comparer les options de recherche

Les clients souhaitent souvent comparer les performances de la recherche Azure AI par rapport à d’autres solutions de recherche. Le tableau suivant récapitule ces différences clés.

Par rapport à Différences clés
Recherche Microsoft Recherche Microsoft est destinée aux utilisateurs authentifiés Microsoft 365 qui doivent interroger du contenu dans SharePoint. Recherche Azure AI extrait du contenu à partir d’Azure et de n’importe quel jeu de données au format JSON.
Bing Les API Bing interrogent les index de Bing.com afin de trouver des correspondances pour les termes recherchés. Recherche Azure AI explore le contenu que vous avez placé sur les index. Vous contrôlez l’ingestion des données, ainsi que le schéma.
Recherche de base de données SQL Server dispose de la recherche en texte intégral, tandis qu’Azure Cosmos DB et d’autres technologies similaires disposent d’index requêtables. Recherche Azure AI peut s’avérer intéressant quand vous recherchez des fonctionnalités telles que les analyseurs lexicaux, le réglage de la pertinence ou l'intégration de contenus provenant de sources diverses. L’utilisation des ressources est un autre point d’inflexion. L’indexation et les requêtes sont gourmandes en calcul. La recherche de déchargement du SGBD (système de gestion de base de données) conserve les ressources système pour le traitement transactionnel.
Solution de recherche dédiée En partant du principe que vous avez choisi la recherche dédiée avec l’ensemble des fonctionnalités, une dernière comparaison catégorielle se fera entre les différentes technologies de recherche. Pour les applications qui s’appuient principalement sur la recherche pour récupérer des informations et parcourir le contenu, Recherche Azure AI se distingue comme la solution la plus efficace parmi les fournisseurs de services cloud pour ce qui relève des charges de travail de recherche vectorielle, par mot clé et hybride sur les contenus hébergés sur Azure.

Voici les principaux atouts :

  • Stockez, indexez et recherchez des incorporations vectorielles pour les phrases, les images, les graphiques, etc.
  • Explorez des informations sémantiquement similaires aux requêtes de recherche, même en cas de non-correspondance exacte des termes de recherche.
  • Utilisez la recherche hybride pour bénéficier des avantages combinés de la recherche par mot clé et de la recherche vectorielle.
  • Optimisez la pertinence par le biais du classement sémantique et des profils de score.
  • Intégration de données (robots) au niveau de la couche d’indexation
  • Accédez aux intégrations d’Azure AI pour les transformations qui permettent la recherche sur le texte et les vecteurs de contenus.
  • Bénéficiez de la sécurité Microsoft Entra pour les connexions approuvées et de la sécurité Azure Private Link pour les connexions privées dans les scénarios sans Internet.
  • Expérience de recherche intégrale : effectuez des analyses de texte linguistiques et personnalisées dans 56 langues. Utilisez les facettes, les requêtes de saisie semi-automatique, les résultats suggérés et les synonymes.
  • Profitez de la mise à l’échelle, de la fiabilité et de la portée globale d’Azure.