Partager via


Planifier et gérer les coûts d’un service de recherche Azure AI

Cet article explique le modèle de facturation et les événements facturables du service Recherche Azure AI et fournit des instructions pour la gestion des coûts.

Dans un premier temps, estimez vos coûts de base à l’aide de la calculatrice de prix Azure. Vous pouvez également trouver les coûts estimés et les comparaisons de niveaux dans la page Sélectionner un niveau de tarification lors de la création d’un service.

Azure offre une gestion des coûts intégrée qui fait baisser les limites de service pour fournir une surveillance des coûts inclusifs et la possibilité de définir des budgets et de définir des alertes. Les coûts liés à l’exécution d’un service de recherche varient en fonction de la capacité et des fonctionnalités que vous utilisez. Une fois que vous avez créé votre service de recherche, optimisez sa capacité afin de payer uniquement ce dont vous avez besoin.

Comprendre le modèle de facturation

La recherche Azure AI s’exécute sur l’infrastructure Azure qui cumule les coûts lorsque vous déployez de nouvelles ressources. Il est important de comprendre qu’il peut y avoir d’autres coûts d’infrastructure supplémentaires susceptibles de s’accumuler.

Lorsque vous créez ou utilisez des ressources Search, vous pouvez être facturé pour les compteurs suivants :

  • Vous êtes facturé à un tarif horaire basé sur le niveau tarifaire de votre service de recherche, au prorata de l’heure.

  • Les frais sont appliqués en fonction du nombre d’unités de recherche (SU) alloué au service. Les unités de recherche sont des unités de capacité. Le SU total est le produit de réplicas et de partitions (R x P = SU) utilisé par votre service.

La facturation est basée sur la capacité (SU) et les coûts d’exécution des fonctionnalités Premium, telles que l’enrichissement par IA, le classeur sémantique et les points de terminaison privés. Les compteurs associés aux fonctionnalités Premium sont répertoriés dans le tableau suivant.

Compteur Unité
Extraction d’image (enrichissement par IA) 1, 2 Par unité de 1 000 images. Consultez la page de tarification.
Compétences de recherche d’entité personnalisée (enrichissement par IA) 1 Par unité de 1 000 enregistrements texte. Consultez la page de tarification
Compétences intégrées (enrichissement par IA) 1 Le nombre de transactions est facturé au même tarif que si vous aviez exécuté la tâche directement en appelant les Azure AI services. Vous pouvez traiter gratuitement 20 documents par indexeur et par jour. Les charges de travail plus volumineuses ou plus fréquentes nécessitent une clé Azure AI services de plusieurs ressources.
Classeur sémantique1 Nombre de requêtes de « queryType=semantic », facturées à un taux progressif. Consultez la page de tarification.
Liaison privée partagée1 Facturé pour la bande passante tant que la liaison privée partagée existe et est utilisée.

1 s’applique uniquement si vous utilisez ou activez la fonctionnalité.

2 Dans une configuration d’indexeur, imageAction est le paramètre qui déclenche l’extraction d’images. Si imageAction est défini sur « none » (valeur par défaut), l’extraction d’images ne vous est pas facturée. Des coûts sont facturés lorsque le paramètre imageAction est défini et que vous incluez l’OCR, l’analyse d’image ou l’extraction de documents dans un ensemble de compétences.

Vous n’êtes pas facturé sur le nombre de requêtes de texte intégral ou vectorielles, de réponses aux requêtes ou de documents ingérés, mais des limites de service s’appliquent à chaque niveau.

Le trafic de données peut également entraîner des coûts de mise en réseau. Consultez Tarification de la bande passante.

Plusieurs fonctionnalités Premium, telles que la base de connaissances, les sessions de débogage et le cache d’enrichissement, dépendent du Stockage Azure. Les compteurs du Stockage Azure s’appliquent dans ce cas, et les coûts de stockage associés à l’utilisation de ces fonctionnalités sont inclus dans la facture du Stockage Azure.

Les clés gérées par le client fournissent un double chiffrement du contenu sensible. Cette fonctionnalité nécessite un Azure Key Vaultfacturable).

Les compétences peut inclure des compétences intégrées facturables, des compétences de l’utilitaire intégrées non facturables et des compétences personnalisées. Les compétences utilitaires non facturables sont les suivantes : Logique conditionnelle, Modélisateur, Fusion de texte et Fractionnement de texte. Leur utilisation ne vous est pas facturée. Il n’existe aucune clé API requise ni aucune limite à 20 documents.

Une compétence personnalisée est une fonctionnalité que vous fournissez. Le coût d’utilisation d’une compétence personnalisée dépend entièrement du fait qu’un code personnalisé appelle d’autres services facturables. Il n’existe aucune clé API requise ni aucune limite à 20 documents sur les compétences personnalisées.

Superviser les coûts

La gestion des coûts est intégrée à l’infrastructure Azure. Pour plus d’informations sur le suivi des coûts, des outils et des API, consultez Facturation et gestion des coûts.

Réduire le coût

Suivez ces instructions pour réduire les coûts d’une solution de recherche Azure AI.

  1. Si possible, créez un service de recherche [dans une région qui a plus de stockage par partition](régions prises en charge. Si vous utilisez plusieurs ressources Azure dans votre solution, créez-les dans la même région ou dans le moins de régions possible afin de réduire ou d’éliminer les coûts de bande passante.

  2. Montez en puissance pour les opérations gourmandes en ressources, telles que l’indexation, puis réajustez à la baisse les charges de travail de requête régulières. S’il existe des modèles prévisibles pour vos charges de travail, vous pourrez peut-être synchroniser la montée en puissance pour qu’elle coïncide avec le volume attendu (vous devrez écrire du code pour automatiser cette opération).

    Lorsque vous estimez le coût d’une solution de recherche, gardez à l’esprit que la tarification et la capacité ne sont pas linéaires (le fait de doubler la capacité fait plus que doubler le coût au même niveau). En outre, à un moment donné, le passage à un niveau supérieur peut vous offrir des performances supérieures et plus rapides à environ le même prix. Pour plus d’informations et un exemple, consultez Mettre à niveau vers un niveau Standard S2.

  3. Envisagez d’utiliser l’application web Azure Web App pour votre application frontale afin que les demandes et réponses restent dans les limites du centre de données.

  4. Si vous utilisez l’enrichissement par IA, des frais supplémentaires pour le stockage de blobs s’appliquent, mais le coût cumulé diminue si vous activez la mise en cache d’enrichissement.

Créer des budgets

Vous pouvez créer des budgets pour gérer les coûts et des alertes permettant d’avertir automatiquement des parties prenantes en cas d’anomalies de dépenses et de risques de dépenses excessives. Les alertes sont basées sur les dépenses par rapport aux seuils de budget et de coût. Les budgets et les alertes sont créés pour les abonnements et les groupes de ressources Azure : ils sont donc utiles dans le cadre d’une stratégie globale de supervision des coûts.

Vous pouvez créer des budgets avec des filtres pour des ressources ou des services spécifiques dans Azure si vous souhaitez disposer d’une plus grande granularité dans votre analyse. Les filtres vous permettent de vous assurer que vous ne créez pas accidentellement de nouvelles ressources entraînant un surcoût. Pour plus d’informations sur les options de filtre disponibles lorsque vous créez un budget, consultez Options de regroupement et de filtre.

Exporter des données de coûts

Vous pouvez également exporter vos données de coûts vers un compte de stockage. C’est utile quand vous ou d’autres personnes avez besoin d’effectuer une analyse supplémentaire des données concernant les coûts. Par exemple, une équipe Finance peut analyser les données avec Excel ou Power BI. Vous pouvez exporter vos coûts selon une planification quotidienne, hebdomadaire ou mensuelle, et définir une plage de dates personnalisée. L’exportation des données des coûts est la méthode recommandée pour récupérer les jeux de données des coûts.

FAQ

Puis-je arrêter temporairement un service de recherche pour réduire les coûts ?

La recherche s’exécute en tant que service continu. Les ressources dédiées sont toujours opérationnelles et sont allouées pour votre usage exclusif pendant pour la durée de vie de votre service. Pour arrêter entièrement la facturation, vous devez supprimer le service. La suppression d'un service est définitive, et elle entraîne également la suppression des données associées à celui-ci.

Puis-je modifier le taux (niveau) de facturation d’un service de recherche existant ?

La mise à niveau sur place ou le passage à une version antérieure ne sont pas pris en charge. La modification d’un niveau de service nécessite la configuration d’un nouveau service au niveau souhaité.

Étapes suivantes