Planifier la gestion des coûts pour le service Azure OpenAI

Cet article explique comment vous pouvez planifier et gérer les coûts pour Azure OpenAI Service. Avant de déployer le service, utilisez la calculatrice de prix Azure pour estimer les coûts d’Azure OpenAI. Ensuite, lorsque vous ajoutez les ressources Azure, passez en revue les coûts estimés. Une fois que vous avez commencé à utiliser des ressources d’Azure OpenAI, utilisez les fonctionnalités de Cost Management pour définir des budgets et surveiller les coûts.

Vous pouvez également passer en revue les coûts prévus et déterminer les tendances des dépenses pour identifier les domaines dans lesquels vous pourriez vouloir agir. Les coûts du service Azure OpenAI ne représentent qu’une partie des coûts mensuels sur votre facture Azure. Bien que cet article soit axé sur la planification et la gestion des coûts pour Azure OpenAI, vous êtes facturé pour tous les services et ressources Azure utilisés dans votre abonnement Azure, y compris les services tiers.

Prérequis

Analyse des coûts dans Cost Management prend en charge la plupart des types de compte Azure, mais pas tous. Pour accéder à la liste complète des types de comptes pris en charge, voir Comprendre les données de Cost Management. Pour afficher les données de coût, vous avez au minimum besoin d’un accès en lecture pour un compte Azure. Pour plus d’informations sur l’attribution de l’accès aux données Azure Cost Management, consultez Assigner l’accès aux données.

Estimer les coûts avant d’utiliser Azure OpenAI

Utilisez la calculatrice de prix Azure pour estimer les coûts d'utilisation d’Azure OpenAI.

Comprendre le modèle de facturation complet d’Azure OpenAI

Le service Azure OpenAI fonctionne sur l’infrastructure Azure qui génère des coûts lorsque vous déployez de nouvelles ressources. Il peut y avoir d’autres coûts d’infrastructure susceptibles de s’accumuler. Les sections suivantes décrivent comment vous êtes facturé pour Azure OpenAI Service.

Modèles de la série de base et de la série Codex

Les modèles des séries de base Azure OpenAI et des séries Codex sont facturés par 1 000 jetons. Les coûts varient en fonction de la série de modèles que vous choisissez : Ada, Babbage, Curie, Davinci ou Code-Cushman.

Les modèles Azure OpenAI comprennent et traitent le texte en le divisant en jetons. Pour référence, chaque jeton correspond à environ quatre caractères pour un texte typique en anglais.

Les coûts des jetons englobent à la fois l’entrée et la sortie. Par exemple, supposons que vous avez un échantillon de code JavaScript de 1 000 jetons et que vous demandez à un modèle Azure OpenAI de le convertir en Python. Vous serez facturé environ 1 000 jetons pour la demande d’entrée initiale envoyée, et 1 000 autres jetons pour la sortie reçue en réponse, ce qui fait un total de 2 000 jetons.

En pratique, pour ce type d’appel de complétion, l’entrée/sortie de jetons ne serait pas une correspondance parfaite 1:1. La conversion d’un langage de programmation en un autre pourrait entraîner une sortie plus longue ou plus courte en fonction d’un grand nombre de facteurs. L’un de ces facteurs est la valeur affectée au paramètre max_tokens.

Modèles affinés des séries Base et Codex

Les modèles affinés d’Azure OpenAI sont facturés en fonction de trois facteurs :

  • Heures de formation
  • Heures d’hébergement
  • Inférence par 1 000 jetons

Il est important de connaître le coût des heures d’hébergement. En effet, après le déploiement d’un modèle affiné, il continue d’entraîner un coût horaire, que vous l’utilisiez activement ou non. Surveillez de près les coûts des modèles affinés.

Important

Après le déploiement d’un modèle personnalisé, si le déploiement reste inactif pendant plus de quinze (15) jours consécutifs, le déploiement est supprimé. Le déploiement d’un modèle personnalisé est inactif si le déploiement du modèle a été effectué plus de quinze (15) jours auparavant et qu’aucun appel de complétion ou d’achèvement de conversation n’a été effectué pendant une période continue de 15 jours.

La suppression d’un déploiement inactif ne supprime ou n’affecte pas le modèle personnalisé sous-jacent. Ainsi, le modèle personnalisé peut être redéployé à tout moment.

Chaque modèle personnalisé (ajusté) déployé entraîne un coût horaire d’hébergement, indépendamment des appels d’achèvement ou d’achèvements de conversations instantanées effectués vers le modèle. .

Autres coûts pouvant s’accumuler avec le service Azure OpenAI

L’activation de fonctionnalités telles que l’envoi de données aux journaux Azure Monitor et la génération d’alertes entraîne des coûts supplémentaires pour ces services. Ces coûts sont visibles sous ces autres services et au niveau de l’abonnement, mais ne sont pas visibles lorsqu’ils sont limités à votre ressource Azure OpenAI.

Utiliser le prépaiement Azure avec le service Azure OpenAI

Vous pouvez payer les frais du service Azure OpenAI avec votre crédit de prépaiement Azure. Vous ne pouvez cependant pas utiliser le crédit Paiement anticipé Azure pour payer des frais pour des produits et services tiers, y compris les produits et services qui se trouvent sur la Place de marché Azure.

Code de réponse d’erreur HTTP et état de facturation dans le service Azure OpenAI

Si le service effectue le traitement, vous pouvez être facturé même si le code d’état n’est pas réussi (pas l’erreur 200). Par exemple, une erreur 400 en raison d’un filtre de contenu ou d’une limite d’entrée, ou d’une erreur 408 en raison d’un délai d’expiration.

Si le service n’effectue pas de traitement, vous ne serez pas facturé. Par exemple, une erreur 401 en raison de l’authentification ou d’une erreur 429 en raison d’un dépassement de la limite de débit.

Superviser les coûts

À mesure que vous utilisez des ressources Azure avec Azure OpenAI, vous générez des coûts. Les coûts unitaires d’utilisation des ressources Azure varient selon des intervalles de temps (secondes, minutes, heures et jours) ou selon l’utilisation d’unités (octets, mégaoctets, etc.). Dès que l’utilisation d’Azure OpenAI démarre, des coûts sont occasionnés, que vous pouvez voir dans l’analyse des coûts.

Quand vous utilisez une analyse des coûts, vous voyez les coûts d’Azure OpenAI dans des graphiques et des tableaux pour différents intervalles de temps. Par exemple, par jour, par année ou pour le mois en cours ou le mois précédent. Vous pouvez aussi afficher les coûts par rapport aux budgets et aux coûts prévus. Passez à des vues pour des périodes plus longues pour identifier les tendances des dépenses. Vous pouvez voir où des dépassements ont pu se produire. Si vous avez créé des budgets, vous pouvez aussi facilement voir à quel moment ils ont été dépassés.

Pour consulter les coûts d’Azure OpenAI dans l’analyse des coûts :

  1. Connectez-vous au portail Azure.
  2. Sélectionnez l’une de vos ressources Azure OpenAI.
  3. Sous Gestion des ressources, sélectionnez Analyse des coûts
  4. Par défaut, l’analyse des coûts s’applique à la ressource Azure OpenAI individuelle.

Capture d’écran du tableau de bord d’analyse des coûts étendu à une ressource Azure OpenAI.

Pour comprendre la décomposition de ce qui constitue ce coût, il peut être utile de modifier Grouper par en Compteur et de changer le type de graphique en Ligne. Vous pouvez maintenant voir que pour cette ressource particulière, la source des coûts provient de trois séries de modèles différentes avec des jetons Text-Davinci représentant la majeure partie des coûts.

Capture d’écran du tableau de bord d’analyse des coûts avec groupe par défini sur compteur.

Il est important de comprendre l’étendue lors de l’évaluation des coûts associés à Azure OpenAI. Si vos ressources font partie du même groupe de ressources, vous pouvez étendre l’analyse des coûts à ce niveau pour comprendre l’effet sur les coûts. Si vos ressources sont réparties entre plusieurs groupes de ressources, vous pouvez définir l’étendue au niveau de l’abonnement.

Lorsque l’étendue est définie à un niveau supérieur, vous devez souvent ajouter des filtres supplémentaires pour axer les résultats sur l’utilisation d’Azure OpenAI. Lorsque l’étendue est définie au niveau de l’abonnement, vous voyez un certain nombre d’autres ressources dont vous ne vous souciez peut-être pas dans le contexte de la gestion des coûts d’Azure OpenAI. Lorsque l’étendue est définie au niveau de l’abonnement, nous vous recommandons d’accéder à l’outil d’analyse des coûts complet sous le service Cost Management.

Voici un exemple d’utilisation de l’outil d’analyse des coûts pour voir vos coûts cumulés pour un abonnement ou un groupe de ressources :

  1. Recherchez Cost Management dans la barre de recherche supérieure d’Azure pour accéder à l’expérience de service complète, qui comprend davantage d’options telles que la création de budgets.
  2. Si nécessaire, sélectionnez modifier si le champ Étendue : ne pointe pas vers le groupe de ressources ou l’abonnement que vous souhaitez analyser.
  3. Sur la gauche, sélectionnez Rapports + analyse>Analyse des coûts.
  4. Sous l’onglet Toutes les vues, sélectionnez Coûts cumulés.

Capture d’écran du tableau de bord d’analyse des coûts montrant comment accéder aux coûts cumulés.

Le tableau de bord d’analyse des coûts affiche les coûts cumulés qui sont analysés en fonction de l’Étendue que vous avez spécifiée.

Capture d’écran du tableau de bord d’analyse des coûts avec l’étendue définie sur l’abonnement.

Si vous essayez d’ajouter un filtre par service, vous constatez que vous ne trouvez pas Azure OpenAI dans la liste. Cette situation se produit parce qu’Azure OpenAI a des points communs avec un sous-ensemble de services Azure AI où le filtre de niveau de service est Cognitive Services. Si vous souhaitez afficher toutes les ressources Azure OpenAI dans un abonnement sans aucun autre type de ressources Azure AI services, choisissez plutôt l’étendue Niveau de service : Azure OpenAI :

Capture d’écran du tableau de bord d’analyse des coûts avec le niveau de service mis en évidence.

Créer des budgets

Vous pouvez créer des budgets pour gérer les coûts, et des alertes permettant d’avertir les parties prenantes en cas d’anomalies de dépenses et de risques de dépenses excessives. Les alertes sont basées sur les dépenses par rapport aux seuils de budget et de coût. Vous créez des budgets et des alertes pour les abonnements et groupes de ressources Azure. Ils sont utiles dans le cadre d’une stratégie globale de surveillance des coûts.

Vous pouvez créer des budgets avec des filtres pour des ressources ou des services spécifiques dans Azure si vous souhaitez disposer d’une plus grande granularité dans votre surveillance. Les filtres vous permettent de vous assurer que vous ne créez pas accidentellement de nouvelles ressources entraînant un surcoût. Pour plus d’informations sur les options de filtre disponibles lorsque vous créez un budget, consultez Options de regroupement et de filtre.

Important

Bien qu’OpenAI dispose d’une option de limites strictes qui vous empêchent de dépasser votre budget, Azure OpenAI ne fournit pas actuellement cette fonctionnalité. Vous pouvez lancer l’automatisation à partir de groupes d’actions dans le cadre de vos notifications budgétaires pour prendre des mesures plus avancées, mais cela nécessite un développement personnalisé supplémentaire de votre part.

Exporter des données de coûts

Vous pouvez également exporter vos données de coût vers un compte de stockage, ce qui est utile lorsque vous avez besoin d’autres personnes pour effectuer une analyse supplémentaire des données de coûts. Par exemple, une équipe Finance peut analyser les données avec Excel ou Power BI. Vous pouvez exporter vos coûts selon une planification quotidienne, hebdomadaire ou mensuelle, et définir une plage de dates personnalisée. Nous vous recommandons d’exporter les données de coût comme moyen de récupérer les jeux de données des coûts.

Étapes suivantes