Share via


Client d’ingestion avec Azure AI services

Le client d’ingestion est un outil publié par Microsoft sur GitHub qui vous aide à déployer rapidement une solution de transcription de centre d’appels sur Azure avec une approche sans code.

Conseil

Vous pouvez utiliser l’outil et la solution obtenue en production pour traiter un volume élevé de données audio.

Le client d’ingestion utilise Azure AI Language, Azure AI Speech, le stockage Azure et Azure Functions.

Démarrer avec le client d’ingestion

Un compte Azure et une ressource Azure AI services multiservice sont nécessaires pour exécuter le client d’ingestion.

Consultez le Guide de démarrage du client d’ingestion sur GitHub pour savoir comment configurer et utiliser l’outil.

Fonctionnalités du client d’ingestion

Le client d’ingestion connecte en mode serverless un compte de stockage Azure dédié à des fonctions Azure personnalisées pour transmettre les demandes de transcription au service. Les fichiers audio transcrits sont contenus dans le conteneur Stockage Azure dédié.

Important

La tarification varie en fonction du mode d’opération (traitement par lots ou temps réel), ainsi que de la référence SKU Azure Function sélectionnée. Par défaut, l’outil crée une référence (SKU) de fonction Azure Premium pour gérer un volume important. Pour plus d’informations, consultez la page des tarifs.

En interne, l’outil utilise les services Speech et Language et suit les bonnes pratiques pour gérer le scale-up, les nouvelles tentatives et le basculement. Le schéma suivant décrit les ressources et les connexions.

Diagram that shows the Ingestion Client Architecture.

Les fonctionnalités du service Speech suivantes sont utilisées par le client d’ingestion :

  • Reconnaissance vocale par lot : permet de transcrire de grandes quantités de fichiers audio de manière asynchrone, y compris la diarisation de l’orateur, et est généralement utilisée dans les scénarios d’analytique post-appel. La diarisation est le processus de reconnaissance et de séparation des orateurs dans les données audio monocanal.

Voici quelques fonctionnalités du service Language qui sont utilisées par le client d’ingestion :

Outre Azure AI services, ces produits Azure permettent de constituer la solution :

  • Stockage Azure : permet de stocker les données de téléphonie et les transcriptions retournées par l’API de transcription par lots. Ce compte de stockage doit utiliser des notifications, en particulier quand de nouveaux fichiers sont ajoutés. Ces notifications permettent de déclencher le processus de transcription.
  • Azure Functions : permet de créer l’URI de signature d’accès partagé (SAP) pour chaque enregistrement et déclencher la requête HTTP POST afin de démarrer une transcription. En outre, avec Azure Functions, vous pouvez créer des requêtes pour récupérer et supprimer des transcriptions par le biais de l’API de transcription par lot.

Personnalisation des outils

L’outil est conçu pour afficher rapidement les résultats des clients. Vous pouvez personnaliser l’outil sur vos références SKU préférées et le programme d’installation. Les références SKU peuvent être modifiés à partir du portail Azure et le code lui-même est disponible sur GitHub.

Notes

Nous vous suggérons de créer les ressources dans le même groupe de ressources dédié pour comprendre et suivre les coûts plus facilement.

Étapes suivantes