Qu’est-ce que Speech Studio ?

Speech Studio est un ensemble d’outils basés sur une interface utilisateur permettant de créer et d’intégrer des fonctionnalités du service Azure Speech dans vos applications. Vous créez des projets dans Speech Studio à l’aide d’une approche sans code, puis vous référencez les ressources que vous créez dans vos applications à l’aide du SDK Speech, de l’interface CLI Speech ou de différentes API REST.

Configurer votre compte Azure

Vous devez disposer d’un compte Azure et ajouter une ressource de service Speech pour pouvoir utiliser Speech Studio. Si vous n’avez ni compte ni ressource, essayez le service Speech gratuitement.

Après avoir créé un compte Azure et une ressource de service Speech :

  1. Connectez-vous à Speech Studio avec votre compte Azure.
  2. Sélectionnez la ressource de service Speech dont vous avez besoin pour commencer. (Vous pouvez modifier les ressources à tout moment en sélectionnant « Paramètres » dans le menu supérieur.)

Fonctionnalités de Speech Studio

Les fonctionnalités suivantes du service Speech sont disponibles sous forme de types de projet dans Speech Studio.

  • Reconnaissance vocale en temps réel : Testez rapidement la reconnaissance vocale en déplaçant des fichiers audio par glisser-déposer sans utiliser de code. Il s’agit d’un outil de démonstration permettant de voir comment fonctionne la reconnaissance vocale sur vos échantillons audio. Consultez cependant la vue d’ensemble de la reconnaissance vocale pour explorer toutes les fonctionnalités disponibles.
  • Custom Speech : Custom Speech vous permet de créer des modèles de reconnaissance vocale adaptés à des jeux de vocabulaire et types de diction spécifiques. Contrairement aux modèles de reconnaissance vocale de base, les modèles Custom Speech contribuent à vous doter d’un avantage concurrentiel unique, car ils ne sont pas accessibles publiquement. Consultez le guide de démarrage rapide pour commencer à télécharger des échantillons audio afin de créer un modèle Custom Speech.
  • Évaluation de la prononciation : Cette fonctionnalité évalue la prononciation des entrées vocales et fournit des commentaires aux orateurs sur la justesse et l’aisance des paroles prononcées. Speech Studio fournit un bac à sable qui vous permet de tester cette fonctionnalité rapidement sans code. Consultez cependant l’article de procédure expliquant comment l’utiliser avec le SDK Speech dans vos applications.
  • Galerie vocale : Créez des applications et services qui parlent d’une façon naturelle. Choisissez parmi plus de 170 voix dans plus de 70 langues et variantes. Donnez vie à vos scénarios avec des voix neuronales très expressives et humaines.
  • Custom Voice : Custom Voice vous permet de créer des voix personnalisées et uniques pour la synthèse vocale. Vous fournissez des fichiers audio et créez les transcriptions correspondantes dans Speech Studio, puis vous utilisez les voix personnalisées dans vos applications. Consultez l’article de procédure sur la création et l’utilisation de voix personnalisées par le biais de points de terminaison.
  • Création de contenu audio : Création de contenu audio est un outil simple d’utilisation qui vous permet de créer du contenu audio très naturel pour un large éventail de scénarios comme les livres audio, les diffusions d’actualités, les narrations vidéo et les chatbots. Speech Studio vous permet d’exporter les fichiers audio que vous créez pour les utiliser dans vos applications.
  • Mot clé personnalisé : Un mot clé personnalisé est un mot ou une expression courte qui permet d’activer votre produit à la voix. Vous créez un mot clé personnalisé dans Speech Studio, puis générez un fichier binaire à utiliser avec le SDK Speech dans vos applications.
  • Commandes personnalisées : Ces commandes facilitent la création d’applications de commandes vocales complètes, optimisées pour les expériences d’interaction de type « voice-first ». Elles offrent une expérience de création sans code dans Speech Studio, un modèle d’hébergement automatique et une complexité relativement inférieure, vous permettant de vous concentrer sur la conception de la meilleure solution pour vos scénarios de commandes vocales. Pour plus d’informations sur la création d’applications de commandes personnalisées, consultez ce guide pratique. Consultez également le guide sur l’intégration de votre application de commandes personnalisées avec le SDK Speech.

Étapes suivantes

Explorez Speech Studio et créez un projet.