Présentation

1 minute

Les capacités vocales de l’IA nous permettent de gérer des systèmes pour les secteurs de l’habitat et de l’automobile avec des instructions vocales, d’obtenir des réponses formulées par des ordinateurs à des questions parlées, de générer des sous-titres à partir de sources audio, etc.

Pour permettre ce type d’interaction, le système IA doit prendre en charge deux fonctionnalités :

Reconnaissance vocale : capacité à détecter et à interpréter des entrées parlées
Synthèse vocale : capacité à générer une sortie parlée

Azure AI Speech fournit des fonctionnalités de reconnaissance vocale et de synthèse vocale. Vous pouvez utiliser des modèles de service Speech prédéfinis et personnalisés pour diverses tâches comme la transcription de l’audio en texte avec une précision élevée, l’identification des orateurs dans les conversations et la création de voix personnalisées. Vous découvrirez ensuite comment fonctionnent les fonctionnalités d’AI Speech.

Continuer

Commentaires