Qu’est-ce que la reconnaissance vocale ?What is speech-to-text?

La reconnaissance vocale du service Speech permet la transcription en temps réel des flux audio en texte.Speech-to-text from the Speech service, also known as speech recognition, enables real-time transcription of audio streams into text. Vos applications, outils ou appareils peuvent consommer, afficher et agir sur ce texte sous la forme d’une entrée de commande.Your applications, tools, or devices can consume, display, and take action on this text as command input. Ce service s’appuie sur la même technologie de reconnaissance que celle utilisée par Microsoft pour Cortana et les produits Office.This service is powered by the same recognition technology that Microsoft uses for Cortana and Office products. Il fonctionne de façon homogène avec les offres de service de traduction et de synthèse vocale .It seamlessly works with the translation and text-to-speech service offerings. Vous trouverez une liste complète des langues compatibles avec la reconnaissance vocale dans Langues prises en charge.For a full list of available speech-to-text languages, see supported languages.

Par défaut, le service de reconnaissance vocale utilise le modèle de langage universel.The speech-to-text service defaults to using the Universal language model. Ce modèle a été entraîné avec des données qui sont la propriété de Microsoft et est déployé dans le cloud.This model was trained using Microsoft-owned data and is deployed in the cloud. Il est particulièrement adapté aux scénarios de conversation et de dictée.It's optimal for conversational and dictation scenarios. Si vous utilisez la reconnaissance vocale pour la reconnaissance et la transcription dans un environnement unique, vous pouvez créer et entraîner des modèles de prononciation, de langue et d’acoustique personnalisés.When using speech-to-text for recognition and transcription in a unique environment, you can create and train custom acoustic, language, and pronunciation models. La personnalisation permet de prendre en compte un bruit ambiant ou le vocabulaire spécifique d’un secteur.Customization is helpful for addressing ambient noise or industry-specific vocabulary.

Notes

La reconnaissance vocale Bing a été mise hors service le 15 octobre 2019.Bing Speech was decommissioned on October 15, 2019. Si vos applications, outils ou produits utilisent les API Reconnaissance vocale Bing ou Custom Speech, nous avons créé des guides pour vous aider à effectuer leur migration vers le service Speech.If your applications, tools, or products are using the Bing Speech APIs or Custom Speech, we've created guides to help you migrate to the Speech service.

Commencer avec la reconnaissance vocaleGet started with speech-to-text

Le service de reconnaissance vocale est disponible via le SDK Speech.The speech-to-text service is available via the Speech SDK. Plusieurs scénarios courants sont disponibles sous forme de démarrages rapides, dans différentes langues et plateformes :There are several common scenarios available as quickstarts, in various languages and platforms:

Si vous préférez utiliser le service REST de reconnaissance vocale, consultez API REST.If you prefer to use the speech-to-text REST service, see REST APIs.

Tutoriels et exemple de codeTutorials and sample code

Une fois que vous aurez eu l’occasion d’utiliser le service Speech, essayez notre tutoriel qui vous apprendra à reconnaître les intentions d’un discours à l’aide du SDK Speech et de LUIS.After you've had a chance to use the Speech service, try our tutorial that teaches you how to recognize intents from speech using the Speech SDK and LUIS.

Un exemple de code pour le SDK Speech est disponible sur GitHub.Sample code for the Speech SDK is available on GitHub. Ces exemples couvrent des scénarios courants tels que la lecture du signal audio d’un fichier ou d’un flux, la reconnaissance continue et ponctuelle, et l’utilisation de modèles personnalisés.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition, and working with custom models.

PersonnalisationCustomization

En plus du modèle du service Speech standard, vous pouvez créer des modèles personnalisés.In addition to the standard Speech service model, you can create custom models. La personnalisation permet d’éliminer les obstacles à la reconnaissance vocale, comme le style d’élocution, le bruit de fond et le vocabulaire. Consultez Custom Speech.Customization helps to overcome speech recognition barriers such as speaking style, vocabulary and background noise, see Custom Speech. Les options de personnalisation varient selon la langue et les paramètres régionaux. Consultez Langues prises en charge pour vérifier ce qui est pris en charge.Customization options vary by language/locale, see supported languages to verify support.

Documents de référenceReference docs

Le service Speech fournit deux kits de développement logiciel (SDK).The Speech service provides two SDKs. Le premier SDK est le kit de développement logiciel (SDK) principal Speech et fournit la plupart des fonctionnalités nécessaires à l’interaction avec le service vocal.The first SDK is the primary Speech SDK and provides most of the functionalities needed to interact with the Speech service. Le deuxième kit de développement logiciel (SDK) est spécifique aux appareils, nommé de manière appropriée le kit de développement logiciel Speech Devices.The second SDK is specific to devices, appropriately named the Speech Devices SDK. Les deux kits de développement logiciel (SDK) sont disponibles dans de nombreux langages.Both SDKs are available in many languages.

Documents de référence du Kit de développement logiciel (SDK) SpeechSpeech SDK reference docs

Utilisez la liste suivante pour rechercher les documents de référence du kit de développement logiciel (SDK) Speech appropriés :Use the following list to find the appropriate Speech SDK reference docs:

Conseil

Le kit de développement logiciel (SDK) Speech service est activement géré et mis à jour.The Speech service SDK is actively maintained and updated. Pour suivre les modifications, les mises à jour et les ajouts de fonctionnalités, reportez-vous aux notes de publication du kit de développement logiciel Speech.To track changes, updates and feature additions refer to the Speech SDK release notes.

Documentation de référence du kit de développement logiciel Speech DevicesSpeech Devices SDK reference docs

Le kit de développement logiciel (SDK) Speech Devices est un sur-ensemble du SDK Speech, avec des fonctionnalités étendues pour des appareils spécifiques.The Speech Devices SDK is a superset of the Speech SDK, with extended functionality for specific devices. Pour télécharger le kit de développement logiciel (SDK) Speech Devices, vous devez d’abord choisir un kit de développement.To download the Speech Devices SDK, you must first choose a development kit.

Références sur l'API RESTREST API references

Pour obtenir des références aux différentes API REST du service Speech, reportez-vous à la liste ci-dessous :For references of various Speech service REST APIs, refer to the listing below:

Étapes suivantesNext steps