Entrée vocaleVoice input

Entrée vocale

La voix est l’un des principaux types d’entrée sur HoloLens.Voice is one of the key forms of input on HoloLens. Elle vous permet de directement commander un hologramme sans avoir à utiliser des gestes à la main.It allows you to directly command a hologram without having to use hand gestures. Une entrée vocale peut être un moyen naturel de communiquer votre intention.Voice input can be a natural way to communicate your intent. La voix est particulièrement intéressante pour traverser les interfaces complexes, car elle permet aux utilisateurs de couper les menus imbriqués avec une commande.Voice is especially good at traversing complex interfaces, because it lets users cut through nested menus with one command.

L’entrée vocale est alimentée par le moteur qui prend en charge la reconnaissance vocale dans toutes les applications Windows universelles.Voice input is powered by the same engine that supports speech in all Universal Windows Apps. Sur HoloLens, la reconnaissance vocale fonctionne toujours dans la langue d’affichage Windows configurée dans les paramètres de votre appareil.On HoloLens, speech recognition will always function in the Windows display language configured in your device Settings.


Voix et regardVoice and gaze

Lorsque vous utilisez des commandes vocales, le point de vue de la tête ou de l’œil est le mécanisme de ciblage classique, qu’il s’agisse d’un curseur à « sélectionner » ou de la chaîne de votre commande à une application que vous examinez.When you're using voice commands, head or eye gaze is the typical targeting mechanism, whether with a cursor to "select" or to channel your command to an application you're looking at. Il se peut même qu’il n’y ait même pas besoin d’afficher un curseur pointant vers le regard (« Regardez-le, dites-le »).It may not even be required to show any gaze cursor ("see it, say it"). Certaines commandes vocales ne nécessitent pas de cible, par exemple « aller à démarrer » ou « Hey Cortana ».Some voice commands don't require a target at all, such as "go to start" or "Hey Cortana."


Prise en charge des appareilsDevice support

FonctionnalitéFeature HoloLens (1ère génération)HoloLens (1st gen) HoloLens 2HoloLens 2 Casques immersifsImmersive headsets
Entrée vocaleVoice input ✔️✔️ ✔️✔️ ✔️ (avec microphone)✔️ (with microphone)

Commande « sélectionner »The "select" command

HoloLens (1ère génération)HoloLens (1st gen)

Même sans ajouter spécifiquement la prise en charge vocale à votre application, vos utilisateurs peuvent activer des hologrammes simplement en disant à la commande System Voice « Select ».Even without specifically adding voice support to your app, your users can activate holograms simply by saying the system voice command "select". Cela se comporte de la même façon qu’un TAP Air sur HoloLens, en appuyant sur le bouton de sélection sur l’interactiveur hololensou en appuyant sur le déclencheur sur un contrôleur de mouvement Windows Mixed Reality.This behaves the same as an air tap on HoloLens, pressing the select button on the HoloLens clicker, or pressing the trigger on a Windows Mixed Reality motion controller. Vous entendez un son et vous voyez une info-bulle avec « sélectionner » qui s’affiche comme confirmation.You'll hear a sound and see a tooltip with "select" appear as confirmation. « SELECT » est activé par un algorithme de détection de mot clé de faible puissance, ce qui signifie que vous pouvez le prononcer à tout moment avec un impact minimal sur la durée de vie de la batterie."Select" is enabled by a low-power keyword detection algorithm, which means you can say it anytime with minimal battery life impact. Vous pouvez même indiquer « SELECT » avec vos mains.You can even say "select" with your hands at your side.



HoloLens 2HoloLens 2

Pour utiliser la commande vocale « SELECT » dans HoloLens 2, vous devez d’abord afficher le curseur en regard à utiliser comme pointeur.To use the "select" voice command in HoloLens 2, you first need to bring up the gaze cursor to use as a pointer. La commande pour l’afficher est facile à mémoriser, par exemple « Select ».The command to bring it up is easy to remember--just say, "select".

Pour quitter le mode, utilisez à nouveau vos mains, en appuyant sur un bouton avec vos doigts ou en utilisant le mouvement système.To exit the mode, use your hands again by air tapping, approaching a button with your fingers, or using the system gesture.

Image : dites « sélectionner » pour utiliser la commande vocale pour la sélectionImage: Say "select" to use the voice command for selection

Un utilisateur peut indiquer « sélectionner » pour utiliser la commande vocale pour une sélection.



Bonjour CortanaHey Cortana

Vous pouvez indiquer « Hey Cortana » pour afficher Cortana à tout moment.You can say "Hey Cortana" to bring up Cortana at any time. Vous n’avez pas besoin d’attendre qu’elle apparaisse pour continuer à poser votre question ou à lui donner une instruction.You don't have to wait for her to appear to continue asking her your question or giving her an instruction. Par exemple, essayez de dire « Hey Cortana, qu’est-ce que la météo ? »For example, try saying "Hey Cortana, what's the weather?" comme une seule phrase.as a single sentence. Pour plus d’informations sur Cortana et ce que vous pouvez faire, posez-vous !For more information about Cortana and what you can do, ask her! Dites « Hey Cortana, que puis-je faire ? »Say "Hey Cortana, what can I say?" et elle extrait une liste de commandes de travail et suggérées.and she'll pull up a list of working and suggested commands. Si vous êtes déjà dans l’application Cortana, sélectionnez l’option ?If you're already in the Cortana app, select the ? sur la barre latérale pour extraire le même menu.icon on the sidebar to pull up this same menu.

Commandes spécifiques à HoloLensHoloLens-specific commands

  • Qu’est-ce que je dis ?"What can I say?"
  • « Aller au début »-au lieu de fleuri pour accéder au menu Démarrer"Go to Start" - instead of bloom to get to Start Menu
  • « Lancer »"Launch "
  • « Déplacer ici »"Move here"
  • « Prendre une photo »"Take a picture"
  • « Démarrer l’enregistrement »"Start recording"
  • « Arrêter l’enregistrement »"Stop recording"
  • « Afficher le rayon de la main »"Show hand ray"
  • « Masquer le rayon de la main »"Hide hand ray"
  • « Augmenter la luminosité »"Increase the brightness"
  • « Réduire la luminosité »"Decrease the brightness"
  • « Augmenter le volume »"Increase the volume"
  • « Réduire le volume »"Decrease the volume"
  • « Muet » ou « muet »"Mute" or "Unmute"
  • « Arrêter l’appareil »"Shut down the device"
  • « Redémarrer l’appareil »"Restart the device"
  • « Go to Sleep »"Go to sleep"
  • « Quel est l’heure ? »"What time is it?"
  • « Quelle batterie ai-je laissée ? »"How much battery do I have left?"


« Regardez-le, dites-le »"See It, Say It"

HoloLens a un modèle de « voir », par exemple, le modèle d’entrée vocale, où les étiquettes sur les boutons indiquent aux utilisateurs les commandes vocales qu’ils peuvent également prononcer.HoloLens has a "see it, say it" model for voice input, where labels on buttons tell users what voice commands they can say as well. Par exemple, lors de la consultation d’une fenêtre d’application dans HoloLens (1re génération), un utilisateur peut indiquer la commande « ADJUST » pour ajuster la position de l’application dans le monde.For example, when looking at an app window in HoloLens (1st gen), a user can say "Adjust" command to adjust the position of the app in the world.

Image : un utilisateur peut prononcer la commande « Adjust », qui s’affiche dans la barre de l’application pour ajuster la position de l’application.Image: A user can say the "Adjust" command, which they see in the App bar to adjust the position of the app

spacespace
Quand vous examinez une fenêtre d’application ou un hologramme, un utilisateur peut prononcer la commande « Adjust » qui s’affiche dans la barre de l’application pour ajuster la position de l’application dans le monde.When looking at an app window or hologram, a user can say the "Adjust" command which they see in the App bar to adjust the position of the app in the world


Lorsque les applications suivent cette règle, les utilisateurs peuvent facilement comprendre ce qu’il faut savoir pour contrôler le système.When apps follow this rule, users can easily understand what to say to control the system. Alors que Gazing à un bouton dans HoloLens (1ère génération), vous verrez une info-bulle « de la voix » qui apparaît après une seconde si le bouton est activé pour la voix et affiche la commande pour dire à « appuyer ».While gazing at a button in HoloLens (1st gen), you'll see a "voice dwell" tooltip that comes up after a second if the button is voice-enabled and displays the command to speak to "press" it. Pour afficher les info-bulles vocales dans HoloLens 2, affichez le curseur vocal en disant « sélectionner » ou « que puis-je dire » (Voir l’image).To reveal voice tooltips in HoloLens 2, show the voice cursor by saying "select" or "What can I say" (See image).

Image : les commandes « voir » s’affichent sous les boutonsImage: "See it, say it" commands appear below the buttons

Voyez-le, disons que les commandes s’affichent sous les boutons



Commandes vocales pour une manipulation d’hologramme rapideVoice commands for fast hologram manipulation

Il existe de nombreuses commandes vocales que vous pouvez prononcer Gazing sur un hologramme pour effectuer rapidement des tâches de manipulation.There are many voice commands you can say while gazing at a hologram to quickly do manipulation tasks. Ces commandes vocales fonctionnent sur les fenêtres d’application et les objets 3D que vous avez placés dans le monde.These voice commands work on app windows and 3D objects you've placed in the world.

Commandes de manipulation d’hologrammeHologram manipulation commands

  • Me faire faceFace me
  • Plus grand | EnrichissementBigger | Enhance
  • GrandeSmaller

Sur HoloLens 2, vous pouvez également créer des interactions plus naturelles en combinaison avec le point de regard, qui fournit implicitement des informations contextuelles sur ce à quoi vous faites référence.On HoloLens 2, you can also create more natural interactions in combination with eye-gaze, which implicitly provides contextual information about what you are referring to. Par exemple, vous pouvez regarder un hologramme et indiquer « placer _ce_», puis passer à l’emplacement où vous souhaitez le placer et indiquer « sur ce point ».For example, you could look at a hologram and say "put this" and then look over where you want to place it and say "over here". Ou bien, vous pouvez consulter un composant holographique sur une machine complexe et indiquer : « Donnez-moi plus d’informations à ce sujet ».Or you could look at a holographic part on a complex machine and say: "give me more information about this".

Détection des commandes vocalesDiscovering voice commands

Certaines commandes, telles que les commandes de manipulation rapide ci-dessus, peuvent être masquées.Some commands, like the commands for fast manipulation above, can be hidden. Pour en savoir plus sur les commandes que vous pouvez utiliser, pointez avec le regard sur un objet et dites « que puis-je prononcer ? ».To learn about what commands you can use, gaze at an object and say, "what can I say?". Une liste de commandes possibles s’affiche.A list of possible commands pops up. Vous pouvez également utiliser le curseur point-tête pour rechercher et afficher les info-bulles vocales de chaque bouton devant vous.You can also use the head gaze cursor to look around and reveal the voice tooltips for each button in front of you.

Si vous souhaitez obtenir la liste complète, dites « afficher toutes les commandes » à tout moment.If you want a complete list, just say, "Show all commands" anytime.

DictationDictation

Plutôt que de taper avec des robinets, la dictée vocale peut être plus efficace pour entrer du texte dans une application.Rather than typing with air taps, voice dictation can be more efficient to enter text into an app. Cela peut accélérer l’entrée avec moins d’efforts pour l’utilisateur.This can greatly accelerate input with less effort for the user.

La dictée vocale commence en sélectionnant le bouton microphoneVoice dictation starts by selecting the microphone button
La dictée vocale commence en sélectionnant le bouton microphone sur le clavier.Voice dictation starts by selecting the microphone button on the keyboard

Chaque fois que le clavier holographique est actif, vous pouvez basculer en mode dictée au lieu de taper.Anytime the holographic keyboard is active, you can switch to dictation mode instead of typing. Sélectionnez le microphone sur le côté de la zone d’entrée de texte pour commencer.Select the microphone on the side of the text input box to get started.

Ajout de commandes vocales à votre applicationAdding voice commands to your app

Il est recommandé d’ajouter des commandes vocales à toutes les expériences que vous créez.Consider adding voice commands to any experience that you build. La voix est un outil puissant qui contrôle le système et les applications.Voice is a powerful way control the system and apps. Étant donné que les utilisateurs parlent de différents types de dialectes et d’accents, le choix approprié des mots clés vocaux permet de s’assurer que les commandes de vos utilisateurs sont interprétées sans ambiguïté.Because users speak with different kinds of dialects and accents, proper choice of speech keywords will make sure your users' commands are interpreted unambiguously.

Meilleures pratiquesBest practices

Voici quelques bonnes pratiques qui faciliteront la reconnaissance vocale.Below are some practices that will aid in smooth speech recognition.

  • Utilisez des commandes concises : dans la mesure du possible, choisissez des mots clés de deux syllabes minimum.Use concise commands - When possible, choose keywords of two or more syllables. Les mots d’une syllabe comprennent souvent des voyelles qui peuvent être prononcées différemment selon l’accent de la personne.One-syllable words tend to use different vowel sounds when spoken by persons of different accents. Exemple : « lire la vidéo » est préférable à « lire la vidéo actuellement sélectionnée »Example: "Play video" is better than "Play the currently selected video"
  • Utilisation d’un vocabulaire simple -exemple : « afficher la note » est préférable à « afficher le résumé »Use simple vocabulary - Example: "Show note" is better than "Show placard"
  • Assurez-vous que les commandes ne sont pas destructrices : Assurez-vous que les actions de commande vocale ne sont pas destructrices et peuvent être facilement annulées au cas où une personne parlant près de l’utilisateur déclencherait accidentellement une commande.Make sure commands are non-destructive - Make sure any speech command actions are non-destructive and can easily be undone in case another person speaking near the user accidentally triggers a command.
  • Évitez les commandes de son similaire . Évitez d’inscrire plusieurs commandes vocales qui semblent similaires.Avoid similar sounding commands - Avoid registering multiple speech commands that sound similar. Exemple : « afficher plus » et « afficher le magasin » peuvent présenter un son similaire.Example: "Show more" and "Show store" can be similar sounding.
  • Annulez l’inscription de votre application quand elle n’est pas utilisée : lorsque votre application n’est pas dans un État dans lequel une commande vocale particulière est valide, envisagez de la désinscrire afin que d’autres commandes ne soient pas confondues pour celle-ci.Unregister your app when not it uses - When your app isn't in a state in which a particular speech command is valid, consider unregistering it so that other commands aren't confused for that one.
  • Testez les différents accents : testez votre application avec des utilisateurs ayant différents accents.Test with different accents - Test your app with users of different accents.
  • Maintenez une certaine cohérence au sein des commandes vocales : si la commande « Retour » permet de retourner à la page précédente, gardez ce comportement dans toutes vos applications.Maintain voice command consistency - If "Go back" goes to the previous page, maintain this behavior in your applications.
  • Évitez d’utiliser des commandes système : les commandes vocales suivantes sont réservées pour le système, évitez de les utiliser dans vos applications :Avoid using system commands - The following voice commands are reserved for the system, so avoid using them in your applications:
    • « Hey Cortana »"Hey Cortana"
    • « Sélectionner »"Select"
    • « Aller au début »"Go to start"

Avantages de l’entrée vocaleAdvantages of voice input

La voix est un moyen naturel de communiquer nos intentions.Voice input is a natural way to communicate our intents. La voix est particulièrement intéressante pour les parcours d’interface, car elle peut aider les utilisateurs à franchir plusieurs étapes d’une interface.Voice is especially good at interface traversals because it can help users cut through multiple steps of an interface. Un utilisateur peut indiquer « revenir en arrière » lors de la consultation d’une page Web, au lieu de devoir revenir en arrière et cliquer sur le bouton précédent de l’application.A user might say "go back" while looking at a webpage, instead of having to go up and hit the back button in the app. Cette économie d’énergie a un effet émotionnelle puissant sur la perception de l’expérience de l’utilisateur et lui donne une petite quantité d’Superpower.This small time saving has a powerful emotional effect on user’s perception of the experience and gives them a small amount superpower. L’utilisation de la voix est également pratique lorsque nous avons les mains occupées ou que nous effectuons plusieurs tâches en même temps.Using voice is also a convenient input method when we have our arms full or are multi-tasking. Sur les appareils où la saisie sur un clavier est difficile, la dictée vocale peut être un moyen efficace d’entrer du texte.On devices where typing on a keyboard is difficult, voice dictation can be an efficient alternative way to input text. Enfin, dans certains cas, lorsque la plage de précision du point de vue et du mouvement est limitée, la voix peut aider à lever l’ambiguïté de l’intention de l’utilisateur.Lastly, in some cases when the range of accuracy for gaze and gesture are limited, voice can help to disambiguate the user's intent.

Avantages de l’utilisation de la voixHow using voice can benefit the user

  • Gain de temps : l’objectif final est donc plus facile à atteindre.Reduces time - it should make the end goal more efficient.
  • Efforts moindres : l’exécution des tâches est plus fluide et ne demande pas d’efforts.Minimizes effort - it should make tasks more fluid and effortless.
  • Réduction de la charge cognitive : les commandes vocales sont intuitives, et faciles à apprendre et à mémoriser.Reduces cognitive load - it's intuitive, easy to learn, and remember.
  • Elle est socialement acceptable : elle doit tenir dans les normes sociales du comportement.It's socially acceptable - it should fit in with societal norms of behavior.
  • Routine : l’utilisation de la voix peut facilement se transformer en habitude.It's routine - voice can readily become a habitual behavior.

Défis liés à l’entrée vocaleChallenges for voice input

Bien que l’entrée vocale soit idéale pour de nombreuses applications différentes, elle est également confrontée à plusieurs défis.While voice input is great for many different applications, it also faces several challenges. Le fait de comprendre les avantages et les défis liés aux entrées vocales permet aux développeurs d’applications de faire des choix plus intelligents quant à la façon et au moment d’utiliser les entrées vocales et à créer une expérience optimale pour leurs utilisateurs.Understanding both the advantages and challenges for voice input enables app developers to make smarter choices for how and when to use voice input and to create a great experience for their users.

Entrée vocale pour le contrôle d’entrée continu Le contrôle affiné est l’un d’eux.Voice input for continuous input control Fine-grained control is one of them. Par exemple, un utilisateur peut souhaiter modifier son volume dans son application musical.For example, a user might want to change their volume in their music app. Elle peut indiquer « plus fort », mais il n’est pas clair que le système est censé créer le volume.She can say "louder", but it's not clear how much louder the system is supposed to make the volume. L’utilisateur peut par exemple : « en faire un peu plus fort », mais « un peu » est difficile à quantifier.The user could say: "Make it a little louder", but "a little" is difficult to quantify. Le déplacement ou la mise à l’échelle d’hologrammes avec la voix est tout aussi difficile.Moving or scaling holograms with voice is similarly difficult.

Fiabilité de la détection des entrées vocales Bien que les systèmes d’entrée de voix soient plus performants et mieux, ils peuvent parfois entendre et interpréter une commande vocale de manière incorrecte.Reliability of voice input detection While voice input systems become better and better, sometimes they may incorrectly hear and interpret a voice command. La clé consiste à résoudre le problème dans votre application.The key is to address the challenge in your application. Fournir des commentaires à vos utilisateurs lorsque le système est à l’écoute et ce que le système comprend pour clarifier les problèmes potentiels en ce qui concerne la parole des utilisateurs.Provide feedback to your users when the system is listening and what the system understood clarifies potential issues understanding the users' speech.

Entrée vocale dans les espaces partagés La voix ne peut pas être socialement acceptable dans les espaces que vous partagez avec d’autres personnes.Voice input in shared spaces Voice may not be socially acceptable in spaces that you share with others. Voici quelques exemples :Here are a few examples:

  • Il se peut que l’utilisateur ne souhaite pas déranger les autres (par exemple, dans une bibliothèque silencieuse ou un bureau partagé)The user may not want to disturb others (for example, in a quiet library or shared office)
  • Il se peut que les utilisateurs ne soient pas contraints de parler à eux-mêmes en public,Users may feel awkward being seen talking to themselves in public,
  • Un utilisateur peut paraître inconfortant de dicter un message personnel ou confidentiel (y compris des mots de passe), tandis que d’autres sont à l’écouteA user may feel uncomfortable dictating a personal or confidential message (including passwords) while others are listening

Entrée vocale de mots uniques ou inconnus Les problèmes d’entrée vocale se posent également lorsque les utilisateurs dictent des mots qui peuvent être inconnus du système, tels que des surnoms, certains mots d’argot ou des abréviations.Voice input of unique or unknown words Difficulties for voice input also come when users are dictating words that may be unknown to the system, such as nicknames, certain slang words, or abbreviations.

Apprentissage des commandes vocales Alors que l’objectif ultime est de naturellement communiquer avec votre système, les applications continuent souvent à utiliser des commandes vocales prédéfinies spécifiques.Learning voice commands While the ultimate goal is to naturally converse with your system, often apps still rely on specific pre-defined voice commands. Un défi associé à un ensemble important de commandes vocales est de savoir comment les enseigner sans surcharger l’utilisateur et comment aider l’utilisateur à les conserver.A challenge associated with a significant set of voice commands is how to teach them without overloading the user and how to help the user to keep them.



Retours des commandes vocalesVoice feedback states

Lorsque la voix est utilisée correctement, l’utilisateur comprend ce qu’il peut dire et reçoit la confirmation que le système a bien compris sa commande.When Voice is applied properly, the user understands what they can say and get clear feedback the system heard them correctly. Ce sont ces deux éléments qui donnent envie à l’utilisateur de choisir la voix comme méthode d’entrée principale.These two signals make the user feel confident in using Voice as a primary input. Voici un diagramme qui montre ce qui se passe au niveau du curseur lorsque l’entrée vocale est reconnue, et comment celle-ci est communiquée à l’utilisateur.Below is a diagram showing what happens to the cursor when voice input is recognized and how it communicates that to the user.

1. état normal du curseur1. Regular cursor state
1. état normal du curseur1. Regular cursor state

2. communique les commentaires vocaux, puis disparaît2. Communicates voice feedback and then disappears
2. communique les commentaires vocaux, puis disparaît2. Communicates voice feedback and then disappears

1,3.*3. État de curseur normalRegular cursor state
3. retourne à l’état de curseur normal3. Returns to regular cursor state




Points importants concernant la reconnaissance vocale dans la réalité mixteTop things users should know about "speech" in mixed reality

  • Dites « Sélectionner » tout en ciblant un bouton (vous pouvez l’utiliser n’importe où pour sélectionner un bouton).Say "Select" while targeting a button (you can use this anywhere to select a button).
  • Dans certaines applications, vous pouvez prononcer le nom de l’étiquette d’un bouton de la barre d’application pour exécuter une action.You can say the label name of an app bar button in some apps to take an action. Par exemple, lors de la consultation d’une application, un utilisateur peut prononcer la commande « Remove » pour supprimer l’application du monde entier (cela permet de gagner du temps et de la sélectionner à votre main).For example, while looking at an app, a user can say the command "Remove" to remove the app from the world (this saves time from having to select it with your hand).
  • Vous pouvez démarrer Cortana à l’écoute en disant « Hey Cortana ».You can start Cortana listening by saying "Hey Cortana." Vous pouvez lui poser des questions (« Hey Cortana, combien mesure la tour Eiffel ? »), lui demander d’ouvrir une application (« Hey Cortana, ouvre Netflix ») ou lui demander d’afficher le menu Démarrer (« Hey Cortana, ouvre le menu Démarrer »), et bien plus encore.You can ask her questions ("Hey Cortana, how tall is the Eiffel tower"), tell her to open an app ("Hey Cortana, open Netflix"), or tell her to bring up the Start Menu ("Hey Cortana, take me home") and more.

Questions et inquiétudes fréquentes concernant la reconnaissance vocaleCommon questions and concerns users have about voice

  • Que puis-je dire ?What can I say?
  • Comment savoir si le système m’a bien entendu ?How do I know the system heard me correctly?
    • Le système ne comprend pas mes commandes vocales.The system keeps getting my voice commands wrong.
    • Il ne réagit pas quand je lui adresse une commande vocale.It doesn’t react when I give it a voice command.
  • Il réagit de façon inadaptée lorsque je lui adresse une commande vocale.It reacts the wrong way when I give it a voice command.
  • Comment choisir l’application ou la commande d’application à laquelle adresser mes commandes vocales ?How do I target my voice to a specific app or app command?
  • Puis-je utiliser la voix pour contrôler les éléments holographiques sur HoloLens ?Can I use voice to command things out the holographic frame on HoloLens?

CommunicationCommunication

Pour les applications qui souhaitent tirer parti des options de traitement d’entrée audio personnalisées fournies par HoloLens, il est important de comprendre les différentes catégories de flux audio que votre application peut consommer.For applications that want to take advantage of the customized audio input processing options provided by HoloLens, it's important to understand the various audio stream categories your app can consume. Windows 10 prend en charge plusieurs catégories de flux et HoloLens en utilise trois pour permettre un traitement personnalisé afin d’optimiser la qualité audio du microphone adaptée à la parole, à la communication et à d’autres, qui peuvent être utilisées pour les scénarios de capture audio de l’environnement ambiant (autrement dit, « Camcorder »).Windows 10 supports several different stream categories and HoloLens makes use of three of these to enable custom processing to optimize the microphone audio quality tailored for speech, communication, and other, which can be used for ambient environment audio capture (that is, "camcorder") scenarios.

  • La catégorie de flux de AudioCategory_Communications est personnalisée pour les scénarios de qualité des appels et de narration et fournit au client un flux audio mono de 16 kHz de la voix de l’utilisateur.The AudioCategory_Communications stream category is customized for call quality and narration scenarios and provides the client with a 16-kHz 24-bit mono audio stream of the user's voice
  • La catégorie de flux de AudioCategory_Speech est personnalisée pour le moteur de reconnaissance de la parole HoloLens (Windows) et lui fournit un flux mono 16 kHz de 24 bits de la voix de l’utilisateur.The AudioCategory_Speech stream category is customized for the HoloLens (Windows) speech engine and provides it with a 16-kHz 24-bit mono stream of the user's voice. Cette catégorie peut être utilisée par des moteurs de reconnaissance vocale tiers, si nécessaire.This category can be used by third-party speech engines if needed.
  • La catégorie de flux de AudioCategory_Other est personnalisée pour l’enregistrement audio de l’environnement ambiant et fournit au client un flux audio stéréo 48 kHz de 24 bits.The AudioCategory_Other stream category is customized for ambient environment audio recording and provides the client with a 48-kHz 24-bit stereo audio stream.

Tout ce traitement audio est l’accélération matérielle, ce qui signifie que les fonctionnalités se déchargent beaucoup moins d’énergie que si le même traitement a été effectué sur l’UC HoloLens.All this audio processing is hardware accelerated which means the features drain a lot less power than if the same processing was done on the HoloLens CPU. Évitez d’exécuter d’autres traitements d’entrée audio sur le processeur pour maximiser la durée de vie de la batterie du système et tirer parti du traitement d’entrée audio déchargé et intégré.Avoid running other audio input processing on the CPU to maximize system battery life and take advantage of the built-in, offloaded audio input processing.

LangagesLanguages

HoloLens 2 prend en charge plusieurs langues.HoloLens 2 supports multiple languages. N’oubliez pas que les commandes vocales s’exécutent toujours dans la langue d’affichage du système même si plusieurs claviers sont installés ou si les applications essaient de créer un module de reconnaissance vocale dans une autre langue.Keep in mind that speech commands will always run in the system's display language even if multiple keyboards are installed or if apps attempt to create a speech recognizer in a different language.

DépannageTroubleshooting

Si vous rencontrez des problèmes à l’aide de « SELECT » et de « Hey Cortana », essayez de passer à un espace plus silencieux, à l’extérieur de la source de bruit, ou en parlant plus fort.If you're having any issues using "select" and "Hey Cortana", try moving to a quieter space, turning away from the source of noise, or by speaking louder. À ce stade, toute la reconnaissance vocale sur HoloLens est réglée et optimisée spécifiquement pour les intervenants natifs de États-Unis anglais.At this time, all speech recognition on HoloLens is tuned and optimized specifically to native speakers of United States English.

Pour la version 2017 de Windows Mixed Reality Edition, la logique de gestion des points de terminaison audio fonctionnera correctement (éternellement) après la déconnexion et la réinitialisation du PC Desktop après la première connexion HMD.For the Windows Mixed Reality Developer Edition release 2017, the audio endpoint management logic will work fine (forever) after logging out and back in to the PC desktop after the initial HMD connection. Avant que ce premier événement se déconnecte/in après avoir parcouru WMR OOBE, l’utilisateur peut rencontrer différents problèmes de fonctionnalité audio, qu’il s’agisse d’aucun audio ou d’aucune commutation audio, en fonction de la configuration du système avant de connecter le HMD pour la première fois.Before that first sign out/in event after going through WMR OOBE, the user could experience various audio functionality issues ranging from no audio to no audio switching depending on how the system was set up before connecting the HMD for the first time.



Entrée vocale dans MRTK (ensemble d’outils de réalité mixte) pour UnityVoice input in MRTK (Mixed Reality Toolkit) for Unity

Avec MRTK, vous pouvez facilement affecter une commande vocale à n’importe quel objet.With MRTK, you can easily assign voice command on any objects. Utilisez le profil d’entrée vocale de MRTK pour définir vos mots clés.Use MRTK's Speech Input Profile to define your keywords. En affectant le script SpeechInputHandler , vous pouvez faire en sorte qu’un objet réponde aux mots clés définis dans le profil d’entrée vocal.By assigning SpeechInputHandler script, you can make any object respond to the keywords defined in the Speech Input Profile. SpeechInputHandler fournit également une étiquette de confirmation vocale pour améliorer la confiance de l’utilisateur.SpeechInputHandler also provides speech confirmation label to improve the user's confidence.


Voir aussiSee also