Commander avec la voixVoice commanding

Lorsque vous utilisez des commandes vocales, le point de regard est généralement utilisé comme mécanisme de ciblage, qu’il s’agisse d’un pointeur (« Select ») ou d’une application (« voir », par exemple).When using voice commands, gaze is typically used as the targeting mechanism, whether as a pointer ("select") or to direct your command to an application ("see it, say it"). Bien entendu, certaines commandes vocales ne nécessitent pas de cible. C’est le cas, par exemple, des commandes « aller au menu Démarrer » ou « Hey Cortana ».Of course, some voice commands don't require a target at all, like "go to start" or "Hey, Cortana."

Prise en charge des appareilsDevice support

FonctionnalitéFeature HoloLens (1ère génération)HoloLens (1st gen) HoloLens 2HoloLens 2 Casques immersifsImmersive headsets
Commander avec la voixVoice commanding ✔️✔️ ✔️✔️ ✔️ (avec casque)✔️ (with headset attached)

Comment utiliser la voixHow to use voice

Il est recommandé d’ajouter des commandes vocales à toutes les expériences que vous créez.Consider adding voice commands to any experience that you build. La voix est un moyen puissant et pratique de contrôler le système et les applications.Voice is a powerful and convenient way to control the system and apps. Étant donné le nombre de dialectes et d’accents qui peuvent être utilisés, il est important de bien choisir les mots clés de reconnaissance vocale, afin de garantir que les commandes de vos utilisateurs seront correctement interprétées.Because users speak with a variety of dialects and accents, proper choice of speech keywords will make sure that your users' commands are interpreted unambiguously.

Meilleures pratiquesBest practices

Voici quelques bonnes pratiques qui faciliteront la reconnaissance vocale.Below are some practices that will aid in smooth speech recognition.

  • Utilisez des commandes concises : dans la mesure du possible, choisissez des mots clés de deux syllabes minimum.Use concise commands - When possible, choose keywords of two or more syllables. Les mots d’une syllabe comprennent souvent des voyelles qui peuvent être prononcées différemment selon l’accent de la personne.One-syllable words tend to use different vowel sounds when spoken by persons of different accents. Exemple : « lire la vidéo » est préférable à « lire la vidéo actuellement sélectionnée »Example: "Play video" is better than "Play the currently selected video"
  • Utilisation d’un vocabulaire simple -exemple : « afficher la note » est préférable à « afficher le résumé »Use simple vocabulary - Example: "Show note" is better than "Show placard"
  • Utilisez des commandes non définitives : assurez-vous que les actions réalisables par les commandes de reconnaissance vocale peuvent être facilement annulées, en cas de déclenchement involontaire provoqué par une personne parlant près de l’utilisateur.Make sure commands are non destructive - Make sure any action that can be taken by a speech command is non destructive and can easily be undone in case another person speaking near the user accidentally triggers a command.
  • Évitez les commandes avec des consonances similaires : évitez d’enregistrer plusieurs commandes vocales ayant une consonance très similaire.Avoid similar sounding commands - Avoid registering multiple speech commands that sound very similar. Exemple : « afficher plus » et « afficher le magasin » peuvent être très similaires.Example: "Show more" and "Show store" can be very similar sounding.
  • Désinscrivez votre application lorsque vous ne l’utilisez pas : lorsque l’état de votre application rend une commande de reconnaissance vocale non valide, désinscrivez l’application pour que les autres commandes ne soient pas confondues avec celle-ci.Unregister your app when not it use - When your app is not in a state in which a particular speech command is valid, consider unregistering it so that other commands are not confused for that one.
  • Testez les différents accents : testez votre application avec des utilisateurs ayant différents accents.Test with different accents - Test your app with users of different accents.
  • Maintenez une certaine cohérence au sein des commandes vocales : si la commande « Retour » permet de retourner à la page précédente, gardez ce comportement dans toutes vos applications.Maintain voice command consistency - If "Go back" goes to the previous page, maintain this behavior in your applications.
  • Évitez d’utiliser des commandes du système : les commandes vocales suivantes sont réservées au système.Avoid using system commands - The following voice commands are reserved for the system. Elles ne doivent pas être utilisées par les applications.These should not be used by applications.
    • « Hey Cortana »"Hey Cortana"
    • « Sélectionner »"Select"

« Sélectionner »"Select"

La prononciation de la commande « Sélectionner » activera systématiquement l’élément qui est pointé par le curseur de pointage.Saying "select" at any time will activate whatever the gaze cursor is pointing at.

Remarque : dans HoloLens 2, le curseur en regard doit d’abord être appelé en disant le mot « Select ».Note: In HoloLens 2, the gaze cursor needs to first be invoked by saying the word "select". Dites « sélectionner » à nouveau pour activer.Say "select" again to activate. Pour masquer le curseur en regard, il vous suffit d’utiliser vos mains pour airtap ou toucher un objet.To hide the gaze cursor, simply use your hands to airtap or touch an object.

Voir, prononcerSee it, say it

Windows Mixed Reality utilise un modèle de voix de type « voir, prononcer », dans lequel les étiquettes des boutons sont identiques aux commandes vocales associées.Windows Mixed Reality has employed a "see it, say it" voice model where labels on buttons are identical to the associated voice commands. Puisqu’il y a cohérence entre les étiquettes et les commandes vocales, les utilisateurs comprennent plus facilement ce qu’il faut dire pour contrôler le système.Because there isn’t any dissonance between the label and the voice command, users can better understand what to say to control the system. Pour renforcer cela, lorsque vous stabilisez un bouton, une « info-bulle » s’affiche pour vous indiquer les boutons avec lesquels vous pouvez interagir à l’aide de la voix.To reinforce this, while dwelling on a button, a "voice dwell tip" appears to communicate which buttons are voice enabled.

Voir, prononcer - Exemple 1

Voir, prononcer - Exemple 2See it say it example 2
Exemples « voir, prononcer »Examples of "see it, say it"

Points forts de la voixVoice's strengths

La voix est un moyen naturel de communiquer nos intentions.Voice input is a natural way to communicate our intents. La voix est particulièrement intéressante pour les parcours d’interface, car elle peut aider les utilisateurs à franchir plusieurs étapes d’une interface (un utilisateur peut indiquer « revenir en arrière » tout en regardant une page Web, au lieu d’avoir à monter et à cliquer sur le bouton précédent dans l’application).Voice is especially good at interface traversals because it can help users cut through multiple steps of an interface (a user might say "go back" while looking at a Web page, instead of having to go up and click the Back button in the app). Cette légère économie a un effet émotionnelle puissant sur la perception de l’expérience d’un utilisateur et lui donne une petite quantité de Superpower.This small time savings has a powerful emotional effect on a user’s perception of the experience and gives them a small amount of superpower. L’utilisation de la voix est également pratique lorsque nous avons les mains occupées ou que nous effectuons plusieurs tâches en même temps.Using voice is also a convenient input method when we have our arms full or are multi-tasking. Sur les appareils où la saisie sur un clavier est difficile, la dictée vocale peut être une alternative efficace à l’entrée.On devices where typing on a keyboard is difficult, voice dictation can be an efficient, alternative way to input. Enfin, dans certains cas, lorsque la plage de précision du point de vue et du mouvement est limitée, la voix peut être la seule méthode d’entrée approuvée d’un utilisateur.Lastly, in some cases when the range of accuracy for gaze and gesture are limited, Voice might be a user’s only trusted method of input.

Avantages de l’utilisation de la voixHow using voice can benefit the user

  • Gain de temps : l’objectif final est donc plus facile à atteindre.Reduces time - it should make the end goal more efficient.
  • Efforts moindres : l’exécution des tâches est plus fluide et ne demande pas d’efforts.Minimizes effort - it should make tasks more fluid and effortless.
  • Réduction de la charge cognitive : les commandes vocales sont intuitives, et faciles à apprendre et à mémoriser.Reduces cognitive load - it's intuitive, easy to learn, and remember.
  • Acceptation sociale : leur comportement s’inscrit facilement dans les normes sociétales.It's socially acceptable - it should fit in with societal norms in terms of behavior.
  • Routine : l’utilisation de la voix peut facilement se transformer en habitude.It's routine - voice can readily become a habitual behavior.

Points faibles de l’utilisation de la voixVoice's weaknesses

L’utilisation de la voix présente également quelques points faibles.Voice also has some weaknesses. Le manque de précision des contrôles fait partie de ses points faibles.Fine-grained control is one of them. (par exemple, un utilisateur peut indiquer « plus fort », mais ne peut pas indiquer combien.(for example, a user might say "louder," but can’t say how much. En effet, la commande « un peu » est difficile à quantifier."A little" is hard to quantify. Il est également difficile de déplacer des objets et de modifier leur taille (la voix ne permet pas de fournir des commandes précises).Moving or scaling things with voice is also difficult (voice does not offer the granularity of control). Les commandes vocales peuvent être imparfaites.Voice can also be imperfect. Il arrive que le système vocal n’entende pas correctement une commande ou qu’il ne l’entende pas du tout.Sometimes a voice system incorrectly hears a command or fails to hear a command. Il est alors difficile de récupérer après de telles erreurs, et ce, dans n’importe quelle interface.Recovering from such errors is a challenge in any interface. Enfin, l’utilisation de la voix peut être gênante dans les lieux publics.Lastly, voice may not be socially acceptable in public places. Il y a certaines choses que l’utilisateur ne peut pas ou ne doit pas dire.There are some things that users can’t or shouldn’t say. Il convient donc d’utiliser la reconnaissance vocale dans les situations adaptées.These cliffs allow speech to be used for what it is best at.

Retours des commandes vocalesVoice feedback states

Lorsque la voix est utilisée correctement, l’utilisateur comprend ce qu’il peut dire et reçoit la confirmation que le système a bien compris sa commande.When Voice is applied properly, the user understands what they can say and get clear feedback the system heard them correctly. Ce sont ces deux éléments qui donnent envie à l’utilisateur de choisir la voix comme méthode d’entrée principale.These two signals make the user feel confident in using Voice as a primary input. Voici un diagramme qui montre ce qui se passe au niveau du curseur lorsque l’entrée vocale est reconnue, et comment celle-ci est communiquée à l’utilisateur.Below is a diagram showing what happens to the cursor when voice input is recognized and how it communicates that to the user.

Retours des commandes vocales au niveau du curseurVoice feedback states for cursor
Retours des commandes vocales au niveau du curseurVoice feedback states for cursor

Points importants concernant la reconnaissance vocale dans la réalité mixteTop things users should know about "speech" in mixed reality

  • Vous devez dire « Sélectionner » lorsque vous ciblez un bouton (vous pouvez l’utiliser n’importe où pour cliquer sur un bouton).Say "Select" while targeting a button (you can use this anywhere to click a button).
  • Dans certaines applications, vous pouvez prononcer le nom de l’étiquette d’un bouton de la barre d’application pour exécuter une action.You can say the label name of an app bar button in some apps to take an action. Par exemple, lorsqu’il regarde une application, l’utilisateur peut prononcer la commande « Supprimer » pour supprimer cette application (cela vous évite d’avoir à la supprimer manuellement).For example, while looking at an app, a user can say the command "Remove" to remove the app from the world (this saves time from having to click it with your hand).
  • Vous pouvez activer Cortana à l’aide de la commande « Hey Cortana ».You can initiate Cortana listening by saying "Hey Cortana." Vous pouvez poser des questions (« Hey Cortana, quelle est la taille de la Tour Eiffel ? »), lui demander d’ouvrir une application (« Hey Cortana, Open Netflix »), ou lui indiquer d’afficher le menu Démarrer (« Hey Cortana, Take me main ») et bien plus encore.You can ask her questions ("Hey Cortana, how tall is the Eiffel tower?"), tell her to open an app ("Hey Cortana, open Netflix"), or tell her to bring up the Start Menu ("Hey Cortana, take me home") and more.

Questions et inquiétudes fréquentes concernant la reconnaissance vocaleCommon questions and concerns users have about voice

  • Que puis-je dire ?What can I say?
  • Comment savoir si le système m’a bien entendu ?How do I know the system heard me correctly?
    • Le système ne comprend pas mes commandes vocales.The system keeps getting my voice commands wrong.
    • Il ne réagit pas quand je lui adresse une commande vocale.It doesn’t react when I give it a voice command.
  • Il réagit de façon inadaptée lorsque je lui adresse une commande vocale.It reacts the wrong way when I give it a voice command.
  • Comment choisir l’application ou la commande d’application à laquelle adresser mes commandes vocales ?How do I target my voice to a specific app or app command?
  • Puis-je utiliser la voix pour contrôler les éléments holographiques sur HoloLens ?Can I use voice to command things out the holographic frame on HoloLens?

Voir aussiSee also