Comandos de vozVoice commanding

Cuando se usan comandos de voz, miramos normalmente como el mecanismo de destino, ya sea como un puntero ("Select") o para dirigir el comando a una aplicación ("verlo, decirlo").When using voice commands, gaze is typically used as the targeting mechanism, whether as a pointer ("select") or to direct your command to an application ("see it, say it"). Por supuesto, algunos comandos de voz no requieren un destino, como "Ir al comienzo" o "Hola, Cortana".Of course, some voice commands don't require a target at all, like "go to start" or "Hey, Cortana."

Compatibilidad con dispositivosDevice support

CaracterísticaFeature HoloLens (1.ª generación)HoloLens (1st gen) HoloLens 2HoloLens 2 Cascos envolventesImmersive headsets
Comandos de vozVoice commanding ✔️✔️ ✔️✔️ ✔️ (con casco adjunto)✔️ (with headset attached)

Cómo se usa la vozHow to use voice

Considera la posibilidad de agregar comandos de voz a cualquier experiencia que compiles.Consider adding voice commands to any experience that you build. Voice es una manera eficaz y cómoda de controlar el sistema y las aplicaciones.Voice is a powerful and convenient way to control the system and apps. Dado que los usuarios hablan con variantes regionales y acentos diversos, la opción adecuada de palabras clave de voz asegurará que los comandos de los usuarios se interpretan de forma inequívoca.Because users speak with a variety of dialects and accents, proper choice of speech keywords will make sure that your users' commands are interpreted unambiguously.

Procedimientos recomendadosBest practices

A continuación se muestran algunas prácticas que te ayudarán a realizar sin problemas las tareas de reconocimiento de voz.Below are some practices that will aid in smooth speech recognition.

  • Usa comandos concisos: cuando sea posible, elige palabras clave de dos o más sílabas.Use concise commands - When possible, choose keywords of two or more syllables. Las palabras de una sílaba tienden a tener diferentes pronunciaciones de las vocales dependiendo del acento de la persona.One-syllable words tend to use different vowel sounds when spoken by persons of different accents. Ejemplo: "reproducir vídeo" es mejor que "reproducir el vídeo seleccionado actualmente"Example: "Play video" is better than "Play the currently selected video"
  • Usar vocabulario simple : por ejemplo, "show Note" es mejor que "show letrero"Use simple vocabulary - Example: "Show note" is better than "Show placard"
  • Asegúrate de que los comandos no sean destructivos: haz que cualquier acción que se puede realizar mediante un comando de voz no sea destructiva, y se pueda deshacer fácilmente, en caso de que otra persona que esté hablando cerca del usuario pueda desencadenar accidentalmente un comando.Make sure commands are non destructive - Make sure any action that can be taken by a speech command is non destructive and can easily be undone in case another person speaking near the user accidentally triggers a command.
  • Evita los comandos que tengan un sonido similar: evita registrar varios comandos de voz que suenen de forma parecida.Avoid similar sounding commands - Avoid registering multiple speech commands that sound very similar. Ejemplo: "Mostrar más" y "Mostrar tienda" puede ser un sonido muy similar.Example: "Show more" and "Show store" can be very similar sounding.
  • Anula el registro de la aplicación cuando no esté en uso: cuando la aplicación no está en un estado en el que un comando de voz determinado es válido, considera la posibilidad de anular el registro de modo que otros comandos no se confundan con ese.Unregister your app when not it use - When your app is not in a state in which a particular speech command is valid, consider unregistering it so that other commands are not confused for that one.
  • Prueba con diferentes acentos: prueba la aplicación con usuarios con diferentes acentos.Test with different accents - Test your app with users of different accents.
  • Mantén la coherencia en los comandos de voz: si "Volver" va a la página anterior, mantén este comportamiento en tus aplicaciones.Maintain voice command consistency - If "Go back" goes to the previous page, maintain this behavior in your applications.
  • Evita el uso de comandos del sistema: los siguientes comandos de voz están reservados para el sistema.Avoid using system commands - The following voice commands are reserved for the system. Las aplicaciones no deben utilizar estos comandos.These should not be used by applications.
    • "Hola Cortana""Hey Cortana"
    • "Seleccionar""Select"

"Seleccionar""Select"

Decir "seleccionar" en cualquier momento activará aquello a lo que está apuntando el cursor de mirada.Saying "select" at any time will activate whatever the gaze cursor is pointing at.

Nota: en HoloLens 2, el cursor de miración debe invocarse primero indicando la palabra "Select".Note: In HoloLens 2, the gaze cursor needs to first be invoked by saying the word "select". Vuelva a decir "seleccionar" para activarlo.Say "select" again to activate. Para ocultar el cursor de miración, basta con usar las manos para airtap o tocar un objeto.To hide the gaze cursor, simply use your hands to airtap or touch an object.

Verlo, decirloSee it, say it

Windows Mixed Reality emplea un modelo de voz "verlo, decirlo" en el que las etiquetas en los botones son idénticas a los comandos de voz asociados.Windows Mixed Reality has employed a "see it, say it" voice model where labels on buttons are identical to the associated voice commands. Como no hay ninguna diferencia entre la etiqueta y el comando de voz, los usuarios pueden saber mejor qué decir para controlar el sistema.Because there isn’t any dissonance between the label and the voice command, users can better understand what to say to control the system. Para servir de refuerzo, si el usuario se mantiene sobre un botón aparecerá una "sugerencia de marca para voz" para comunicar qué botones están habilitados para voz.To reinforce this, while dwelling on a button, a "voice dwell tip" appears to communicate which buttons are voice enabled.

Ejemplo 1 de verlo, decirlo

Ejemplo 2 de verlo, decirloSee it say it example 2
Ejemplos de "verlo, decirlo"Examples of "see it, say it"

Puntos fuertes de los comandos de vozVoice's strengths

Las entradas de voz son una manera natural de comunicar nuestras intenciones.Voice input is a natural way to communicate our intents. La voz es especialmente útil en los recorridos de la interfaz, ya que puede ayudar a los usuarios a recorrer varios pasos de una interfaz (un usuario podría decir "volver atrás" mientras mira una página web, en lugar de tener que subir y hacer clic en el botón atrás en la aplicación).Voice is especially good at interface traversals because it can help users cut through multiple steps of an interface (a user might say "go back" while looking at a Web page, instead of having to go up and click the Back button in the app). Este pequeño ahorro de tiempo tiene un efecto emocional eficaz en la percepción de un usuario de la experiencia y les da una pequeña cantidad de mejorar enormemente.This small time savings has a powerful emotional effect on a user’s perception of the experience and gives them a small amount of superpower. El uso de la voz es también un método práctico de entrada cuando tenemos las manos ocupadas o estamos realizando varias tareas a la vez.Using voice is also a convenient input method when we have our arms full or are multi-tasking. En los dispositivos en los que es difícil escribir en un teclado, el dictado de voz puede ser una manera eficaz y alternativa de escribir.On devices where typing on a keyboard is difficult, voice dictation can be an efficient, alternative way to input. Por último, en algunos casos en los que el intervalo de precisión de la mirada y el gesto es limitado, la voz puede ser el único método de entrada de confianza del usuario.Lastly, in some cases when the range of accuracy for gaze and gesture are limited, Voice might be a user’s only trusted method of input.

Cómo puede beneficiar al usuario la utilización de la vozHow using voice can benefit the user

  • Reduce el tiempo: debe hacer que el objetivo final sea más eficaz.Reduces time - it should make the end goal more efficient.
  • Minimiza el esfuerzo: debe hacer que las tareas se realicen de forma más fluida y sin esfuerzo.Minimizes effort - it should make tasks more fluid and effortless.
  • Reduce la carga cognitiva: es una forma intuitiva y fácil de aprender y recordar.Reduces cognitive load - it's intuitive, easy to learn, and remember.
  • Es aceptable socialmente: se adapta a las normas sociales en términos de comportamiento.It's socially acceptable - it should fit in with societal norms in terms of behavior.
  • Es fácil de convertir en rutina: puede convertirse fácilmente en un comportamiento habitual.It's routine - voice can readily become a habitual behavior.

Desventajas de los comandos de vozVoice's weaknesses

La voz también tiene algunas desventajas.Voice also has some weaknesses. Uno de ellos es la falta de precisión en el control.Fine-grained control is one of them. (por ejemplo, un usuario podría decir "más alto", pero no puede indicar cuánto.(for example, a user might say "louder," but can’t say how much. "Un poco" es algo difícil de cuantificar."A little" is hard to quantify. El movimiento o el escalado de las cosas con la voz también es también difícil (la voz no ofrece granularidad en el control).Moving or scaling things with voice is also difficult (voice does not offer the granularity of control). Los comandos de voz también pueden ser imperfectos.Voice can also be imperfect. A veces, un sistema de voz escucha de forma incorrectamente un comando o no lo escucha.Sometimes a voice system incorrectly hears a command or fails to hear a command. Recuperarse de estos errores es un desafío en cualquier interfaz.Recovering from such errors is a challenge in any interface. Por último, el uso de la voz puede no ser socialmente aceptable en lugares públicos.Lastly, voice may not be socially acceptable in public places. Hay algunas cosas que los usuarios no pueden o no deben decir.There are some things that users can’t or shouldn’t say. Por estos motivos, el habla debe utilizarse para aquello para lo que mejor sirve.These cliffs allow speech to be used for what it is best at.

Estados de la respuesta a la vozVoice feedback states

Cuando la voz se aplica correctamente, el usuario entiende lo que puede decir y obtiene una respuesta clara de que el sistema le ha oído correctamente.When Voice is applied properly, the user understands what they can say and get clear feedback the system heard them correctly. Estas dos señales hacen que el usuario se sienta seguro utilizando la voz como entrada principal.These two signals make the user feel confident in using Voice as a primary input. A continuación se muestra un diagrama que muestra lo que sucede con el cursor cuando se reconoce la entrada de voz y cómo se lo comunica al usuario.Below is a diagram showing what happens to the cursor when voice input is recognized and how it communicates that to the user.

Estados de la respuesta a la voz del cursorVoice feedback states for cursor
Estados de la respuesta a la voz del cursorVoice feedback states for cursor

Cosas principales que los usuarios deben saber sobre los comandos de voz en la realidad mixtaTop things users should know about "speech" in mixed reality

  • Di "Seleccionar" mientras seleccionas como destino un botón (puedes usar esto en cualquier lugar para hacer clic en un botón).Say "Select" while targeting a button (you can use this anywhere to click a button).
  • Puedes decir el nombre de etiqueta de un botón de la barra de la aplicación en algunas aplicaciones para realizar una acción.You can say the label name of an app bar button in some apps to take an action. Por ejemplo, al examinar una aplicación, un usuario puede decir el comando "Quitar" para quitar la aplicación (esto te ahorra el tiempo de hacer clic con la mano).For example, while looking at an app, a user can say the command "Remove" to remove the app from the world (this saves time from having to click it with your hand).
  • Puedes iniciar la escucha de Cortana diciendo "Hola Cortana".You can initiate Cortana listening by saying "Hey Cortana." Puede formular sus preguntas ("Hola Cortana, ¿cuánto es la Torre Eiffel?"), decirle que abra una aplicación ("Hola Cortana, abra Netflix") o dígale que muestre el menú Inicio ("Hola Cortana, tomarme en casa") y mucho más.You can ask her questions ("Hey Cortana, how tall is the Eiffel tower?"), tell her to open an app ("Hey Cortana, open Netflix"), or tell her to bring up the Start Menu ("Hey Cortana, take me home") and more.

Preguntas y dudas comunes que tienen los usuarios acerca del uso de la vozCommon questions and concerns users have about voice

  • What can I say? (¿Qué puedo decir?)What can I say?
  • ¿Cómo sé si el sistema me escuchó correctamente?How do I know the system heard me correctly?
    • El sistema se equivoca todo el tiempo con mis comandos de voz.The system keeps getting my voice commands wrong.
    • No reacciona cuando digo un comando de voz.It doesn’t react when I give it a voice command.
  • Reacciona de forma equivocada cuando digo un comando de voz.It reacts the wrong way when I give it a voice command.
  • ¿Cómo dirijo mi voz a una aplicación o un comando de la aplicación específicos?How do I target my voice to a specific app or app command?
  • ¿Puedo usar la voz para comandar cosas en el marco holográfico en HoloLens?Can I use voice to command things out the holographic frame on HoloLens?

Consulte tambiénSee also