Comandos de voz

Cuando se usan comandos de voz, la mirada se usa normalmente como mecanismo de destino, ya sea como puntero ("select") o para dirigir el comando a una aplicación ("verlo, por ejemplo"). Por supuesto, algunos comandos de voz no requieren un destino, como "Ir al comienzo" o "Hola, Cortana".

Compatibilidad con dispositivos

Característica HoloLens (1.ª generación) HoloLens 2 Cascos envolventes
Comandos de voz ✔️ ✔️ ✔️ (con casco adjunto)

Cómo se usa la voz

Considera la posibilidad de agregar comandos de voz a cualquier experiencia que compiles. La voz es una forma eficaz y cómoda de controlar el sistema y las aplicaciones. Dado que los usuarios hablan con variantes regionales y acentos diversos, la opción adecuada de palabras clave de voz asegurará que los comandos de los usuarios se interpretan de forma inequívoca.

Procedimientos recomendados

A continuación se muestran algunas prácticas que te ayudarán a realizar sin problemas las tareas de reconocimiento de voz.

  • Usa comandos concisos: cuando sea posible, elige palabras clave de dos o más sílabas. Las palabras de una sílaba tienden a tener diferentes pronunciaciones de las vocales dependiendo del acento de la persona. Ejemplo: "Reproducir vídeo" es mejor que "Reproducir el vídeo seleccionado actualmente"
  • Usar vocabulario simple : ejemplo: "Mostrar nota" es mejor que "Mostrar placard"
  • Asegúrate de que los comandos no sean destructivos: haz que cualquier acción que se puede realizar mediante un comando de voz no sea destructiva, y se pueda deshacer fácilmente, en caso de que otra persona que esté hablando cerca del usuario pueda desencadenar accidentalmente un comando.
  • Evita los comandos que tengan un sonido similar: evita registrar varios comandos de voz que suenen de forma parecida. Ejemplo: "Mostrar más" y "Show store" pueden ser muy similares.
  • Anula el registro de la aplicación cuando no esté en uso: cuando la aplicación no está en un estado en el que un comando de voz determinado es válido, considera la posibilidad de anular el registro de modo que otros comandos no se confundan con ese.
  • Prueba con diferentes acentos: prueba la aplicación con usuarios con diferentes acentos.
  • Mantén la coherencia en los comandos de voz: si "Volver" va a la página anterior, mantén este comportamiento en tus aplicaciones.
  • Evita el uso de comandos del sistema: los siguientes comandos de voz están reservados para el sistema. Las aplicaciones no deben utilizar estos comandos.
    • "Hola Cortana"
    • "Seleccionar"

"Seleccionar"

Decir "seleccionar" en cualquier momento activará aquello a lo que está apuntando el cursor de mirada.

Nota: En HoloLens 2, primero se debe invocar el cursor de mirada diciendo la palabra "select". Vuelva a decir "seleccionar" para activarlo. Para ocultar el cursor de mirada, simplemente use las manos para pulsar o tocar un objeto.

Verlo, decirlo

Windows Mixed Reality emplea un modelo de voz "verlo, decirlo" en el que las etiquetas en los botones son idénticas a los comandos de voz asociados. Como no hay ninguna diferencia entre la etiqueta y el comando de voz, los usuarios pueden saber mejor qué decir para controlar el sistema. Para servir de refuerzo, si el usuario se mantiene sobre un botón aparecerá una "sugerencia de marca para voz" para comunicar qué botones están habilitados para voz.

See it say it example 1

See it say it example 2
Ejemplos de "verlo, decirlo"

Puntos fuertes de los comandos de voz

Las entradas de voz son una manera natural de comunicar nuestras intenciones. La voz es especialmente buena en los recorridos de interfaz, ya que puede ayudar a los usuarios a recorrer varios pasos de una interfaz (un usuario podría decir "volver" mientras mira una página web, en lugar de tener que subir y hacer clic en el botón Atrás de la aplicación). Este pequeño ahorro de tiempo tiene un efecto emocional poderoso en la percepción del usuario de la experiencia y les da una pequeña cantidad de superpotencia. El uso de voz también es un método de entrada conveniente cuando tenemos nuestros brazos llenos o son tareas múltiples. En los dispositivos en los que escribir en un teclado es difícil, el dictado de voz puede ser una manera eficaz y alternativa de introducir. Por último, en algunos casos, cuando el intervalo de precisión para la mirada y el gesto son limitados, Voice podría ser el único método de entrada de confianza de un usuario.

Cómo puede beneficiar al usuario la utilización de la voz

  • Reduce el tiempo: debe hacer que el objetivo final sea más eficaz.
  • Minimiza el esfuerzo: debe hacer que las tareas se realicen de forma más fluida y sin esfuerzo.
  • Reduce la carga cognitiva: es una forma intuitiva y fácil de aprender y recordar.
  • Es aceptable socialmente: se adapta a las normas sociales en términos de comportamiento.
  • Es fácil de convertir en rutina: puede convertirse fácilmente en un comportamiento habitual.

Desventajas de los comandos de voz

La voz también tiene algunas desventajas. Uno de ellos es la falta de precisión en el control. (por ejemplo, un usuario podría decir "más alto", pero no puede decir cuánto. "Un poco" es algo difícil de cuantificar. El movimiento o el escalado de las cosas con la voz también es también difícil (la voz no ofrece granularidad en el control). Los comandos de voz también pueden ser imperfectos. A veces, un sistema de voz escucha de forma incorrectamente un comando o no lo escucha. Recuperarse de estos errores es un desafío en cualquier interfaz. Por último, el uso de la voz puede no ser socialmente aceptable en lugares públicos. Hay algunas cosas que los usuarios no pueden o no deben decir. Por estos motivos, el habla debe utilizarse para aquello para lo que mejor sirve.

Estados de la respuesta a la voz

Cuando la voz se aplica correctamente, el usuario entiende lo que puede decir y obtiene una respuesta clara de que el sistema le ha oído correctamente. Estas dos señales hacen que el usuario se sienta seguro utilizando la voz como entrada principal. A continuación se muestra un diagrama que muestra lo que sucede con el cursor cuando se reconoce la entrada de voz y cómo se lo comunica al usuario.

Voice feedback states for cursor
Estados de la respuesta a la voz del cursor

Cosas principales que los usuarios deben saber sobre los comandos de voz en la realidad mixta

  • Di "Seleccionar" mientras seleccionas como destino un botón (puedes usar esto en cualquier lugar para hacer clic en un botón).
  • Puedes decir el nombre de etiqueta de un botón de la barra de la aplicación en algunas aplicaciones para realizar una acción. Por ejemplo, al examinar una aplicación, un usuario puede decir el comando "Quitar" para quitar la aplicación (esto te ahorra el tiempo de hacer clic con la mano).
  • Puedes iniciar Cortana escuchando diciendo "Hey Cortana". Puede hacer sus preguntas ("Hey Cortana, ¿qué altura es la torre Eiffel?"), decirle que abra una aplicación ("Hey Cortana, abrir Netflix") o decirle que abra el menú inicio ("Hey Cortana, llévame a casa") y mucho más.

Preguntas y dudas comunes que tienen los usuarios acerca del uso de la voz

  • What can I say? (¿Qué puedo decir?)
  • ¿Cómo sé si el sistema me escuchó correctamente?
    • El sistema se equivoca todo el tiempo con mis comandos de voz.
    • No reacciona cuando digo un comando de voz.
  • Reacciona de forma equivocada cuando digo un comando de voz.
  • ¿Cómo dirijo mi voz a una aplicación o un comando de la aplicación específicos?
  • ¿Puedo usar la voz para comandar cosas en el marco holográfico en HoloLens?

Vea también