Entrada de vozVoice input

Entrada de voz

La voz es una de las formas clave de entrada en HoloLens.Voice is one of the key forms of input on HoloLens. Permite comandos directamente de un holograma sin tener que usar gestos de mano.It allows you to directly command a hologram without having to use hand gestures. La entrada de voz es una manera natural de comunicar tus intenciones.Voice input can be a natural way to communicate your intent. La voz es especialmente adecuada en el recorrido de interfaces complejas, ya que permite a los usuarios cortar menús anidados con un comando.Voice is especially good at traversing complex interfaces, because it lets users cut through nested menus with one command.

La entrada de voz se basa en el mismo motor que admite la voz en todas las aplicaciones universales de Windows.Voice input is powered by the same engine that supports speech in all Universal Windows Apps. En HoloLens, el reconocimiento de voz siempre funcionará en el idioma de visualización de Windows configurado en la configuración del dispositivo.On HoloLens, speech recognition will always function in the Windows display language configured in your device Settings.


Voz y mirasVoice and gaze

Cuando se usan comandos de voz, la punta o la vista rápida es el mecanismo de selección de destino típico, con un cursor para "seleccionar" o para canalizar el comando a una aplicación que se está viendo.When you're using voice commands, head or eye gaze is the typical targeting mechanism, whether with a cursor to "select" or to channel your command to an application you're looking at. Es posible que ni siquiera sea necesario mostrar un cursor de miración ("verlo, decirlo").It may not even be required to show any gaze cursor ("see it, say it"). Algunos comandos de voz no requieren un destino, como "ir a Inicio" o "Hola Cortana".Some voice commands don't require a target at all, such as "go to start" or "Hey Cortana."


Compatibilidad con dispositivosDevice support

CaracterísticaFeature HoloLens (1.ª generación)HoloLens (1st gen) HoloLens 2HoloLens 2 Cascos envolventesImmersive headsets
Entrada de vozVoice input ✔️✔️ ✔️✔️ ✔️ (con micrófono)✔️ (with microphone)

Comando "seleccionar"The "select" command

HoloLens (1ª generación)HoloLens (1st gen)

Incluso sin agregar específicamente compatibilidad con voz a su aplicación, los usuarios pueden activar los hologramas simplemente diciendo el comando de voz del sistema "Select".Even without specifically adding voice support to your app, your users can activate holograms simply by saying the system voice command "select". Esto se comporta igual que una pulsación aérea en HoloLens, presionando el botón seleccionar en el clic de hololenso presionando el desencadenador en un controlador de movimiento de Windows Mixed Reality.This behaves the same as an air tap on HoloLens, pressing the select button on the HoloLens clicker, or pressing the trigger on a Windows Mixed Reality motion controller. Oirá un sonido y verá que aparece una información sobre herramientas con "seleccionar" como confirmación.You'll hear a sound and see a tooltip with "select" appear as confirmation. "Select" está habilitado por un algoritmo de detección de palabras clave de bajo consumo, lo que significa que puede decirlo en cualquier momento con un impacto mínimo en la duración de la batería."Select" is enabled by a low-power keyword detection algorithm, which means you can say it anytime with minimal battery life impact. Incluso puede decir "seleccionar" con sus manos en su lado.You can even say "select" with your hands at your side.



HoloLens 2HoloLens 2

Para usar el comando "seleccionar" de voz en HoloLens 2, primero debe abrir el cursor de miración para usarlo como puntero.To use the "select" voice command in HoloLens 2, you first need to bring up the gaze cursor to use as a pointer. El comando para ponerlo al día es fácil de recordar (simplemente, por ejemplo, "Select").The command to bring it up is easy to remember--just say, "select".

Para salir del modo, vuelva a usar las manos con el toque de aire, cerca de un botón con los dedos o mediante el gesto del sistema.To exit the mode, use your hands again by air tapping, approaching a button with your fingers, or using the system gesture.

Imagen: "seleccionar" para usar el comando de voz para la selecciónImage: Say "select" to use the voice command for selection

Un usuario puede decir "seleccionar" para usar el comando de voz para una selección.



Hola CortanaHey Cortana

Puede decir "Hola Cortana" para abrir Cortana en cualquier momento.You can say "Hey Cortana" to bring up Cortana at any time. No tiene que esperar a que parezca que sigue preguntando su pregunta o le dé una instrucción.You don't have to wait for her to appear to continue asking her your question or giving her an instruction. Por ejemplo, intente decir "Hola a Cortana, ¿cuál es el tiempo?".For example, try saying "Hey Cortana, what's the weather?" como una sola oración.as a single sentence. Para obtener más información sobre Cortana y lo que puede hacer, pregúntele.For more information about Cortana and what you can do, ask her! Por ejemplo, "Hola Cortana, ¿qué puedo decir?"Say "Hey Cortana, what can I say?" y desplegarán una lista de comandos de trabajo y sugeridos.and she'll pull up a list of working and suggested commands. Si ya está en la aplicación de Cortana, seleccione elIf you're already in the Cortana app, select the ? en la barra lateral para desplegar el mismo menú.icon on the sidebar to pull up this same menu.

Comandos específicos de HoloLensHoloLens-specific commands

  • "¿Qué puedo decir?""What can I say?"
  • "Ir a Inicio"-en lugar de a la floración para ir al menú Inicio"Go to Start" - instead of bloom to get to Start Menu
  • "Launch ""Launch "
  • "Moverse aquí""Move here"
  • "Tomar una imagen""Take a picture"
  • "Iniciar grabación""Start recording"
  • "Detener grabación""Stop recording"
  • "Mostrar rayo manos""Show hand ray"
  • "Ocultar rayo manos""Hide hand ray"
  • "Aumentar el brillo""Increase the brightness"
  • "Reducir el brillo""Decrease the brightness"
  • "Aumentar el volumen""Increase the volume"
  • "Reducir el volumen""Decrease the volume"
  • "Silenciar" o "dessilenciar""Mute" or "Unmute"
  • "Apagar el dispositivo""Shut down the device"
  • "Reiniciar el dispositivo""Restart the device"
  • "Ir a suspensión""Go to sleep"
  • "¿Qué hora es?""What time is it?"
  • "¿Cuánta batería he dejado?""How much battery do I have left?"


"Verlo, decirlo""See It, Say It"

HoloLens tiene un modelo "ver ti" para la entrada de voz, donde las etiquetas de los botones indican a los usuarios los comandos de voz que también pueden decir.HoloLens has a "see it, say it" model for voice input, where labels on buttons tell users what voice commands they can say as well. Por ejemplo, al examinar una ventana de la aplicación en HoloLens (1ª generación), un usuario puede decir el comando "ajustar" para ajustar la posición de la aplicación en el mundo.For example, when looking at an app window in HoloLens (1st gen), a user can say "Adjust" command to adjust the position of the app in the world.

Imagen: un usuario puede decir el comando "ajustar", que se ve en la barra de la aplicación para ajustar la posición de la aplicación.Image: A user can say the "Adjust" command, which they see in the App bar to adjust the position of the app

spacespace
Al mirar una ventana de la aplicación o un holograma, un usuario puede decir el comando "ajustar" que aparecen en la barra de la aplicación para ajustar la posición de la aplicación en el mundo.When looking at an app window or hologram, a user can say the "Adjust" command which they see in the App bar to adjust the position of the app in the world


Cuando las aplicaciones siguen esta regla, los usuarios pueden comprender fácilmente qué decir para controlar el sistema.When apps follow this rule, users can easily understand what to say to control the system. Mientras Gazing en un botón de HoloLens (1ª generación), verá una información sobre herramientas de "permanencia de voz" que aparece después de un segundo si el botón está habilitado para voz y muestra el comando para hablar de ella.While gazing at a button in HoloLens (1st gen), you'll see a "voice dwell" tooltip that comes up after a second if the button is voice-enabled and displays the command to speak to "press" it. Para mostrar la información sobre herramientas de voz en HoloLens 2, muestre el cursor de voz indicando "seleccionar" o "Qué puedo decir" (vea la imagen).To reveal voice tooltips in HoloLens 2, show the voice cursor by saying "select" or "What can I say" (See image).

Imagen: "ver, por ejemplo," los comandos aparecen debajo de los botonesImage: "See it, say it" commands appear below the buttons

Verlo, por ejemplo, los comandos aparecen debajo de los botones



Comandos de voz para la manipulación rápida de hologramasVoice commands for fast hologram manipulation

Hay muchos comandos de voz que puede decir mientras Gazing en un holograma para realizar rápidamente tareas de manipulación.There are many voice commands you can say while gazing at a hologram to quickly do manipulation tasks. Estos comandos de voz funcionan en las ventanas de la aplicación y en los objetos 3D que ha colocado en el mundo.These voice commands work on app windows and 3D objects you've placed in the world.

Comandos de manipulación de hologramasHologram manipulation commands

  • Me encuentroFace me
  • Mayor | EnhanceBigger | Enhance
  • DisminuyeSmaller

En HoloLens 2, también puede crear interacciones más naturales en combinación con la mirada, que proporciona implícitamente información contextual sobre lo que se está haciendo referencia.On HoloLens 2, you can also create more natural interactions in combination with eye-gaze, which implicitly provides contextual information about what you are referring to. Por ejemplo, podría ver un holograma y decir "colocarlo" y, a continuación, buscar el lugar en el que desea colocarlo y decir " aquí".For example, you could look at a hologram and say "put this" and then look over where you want to place it and say "over here". O bien, podría ver una pieza holográfica en una máquina compleja y decir: "proporcione más información acerca de esto".Or you could look at a holographic part on a complex machine and say: "give me more information about this".

Detección de comandos de vozDiscovering voice commands

Algunos comandos, como los comandos para la manipulación rápida anterior, se pueden ocultar.Some commands, like the commands for fast manipulation above, can be hidden. Para obtener información sobre los comandos que puede usar, mira fijamente a un objeto y, por ejemplo, "¿Qué puedo decir?".To learn about what commands you can use, gaze at an object and say, "what can I say?". Aparece una lista de posibles comandos.A list of possible commands pops up. También puede usar el cursor de mirar hacia abajo para buscar y mostrar la información sobre herramientas de voz de cada botón delante.You can also use the head gaze cursor to look around and reveal the voice tooltips for each button in front of you.

Si desea una lista completa, simplemente indique "Mostrar todos los comandos" en cualquier momento.If you want a complete list, just say, "Show all commands" anytime.

DictadoDictation

En lugar de escribir con grifos de aire, el dictado de voz puede ser más eficaz para escribir texto en una aplicación.Rather than typing with air taps, voice dictation can be more efficient to enter text into an app. Esto puede acelerar en gran medida la entrada con menos esfuerzo para el usuario.This can greatly accelerate input with less effort for the user.

El dictado de voz comienza seleccionando el botón micrófonoVoice dictation starts by selecting the microphone button
El dictado de voz comienza seleccionando el botón micrófono del teclado.Voice dictation starts by selecting the microphone button on the keyboard

Siempre que el teclado Holographic esté activo, puede cambiar al modo de dictado en lugar de escribir.Anytime the holographic keyboard is active, you can switch to dictation mode instead of typing. Seleccione el micrófono en el lateral del cuadro de entrada de texto para comenzar.Select the microphone on the side of the text input box to get started.

Agregar comandos de voz a la aplicaciónAdding voice commands to your app

Considera la posibilidad de agregar comandos de voz a cualquier experiencia que compiles.Consider adding voice commands to any experience that you build. Voice es un método eficaz para controlar el sistema y las aplicaciones.Voice is a powerful way control the system and apps. Dado que los usuarios hablan con distintos tipos de dialectos y acentos, la elección adecuada de palabras clave de voz garantizará que los comandos de los usuarios se interpreten sin ambigüedades.Because users speak with different kinds of dialects and accents, proper choice of speech keywords will make sure your users' commands are interpreted unambiguously.

Procedimientos recomendadosBest practices

A continuación se muestran algunas prácticas que te ayudarán a realizar sin problemas las tareas de reconocimiento de voz.Below are some practices that will aid in smooth speech recognition.

  • Usa comandos concisos: cuando sea posible, elige palabras clave de dos o más sílabas.Use concise commands - When possible, choose keywords of two or more syllables. Las palabras de una sílaba tienden a tener diferentes pronunciaciones de las vocales dependiendo del acento de la persona.One-syllable words tend to use different vowel sounds when spoken by persons of different accents. Ejemplo: "reproducir vídeo" es mejor que "reproducir el vídeo seleccionado actualmente"Example: "Play video" is better than "Play the currently selected video"
  • Usar vocabulario simple : por ejemplo, "show Note" es mejor que "show letrero"Use simple vocabulary - Example: "Show note" is better than "Show placard"
  • Asegúrese de que los comandos no sean destructivos : Asegúrese de que las acciones de comando de voz no sean destructivas y se puedan deshacer fácilmente en caso de que otra persona que hable cerca del usuario desencadene accidentalmente un comando.Make sure commands are non-destructive - Make sure any speech command actions are non-destructive and can easily be undone in case another person speaking near the user accidentally triggers a command.
  • Evite comandos de sonido similares : Evite registrar varios comandos de voz que suenen de forma similar.Avoid similar sounding commands - Avoid registering multiple speech commands that sound similar. Ejemplo: "Mostrar más" y "Mostrar tienda" puede ser similar.Example: "Show more" and "Show store" can be similar sounding.
  • Anular el registro de la aplicación cuando no se usa : cuando la aplicación no se encuentra en un estado en el que un comando de voz determinado es válido, considere la posibilidad de anular el registro para que otros comandos no estén confundidos para ese.Unregister your app when not it uses - When your app isn't in a state in which a particular speech command is valid, consider unregistering it so that other commands aren't confused for that one.
  • Prueba con diferentes acentos: prueba la aplicación con usuarios con diferentes acentos.Test with different accents - Test your app with users of different accents.
  • Mantén la coherencia en los comandos de voz: si "Volver" va a la página anterior, mantén este comportamiento en tus aplicaciones.Maintain voice command consistency - If "Go back" goes to the previous page, maintain this behavior in your applications.
  • Evitar el uso de comandos del sistema : los siguientes comandos de voz están reservados para el sistema, por lo que no se deben usar en las aplicaciones:Avoid using system commands - The following voice commands are reserved for the system, so avoid using them in your applications:
    • "Hola Cortana""Hey Cortana"
    • "Seleccionar""Select"
    • "Ir a Inicio""Go to start"

Ventajas de la entrada de vozAdvantages of voice input

Las entradas de voz son una manera natural de comunicar nuestras intenciones.Voice input is a natural way to communicate our intents. La voz es especialmente útil en los recorridos de la interfaz, ya que puede ayudar a los usuarios a recorrer varios pasos de una interfaz.Voice is especially good at interface traversals because it can help users cut through multiple steps of an interface. Un usuario podría decir "volver atrás" mientras mira una página web, en lugar de tener que subir y presionar el botón atrás en la aplicación.A user might say "go back" while looking at a webpage, instead of having to go up and hit the back button in the app. Esta pequeña hora de guardar tiene un efecto emocional eficaz sobre la percepción del usuario de la experiencia y les da una pequeña cantidad de mejorar enormemente.This small time saving has a powerful emotional effect on user’s perception of the experience and gives them a small amount superpower. El uso de la voz es también un método práctico de entrada cuando tenemos las manos ocupadas o estamos realizando varias tareas a la vez.Using voice is also a convenient input method when we have our arms full or are multi-tasking. En los dispositivos en los que es difícil escribir en un teclado, el dictado de voz puede ser una forma alternativa eficaz de escribir texto.On devices where typing on a keyboard is difficult, voice dictation can be an efficient alternative way to input text. Por último, en algunos casos en los que el intervalo de precisión de la mirada y el gesto es limitado, la voz puede ayudar a eliminar la ambigüedad de la intención del usuario.Lastly, in some cases when the range of accuracy for gaze and gesture are limited, voice can help to disambiguate the user's intent.

Cómo puede beneficiar al usuario la utilización de la vozHow using voice can benefit the user

  • Reduce el tiempo: debe hacer que el objetivo final sea más eficaz.Reduces time - it should make the end goal more efficient.
  • Minimiza el esfuerzo: debe hacer que las tareas se realicen de forma más fluida y sin esfuerzo.Minimizes effort - it should make tasks more fluid and effortless.
  • Reduce la carga cognitiva: es una forma intuitiva y fácil de aprender y recordar.Reduces cognitive load - it's intuitive, easy to learn, and remember.
  • Es social aceptable: debe ajustarse a las normas de un comportamiento de la sociedad.It's socially acceptable - it should fit in with societal norms of behavior.
  • Es fácil de convertir en rutina: puede convertirse fácilmente en un comportamiento habitual.It's routine - voice can readily become a habitual behavior.

Desafíos de la entrada de vozChallenges for voice input

Aunque la entrada de voz es excelente para muchas aplicaciones diferentes, también enfrenta varios desafíos.While voice input is great for many different applications, it also faces several challenges. La comprensión de las ventajas y los desafíos de la entrada de voz permite a los desarrolladores de aplicaciones tomar decisiones más inteligentes sobre cómo y Cuándo usar la entrada de voz y crear una excelente experiencia para los usuarios.Understanding both the advantages and challenges for voice input enables app developers to make smarter choices for how and when to use voice input and to create a great experience for their users.

Entrada de voz para el control de entrada continuo El control específico es uno de ellos.Voice input for continuous input control Fine-grained control is one of them. Por ejemplo, un usuario podría querer cambiar su volumen en su aplicación de música.For example, a user might want to change their volume in their music app. Puede decir "más alto", pero no está claro cuánto debe ser el sistema para crear el volumen.She can say "louder", but it's not clear how much louder the system is supposed to make the volume. El usuario podría decir: "hacer que sea un poco más alto", pero "un poco" es difícil de cuantificar.The user could say: "Make it a little louder", but "a little" is difficult to quantify. El movimiento o el escalado de los hologramas con la voz es igualmente difícil.Moving or scaling holograms with voice is similarly difficult.

Confiabilidad de la detección de entrada de voz Aunque los sistemas de entrada de voz son mejores y mejores, a veces pueden oír e interpretar de forma incorrecta un comando de voz.Reliability of voice input detection While voice input systems become better and better, sometimes they may incorrectly hear and interpret a voice command. La clave es abordar el desafío en la aplicación.The key is to address the challenge in your application. Proporcione comentarios a los usuarios cuando el sistema esté escuchando y lo que el sistema entienda clarifica los posibles problemas que comprenden la voz de los usuarios.Provide feedback to your users when the system is listening and what the system understood clarifies potential issues understanding the users' speech.

Entrada de voz en espacios compartidos Es posible que la voz no sea socialmente aceptable en espacios que comparta con otros usuarios.Voice input in shared spaces Voice may not be socially acceptable in spaces that you share with others. Estos son algunos ejemplos:Here are a few examples:

  • Es posible que el usuario no quiera molestar a otros (por ejemplo, en una biblioteca tranquila o en una oficina compartida).The user may not want to disturb others (for example, in a quiet library or shared office)
  • Es posible que los usuarios no se vean tan complicados como hablar en el público.Users may feel awkward being seen talking to themselves in public,
  • Un usuario puede sentirse incómodo dictar un mensaje personal o confidencial (incluidas las contraseñas) mientras que otros están escuchandoA user may feel uncomfortable dictating a personal or confidential message (including passwords) while others are listening

Entrada de voz de palabras únicas o desconocidas Las dificultades para la entrada de voz también se muestran cuando los usuarios están dictando palabras que pueden ser desconocidas para el sistema, como sobrenombres, ciertas palabras jergas o abreviaturas.Voice input of unique or unknown words Difficulties for voice input also come when users are dictating words that may be unknown to the system, such as nicknames, certain slang words, or abbreviations.

Comandos de voz de aprendizaje Aunque el objetivo final es conversar naturalmente con el sistema, a menudo las aplicaciones todavía dependen de comandos de voz específicos predefinidos.Learning voice commands While the ultimate goal is to naturally converse with your system, often apps still rely on specific pre-defined voice commands. Un desafío asociado a un conjunto importante de comandos de voz es cómo enseñarlas sin sobrecargar al usuario y cómo ayudar al usuario a mantenerlas.A challenge associated with a significant set of voice commands is how to teach them without overloading the user and how to help the user to keep them.



Estados de la respuesta a la vozVoice feedback states

Cuando la voz se aplica correctamente, el usuario entiende lo que puede decir y obtiene una respuesta clara de que el sistema le ha oído correctamente.When Voice is applied properly, the user understands what they can say and get clear feedback the system heard them correctly. Estas dos señales hacen que el usuario se sienta seguro utilizando la voz como entrada principal.These two signals make the user feel confident in using Voice as a primary input. A continuación se muestra un diagrama que muestra lo que sucede con el cursor cuando se reconoce la entrada de voz y cómo se lo comunica al usuario.Below is a diagram showing what happens to the cursor when voice input is recognized and how it communicates that to the user.

1. estado normal del cursor1. Regular cursor state
1. estado normal del cursor1. Regular cursor state

2. comunica comentarios de voz y luego desaparece2. Communicates voice feedback and then disappears
2. comunica comentarios de voz y luego desaparece2. Communicates voice feedback and then disappears

3.*3. Estado normal del cursorRegular cursor state
3. vuelve al estado normal del cursor3. Returns to regular cursor state




Cosas principales que los usuarios deben saber sobre los comandos de voz en la realidad mixtaTop things users should know about "speech" in mixed reality

  • Suseleccione "seleccionar" mientras el destino es un botón (puede utilizarlo en cualquier lugar para seleccionar un botón).Say "Select" while targeting a button (you can use this anywhere to select a button).
  • Puedes decir el nombre de etiqueta de un botón de la barra de la aplicación en algunas aplicaciones para realizar una acción.You can say the label name of an app bar button in some apps to take an action. Por ejemplo, al mirar una aplicación, un usuario puede decir el comando "quitar" para quitar la aplicación del mundo (esto ahorra tiempo al tener que seleccionarla con la mano).For example, while looking at an app, a user can say the command "Remove" to remove the app from the world (this saves time from having to select it with your hand).
  • Puede iniciar la escucha de Cortana diciendo "Hola Cortana".You can start Cortana listening by saying "Hey Cortana." Puedes preguntarle cosas ("Hola Cortana, cuál es la altura de la torre Eiffel"), decirle que abra una aplicación ("Hola Cortana, abre Netflix") o que abra el menú Inicio ("Hola Cortana, llévame al principio") y mucho más.You can ask her questions ("Hey Cortana, how tall is the Eiffel tower"), tell her to open an app ("Hey Cortana, open Netflix"), or tell her to bring up the Start Menu ("Hey Cortana, take me home") and more.

Preguntas y dudas comunes que tienen los usuarios acerca del uso de la vozCommon questions and concerns users have about voice

  • What can I say? (¿Qué puedo decir?)What can I say?
  • ¿Cómo sé si el sistema me escuchó correctamente?How do I know the system heard me correctly?
    • El sistema se equivoca todo el tiempo con mis comandos de voz.The system keeps getting my voice commands wrong.
    • No reacciona cuando digo un comando de voz.It doesn’t react when I give it a voice command.
  • Reacciona de forma equivocada cuando digo un comando de voz.It reacts the wrong way when I give it a voice command.
  • ¿Cómo dirijo mi voz a una aplicación o un comando de la aplicación específicos?How do I target my voice to a specific app or app command?
  • ¿Puedo usar la voz para comandar cosas en el marco holográfico en HoloLens?Can I use voice to command things out the holographic frame on HoloLens?

ComunicaciónCommunication

En el caso de las aplicaciones que desean aprovechar las opciones de procesamiento de entrada de audio personalizadas proporcionadas por HoloLens, es importante comprender las distintas categorías de flujo de audio que puede consumir la aplicación.For applications that want to take advantage of the customized audio input processing options provided by HoloLens, it's important to understand the various audio stream categories your app can consume. Windows 10 admite varias categorías de secuencias diferentes y HoloLens usa tres de ellas para habilitar el procesamiento personalizado con el fin de optimizar la calidad de audio del micrófono adaptada a la voz, la comunicación y otros, que se pueden usar para los escenarios de captura de audio de entorno ambiente (es decir, "videocámara").Windows 10 supports several different stream categories and HoloLens makes use of three of these to enable custom processing to optimize the microphone audio quality tailored for speech, communication, and other, which can be used for ambient environment audio capture (that is, "camcorder") scenarios.

  • La categoría AudioCategory_Communications Stream está personalizada para escenarios de calidad y narración de llamadas y proporciona al cliente una secuencia de audio mono de 16 bits de 16 kHz de la voz del usuarioThe AudioCategory_Communications stream category is customized for call quality and narration scenarios and provides the client with a 16-kHz 24-bit mono audio stream of the user's voice
  • La categoría AudioCategory_Speech Stream está personalizada para el motor de voz de HoloLens (Windows) y le proporciona una secuencia mono de 16 kHz de 24 bits de la voz del usuario.The AudioCategory_Speech stream category is customized for the HoloLens (Windows) speech engine and provides it with a 16-kHz 24-bit mono stream of the user's voice. Los motores de voz de terceros pueden usar esta categoría si es necesario.This category can be used by third-party speech engines if needed.
  • La categoría AudioCategory_Other Stream está personalizada para la grabación de audio del entorno ambiente y proporciona al cliente una secuencia de audio estéreo de 24 bits 48 kHz.The AudioCategory_Other stream category is customized for ambient environment audio recording and provides the client with a 48-kHz 24-bit stereo audio stream.

Todo este procesamiento de audio se acelera en hardware, lo que significa que las características agotan una gran cantidad de energía que si se realizara el mismo procesamiento en la CPU de HoloLens.All this audio processing is hardware accelerated which means the features drain a lot less power than if the same processing was done on the HoloLens CPU. Evite ejecutar otro procesamiento de entrada de audio en la CPU para maximizar la duración de la batería del sistema y aprovechar el procesamiento de entrada de audio descargado integrado.Avoid running other audio input processing on the CPU to maximize system battery life and take advantage of the built-in, offloaded audio input processing.

IdiomasLanguages

HoloLens 2 es compatible con varios idiomas.HoloLens 2 supports multiple languages. Tenga en cuenta que los comandos de voz siempre se ejecutarán en el idioma para mostrar del sistema aunque se instalen varios teclados o cuando las aplicaciones intenten crear un reconocedor de voz en otro idioma.Keep in mind that speech commands will always run in the system's display language even if multiple keyboards are installed or if apps attempt to create a speech recognizer in a different language.

Solución de problemasTroubleshooting

Si tiene algún problema con "Select" y "Hola Cortana", intente cambiar a un espacio más silencioso, desplazarse fuera del origen del ruido o hablar de más alto.If you're having any issues using "select" and "Hey Cortana", try moving to a quieter space, turning away from the source of noise, or by speaking louder. En este momento, todo el reconocimiento de voz en HoloLens se ajusta y optimiza específicamente a los hablantes nativos de Estados Unidos inglés.At this time, all speech recognition on HoloLens is tuned and optimized specifically to native speakers of United States English.

En el caso de la versión 2017 de Windows Mixed Reality Developer Edition, la lógica de administración de puntos de conexión de audio funcionará bien (siempre) después de cerrar la sesión y volver a iniciarla en el escritorio del equipo después de la conexión inicial de HMD.For the Windows Mixed Reality Developer Edition release 2017, the audio endpoint management logic will work fine (forever) after logging out and back in to the PC desktop after the initial HMD connection. Antes de que el primer evento de cierre de sesión o de salida después de pasar a WMR OOBE, el usuario podría experimentar varios problemas de funcionalidad de audio que van desde sin audio hasta sin conmutación de audio, en función de cómo se haya configurado el sistema antes de conectarse a HMD por primera vez.Before that first sign out/in event after going through WMR OOBE, the user could experience various audio functionality issues ranging from no audio to no audio switching depending on how the system was set up before connecting the HMD for the first time.



Entrada de voz en MRTK (kit de herramientas de realidad mixta) para UnityVoice input in MRTK (Mixed Reality Toolkit) for Unity

Con MRTK, puede asignar fácilmente comandos de voz en cualquier objeto.With MRTK, you can easily assign voice command on any objects. Use el Perfil de entrada de voz de MRTK para definir sus palabras clave.Use MRTK's Speech Input Profile to define your keywords. Mediante la asignación del script SpeechInputHandler , puede hacer que cualquier objeto responda a las palabras clave definidas en el perfil de entrada de voz.By assigning SpeechInputHandler script, you can make any object respond to the keywords defined in the Speech Input Profile. SpeechInputHandler también proporciona una etiqueta de confirmación de voz para mejorar la confianza del usuario.SpeechInputHandler also provides speech confirmation label to improve the user's confidence.


Consulte tambiénSee also