음성 입력Voice input

음성 입력

음성은 HoloLens의 주요 입력 형태 중 하나입니다.Voice is one of the key forms of input on HoloLens. 직접 제스처를 사용 하지 않고도 홀로그램을 직접 명령을 수행할 수 있습니다.It allows you to directly command a hologram without having to use hand gestures. 음성 입력은 의도를 전달하는 자연스러운 방법일 수 있습니다.Voice input can be a natural way to communicate your intent. 음성은 복잡 한 인터페이스를 트래버스하는 데 특히 유용 합니다 .이를 통해 사용자는 단일 명령을 사용 하 여 중첩 된 메뉴를 잘라낼 수 있습니다.Voice is especially good at traversing complex interfaces, because it lets users cut through nested menus with one command.

음성 입력은 모든 유니버설 Windows 앱 에서 음성을 지 원하는 동일한 엔진 에 의해 구동 됩니다.Voice input is powered by the same engine that supports speech in all Universal Windows Apps. HoloLens에서 음성 인식은 항상 장치 설정에서 구성 된 Windows 표시 언어로 작동 합니다.On HoloLens, speech recognition will always function in the Windows display language configured in your device Settings.


음성 및 응시Voice and gaze

음성 명령을 사용 하는 경우 head 또는 eye 응시는 커서를 사용 하 여 사용자가 원하는 응용 프로그램에 명령을 사용 하는지 여부에 관계 없이 일반적인 대상 지정 메커니즘입니다.When you're using voice commands, head or eye gaze is the typical targeting mechanism, whether with a cursor to "select" or to channel your command to an application you're looking at. 모든 응시 커서를 표시 하는 데 필요 하지 않을 수도 있습니다 ("참조" 라고 표시).It may not even be required to show any gaze cursor ("see it, say it"). 일부 음성 명령은 대상이 전혀 필요 하지 않습니다 (예: "시작으로 이동" 또는 "안녕하세요 Cortana").Some voice commands don't require a target at all, such as "go to start" or "Hey Cortana."


디바이스 지원Device support

기능Feature HoloLens(1세대)HoloLens (1st gen) HoloLens 2HoloLens 2 몰입형 헤드셋Immersive headsets
음성 입력Voice input ✔️✔️ ✔️✔️ ✔️ (마이크 포함)✔️ (with microphone)

"Select" 명령The "select" command

HoloLens(1세대)HoloLens (1st gen)

앱에 음성 지원을 특별히 추가 하지 않은 경우에도 사용자는 시스템 음성 명령 "select"를 통해 holograms을 활성화할 수 있습니다.Even without specifically adding voice support to your app, your users can activate holograms simply by saying the system voice command "select". 이는 HoloLens의 공기 탭 , hololens clicker의 선택 단추 누르기 또는 Windows Mixed Reality 동작 컨트롤러에서 트리거 누르기와 동일 하 게 작동 합니다.This behaves the same as an air tap on HoloLens, pressing the select button on the HoloLens clicker, or pressing the trigger on a Windows Mixed Reality motion controller. 소리가 들리고 "선택"이 확인으로 표시 된 도구 설명이 표시 됩니다.You'll hear a sound and see a tooltip with "select" appear as confirmation. "Select"는 저전원 키워드 검색 알고리즘에서 사용 하도록 설정 됩니다. 즉, 배터리 수명에 영향을 주지 않고 언제 든 지 말할 수 있습니다."Select" is enabled by a low-power keyword detection algorithm, which means you can say it anytime with minimal battery life impact. 사용자 측의 손을 통해 "선택" 할 수도 있습니다.You can even say "select" with your hands at your side.



HoloLens 2HoloLens 2

HoloLens 2에서 "select" 음성 명령을 사용 하려면 먼저 응시 커서를 포인터로 사용 해야 합니다.To use the "select" voice command in HoloLens 2, you first need to bring up the gaze cursor to use as a pointer. 이를 가져오는 명령은 쉽게 기억할 수 있습니다. 예를 들어 "선택" 합니다.The command to bring it up is easy to remember--just say, "select".

이 모드를 종료 하려면 마우스를 사용 하 여 손가락을 다시 사용 하 여 손가락으로 단추에 근접 하거나 시스템 제스처를 사용 합니다.To exit the mode, use your hands again by air tapping, approaching a button with your fingers, or using the system gesture.

이미지: 선택 영역에 음성 명령을 사용 하려면 "선택"Image: Say "select" to use the voice command for selection

사용자는 선택에 대해 음성 명령을 사용 하기 위해 "선택" 이라고 말할 수 있습니다.



안녕하세요. CortanaHey Cortana

언제 든 지 Cortana를 표시 하는 "안녕하세요 Cortana" 라고 말할 수 있습니다.You can say "Hey Cortana" to bring up Cortana at any time. 사용자의 질문을 계속 하거나 사용자에 게 지침을 제공 하기 위해 사용자가 표시 될 때까지 기다릴 필요가 없습니다.You don't have to wait for her to appear to continue asking her your question or giving her an instruction. 예를 들어, "안녕하세요?" 라고 말하여For example, try saying "Hey Cortana, what's the weather?" 단일 문장으로as a single sentence. Cortana 및 사용자가 수행할 수 있는 작업에 대 한 자세한 내용은 다음을 확인 하세요.For more information about Cortana and what you can do, ask her! "안녕하세요?" 라고 표시 됩니다.Say "Hey Cortana, what can I say?" 그리고 작업 및 제안 된 명령 목록을 가져옵니다.and she'll pull up a list of working and suggested commands. Cortana 앱에 이미 있는 경우 ? 를 선택 합니다.If you're already in the Cortana app, select the ? 동일한 메뉴를 끌어올 수 있는 아이콘입니다.icon on the sidebar to pull up this same menu.

HoloLens 관련 명령HoloLens-specific commands

  • "무엇을 할 수 있나요?""What can I say?"
  • 시작 메뉴로 이동 하려면 블 룸 대신 "시작으로 이동"을 참조 하세요."Go to Start" - instead of bloom to get to Start Menu
  • "Launch ""Launch "
  • " 여기로 이동""Move here"
  • "사진 찍기""Take a picture"
  • "기록 시작""Start recording"
  • "기록 중지""Stop recording"
  • "손 모양 표시""Show hand ray"
  • "손 모양 숨기기""Hide hand ray"
  • "밝기 늘리기""Increase the brightness"
  • "밝기 낮추기""Decrease the brightness"
  • "볼륨 증가""Increase the volume"
  • "볼륨 낮추기""Decrease the volume"
  • "음소거" 또는 "음소거 해제""Mute" or "Unmute"
  • "장치 종료""Shut down the device"
  • "장치 다시 시작""Restart the device"
  • "절전 모드로 전환""Go to sleep"
  • "시간 이란?""What time is it?"
  • "얼마나 많은 배터리가 남아 있나요?""How much battery do I have left?"


"이 항목을 참조 하세요.""See It, Say It"

HoloLens에는 음성 입력에 대 한 "이를 확인 하는 것이 있습니다.HoloLens has a "see it, say it" model for voice input, where labels on buttons tell users what voice commands they can say as well. 예를 들어 HoloLens (첫 번째 gen)에서 앱 창을 볼 때 사용자는 "조정" 명령을 사용 하 여 전 세계의 앱 위치를 조정할 수 있습니다.For example, when looking at an app window in HoloLens (1st gen), a user can say "Adjust" command to adjust the position of the app in the world.

이미지: 사용자가 앱 바에 표시 되는 "조정" 명령을 사용 하 여 앱의 위치를 조정할 수 있습니다.Image: A user can say the "Adjust" command, which they see in the App bar to adjust the position of the app

spacespace
앱 창이 나 홀로그램을 볼 때 사용자가 앱 바에 표시 되는 "조정" 명령을 사용 하 여 전 세계의 앱 위치를 조정할 수 있습니다.When looking at an app window or hologram, a user can say the "Adjust" command which they see in the App bar to adjust the position of the app in the world


앱이이 규칙을 준수 하는 경우 사용자는 시스템을 제어 하는 내용을 쉽게 파악할 수 있습니다.When apps follow this rule, users can easily understand what to say to control the system. Gazing (첫 번째 gen)의 단추를 사용 하는 동안 단추가 음성으로 사용 되는 경우 초 후에 표시 되는 "음성 유지" 도구 설명이 표시 되 고이를 통해 "press"로 말하는 명령이 표시 됩니다.While gazing at a button in HoloLens (1st gen), you'll see a "voice dwell" tooltip that comes up after a second if the button is voice-enabled and displays the command to speak to "press" it. HoloLens 2에서 음성 도구 설명을 표시 하려면 "선택" 또는 "설명 가능한 내용" (이미지 참조)을 설명 하 여 음성 커서를 표시 합니다.To reveal voice tooltips in HoloLens 2, show the voice cursor by saying "select" or "What can I say" (See image).

이미지: 단추 아래에 "표시 됩니다." 라고 표시 됩니다.Image: "See it, say it" commands appear below the buttons

단추 아래에 표시 되는 것을 확인 하세요.



빠른 홀로그램 조작을 위한 음성 명령Voice commands for fast hologram manipulation

한 번의 조작 작업을 빠르게 수행 하기 위해 홀로그램에서 gazing 하는 동안 많은 음성 명령을 말할 수 있습니다.There are many voice commands you can say while gazing at a hologram to quickly do manipulation tasks. 이러한 음성 명령은 전 세계에 배치한 앱 창과 3D 개체에서 작동 합니다.These voice commands work on app windows and 3D objects you've placed in the world.

홀로그램 조작 명령Hologram manipulation commands

  • 얼굴 얼굴Face me
  • 크게 | 보강Bigger | Enhance
  • 짧은Smaller

HoloLens 2에서는 참조 하는 내용에 대 한 상황에 맞는 정보를 암시적으로 제공 하는 눈에 잘 맞는 상호 작용을 함께 만들 수도 있습니다.On HoloLens 2, you can also create more natural interactions in combination with eye-gaze, which implicitly provides contextual information about what you are referring to. 예를 들어 홀로그램을 확인 하 고 " 위치"를 확인 한 다음, 배치 하려는 위치를 확인 하 고 " 여기 에" 라고 말할 수 있습니다.For example, you could look at a hologram and say "put this" and then look over where you want to place it and say "over here". 또는 복잡 한 컴퓨터에서 holographic 파트를 살펴볼 수 있습니다. " 에 대 한 자세한 정보를 제공 합니다." 라고 표시 합니다.Or you could look at a holographic part on a complex machine and say: "give me more information about this".

음성 명령 검색Discovering voice commands

위의 빠른 조작을 위한 명령과 같은 일부 명령은 숨길 수 있습니다.Some commands, like the commands for fast manipulation above, can be hidden. 사용할 수 있는 명령에 대 한 자세한 내용은 개체를 응시 하 고 "무엇을 할 수 있나요?" 라고 표시 합니다.To learn about what commands you can use, gaze at an object and say, "what can I say?". 가능한 명령 목록이 표시 됩니다.A list of possible commands pops up. 헤드 응시 커서를 사용 하 여 앞의 각 단추에 대 한 음성 도구 설명을 볼 수도 있습니다.You can also use the head gaze cursor to look around and reveal the voice tooltips for each button in front of you.

전체 목록을 원하는 경우 언제 든 지 "모든 명령 표시" 라고 합니다.If you want a complete list, just say, "Show all commands" anytime.

받아쓰기Dictation

음성 받아쓰기는 공기 탭을 사용 하 여 입력 하는 대신 앱에 텍스트를 입력 하는 것이 더 효율적일 수 있습니다.Rather than typing with air taps, voice dictation can be more efficient to enter text into an app. 이렇게 하면 사용자에 대해 더 짧은 노력으로 입력 속도를 크게 높일 수 있습니다.This can greatly accelerate input with less effort for the user.

음성 받아쓰기는 마이크 단추를 선택 하 여 시작 합니다.Voice dictation starts by selecting the microphone button
음성 받아쓰기는 키보드에서 마이크 단추를 선택 하 여 시작 합니다.Voice dictation starts by selecting the microphone button on the keyboard

Holographic 키보드가 활성화 될 때마다 입력 하는 대신 받아쓰기 모드로 전환할 수 있습니다.Anytime the holographic keyboard is active, you can switch to dictation mode instead of typing. 텍스트 입력 상자의 측면에서 마이크를 선택 하 여 시작 합니다.Select the microphone on the side of the text input box to get started.

앱에 음성 명령 추가Adding voice commands to your app

빌드하는 모든 환경에 음성 명령을 추가하는 것이 좋습니다.Consider adding voice commands to any experience that you build. 음성은 시스템과 앱을 제어 하는 강력한 방법입니다.Voice is a powerful way control the system and apps. 사용자는 다양 한 종류의 언어와 악센트를 사용 하기 때문에 음성 키워드를 적절히 선택 하면 사용자의 명령이 명확 하 게 해석 됩니다.Because users speak with different kinds of dialects and accents, proper choice of speech keywords will make sure your users' commands are interpreted unambiguously.

모범 사례Best practices

다음은 매끄러운 음성 인식에 도움이 될 수 있는 몇 가지 사례입니다.Below are some practices that will aid in smooth speech recognition.

  • 간결한 명령 사용 - 가능한 경우 두 개 이상의 음절로 이루어진 키워드를 선택합니다.Use concise commands - When possible, choose keywords of two or more syllables. 1음절 단어는 악센트가 다른 사람이 말할 경우 다른 모음 소리를 사용할 수 있습니다.One-syllable words tend to use different vowel sounds when spoken by persons of different accents. 예: "비디오 재생"은 "현재 선택한 비디오 재생" 보다 좋습니다.Example: "Play video" is better than "Play the currently selected video"
  • 간단한 어휘 사용 -예: "show note"는 "show 카드" 보다 좋습니다.Use simple vocabulary - Example: "Show note" is better than "Show placard"
  • 명령이 소거식이 아닌지 확인 합니다. 음성 명령 작업이 비 소거식 인지 확인 하 고, 사용자 가까이를 말하는 다른 사람이 실수로 명령을 트리거하는 경우 쉽게 실행 취소할 수 있습니다.Make sure commands are non-destructive - Make sure any speech command actions are non-destructive and can easily be undone in case another person speaking near the user accidentally triggers a command.
  • 비슷한 음의 명령을 방지 합니다. 여러 음성 명령을 비슷한 방식으로 등록 하지 마십시오.Avoid similar sounding commands - Avoid registering multiple speech commands that sound similar. 예: "자세히 표시" 및 "저장소 표시"는 비슷한 소리가 될 수 있습니다.Example: "Show more" and "Show store" can be similar sounding.
  • 사용 하지 않을 때 앱 등록 취소 -앱이 특정 음성 명령이 유효한 상태가 아닌 경우에는 다른 명령이 혼동 하지 않도록 앱의 등록을 취소 하는 것이 좋습니다.Unregister your app when not it uses - When your app isn't in a state in which a particular speech command is valid, consider unregistering it so that other commands aren't confused for that one.
  • 다른 악센트로 테스트 - 다른 악센트의 사용자와 앱을 테스트합니다.Test with different accents - Test your app with users of different accents.
  • 음성 명령 일관성 유지 - "Go back"이라고 말할 경우 이전 페이지로 이동되면 애플리케이션에서 이 동작을 유지합니다.Maintain voice command consistency - If "Go back" goes to the previous page, maintain this behavior in your applications.
  • 시스템 명령을 사용 하지 않습니다 . 다음 음성 명령은 시스템용으로 예약 되어 있으므로 응용 프로그램에서 사용 하지 마십시오.Avoid using system commands - The following voice commands are reserved for the system, so avoid using them in your applications:
    • "Hey Cortana""Hey Cortana"
    • "Select""Select"
    • "시작으로 이동""Go to start"

음성 입력의 장점Advantages of voice input

음성 입력은 의도를 전달하는 자연스러운 방법입니다.Voice input is a natural way to communicate our intents. 음성은 인터페이스 탐색에 특히 유용 합니다. 사용자가 인터페이스의 여러 단계를 잘라내는 데 도움이 될 수 있기 때문입니다 .Voice is especially good at interface traversals because it can help users cut through multiple steps of an interface. 사용자는 웹 페이지를 보면서 앱에서 뒤로 단추를 누르면 "뒤로 이동" 이라고 말할 수 있습니다.A user might say "go back" while looking at a webpage, instead of having to go up and hit the back button in the app. 이러한 시간 절약은 사용자의 경험에 대 한 강력한 감정적 효과 를 제공 하 고 작은 양의 슈퍼 능력을 제공 합니다.This small time saving has a powerful emotional effect on user’s perception of the experience and gives them a small amount superpower. 팔에 무언가를 잔뜩 들고 있거나 멀티태스킹 중일 때도 음성을 사용하는 것이 편리한 입력 방법입니다.Using voice is also a convenient input method when we have our arms full or are multi-tasking. 키보드에 입력 하는 것이 어려운 장치에서 음성 받아쓰기 는 텍스트를 입력 하는 효율적인 대체 방법이 될 수 있습니다.On devices where typing on a keyboard is difficult, voice dictation can be an efficient alternative way to input text. 마지막으로, 응시 및 제스처에 대 한 정확도 범위가 제한 되는 경우 음성은 사용자의 의도를 명확 하 게 구분 하는 데 도움이 될 수 있습니다.Lastly, in some cases when the range of accuracy for gaze and gesture are limited, voice can help to disambiguate the user's intent.

사용자에게 도움이 될 수 있는 음성 사용 방법How using voice can benefit the user

  • 시간 단축 - 보다 효율적으로 최종 목표에 도달할 수 있어야 합니다.Reduces time - it should make the end goal more efficient.
  • 최소의 노력 - 보다 유연하고 편리하게 작업할 수 있도록 해야 합니다.Minimizes effort - it should make tasks more fluid and effortless.
  • 인지 부담 감소 - 직관적이며 배우고 기억하기 쉽습니다.Reduces cognitive load - it's intuitive, easy to learn, and remember.
  • 사회 공학적는 사용할 수 있습니다 .이는 표준의 동작에 적합 합니다.It's socially acceptable - it should fit in with societal norms of behavior.
  • 일상적임 - 음성이 습관적인 동작이 될 수 있습니다.It's routine - voice can readily become a habitual behavior.

음성 입력에 대 한 문제Challenges for voice input

음성 입력은 다양 한 응용 프로그램에 유용 하지만 몇 가지 문제도 직면 하 고 있습니다.While voice input is great for many different applications, it also faces several challenges. 음성 입력의 장점과 문제를 모두 이해 하면 앱 개발자가 음성 입력을 사용 하는 방법 및 시기를 보다 효율적으로 선택 하 고 사용자에 게 훌륭한 환경을 만들 수 있습니다.Understanding both the advantages and challenges for voice input enables app developers to make smarter choices for how and when to use voice input and to create a great experience for their users.

연속 입력 컨트롤에 대 한 음성 입력 세밀 한 제어가 그 중 하나입니다.Voice input for continuous input control Fine-grained control is one of them. 예를 들어 사용자가 음악 앱에서 볼륨을 변경할 수 있습니다.For example, a user might want to change their volume in their music app. "큰" 것은 아니지만 시스템에서 볼륨을 만드는 것이 얼마나 큰 지는 확실 하지 않습니다.She can say "louder", but it's not clear how much louder the system is supposed to make the volume. 사용자는 "약간 더 크게 만들기" 라고 말할 수 있지만 "약간의"는 수량화 하기 어렵습니다.The user could say: "Make it a little louder", but "a little" is difficult to quantify. 음성으로 holograms을 이동 하거나 크기를 조정 하는 것은 비슷하게 어렵습니다.Moving or scaling holograms with voice is similarly difficult.

음성 입력 검색의 안정성 음성 입력 시스템은 더 효과적이 고 더 나은 반면 음성 명령을 잘못 듣고 해석 하는 경우도 있습니다.Reliability of voice input detection While voice input systems become better and better, sometimes they may incorrectly hear and interpret a voice command. 핵심은 응용 프로그램에서 챌린지를 해결 하는 것입니다.The key is to address the challenge in your application. 시스템이 수신 대기 하는 경우 사용자에 게 피드백을 제공 하 고 시스템에서 사용자의 음성을 이해 하는 잠재적인 문제를 명확 하 게 파악할 수 있습니다.Provide feedback to your users when the system is listening and what the system understood clarifies potential issues understanding the users' speech.

공유 공간의 음성 입력 음성은 다른 사용자와 공유 하는 공간에서 사회 공학적 허용 되지 않을 수 있습니다.Voice input in shared spaces Voice may not be socially acceptable in spaces that you share with others. 다음은 몇 가지 예입니다.Here are a few examples:

  • 사용자가 다른 사용자의 방해를 원하지 않을 수 있습니다 (예: 자동 라이브러리나 공유 사무실).The user may not want to disturb others (for example, in a quiet library or shared office)
  • 사용자가 공개를 통해 자신에 게 표시 되지 않을 수 있습니다.Users may feel awkward being seen talking to themselves in public,
  • 사용자가 암호를 포함 하 여 개인 또는 기밀 메시지를 수신 하는 불편을 느낄 수 있습니다.A user may feel uncomfortable dictating a personal or confidential message (including passwords) while others are listening

고유 하거나 알 수 없는 단어의 음성 입력 음성 입력의 어려움은 사용자가 시스템에서 알 수 없는 단어 (예: 애칭, 특정은 어 단어 또는 약어)를 받아쓰게 하는 경우에도 제공 됩니다.Voice input of unique or unknown words Difficulties for voice input also come when users are dictating words that may be unknown to the system, such as nicknames, certain slang words, or abbreviations.

음성 명령 학습 최종 목표는 시스템과 자연스럽 게 사용 되는 것이 아니라 앱이 미리 정의 된 특정 음성 명령을 계속 사용 하는 경우가 많습니다.Learning voice commands While the ultimate goal is to naturally converse with your system, often apps still rely on specific pre-defined voice commands. 중요 한 음성 명령 집합과 관련 된 과제는 사용자를 오버 로드 하지 않고 사용자를 유지 하는 데 도움이 되는 방법을 설명 하는 방법입니다.A challenge associated with a significant set of voice commands is how to teach them without overloading the user and how to help the user to keep them.



음성 피드백 상태Voice feedback states

음성이 제대로 적용되면 사용자는 말할 수 있는 사항 을 이해하고 시스템이 올바르게 알아 들었다는 명확한 피드백을 받게 됩니다.When Voice is applied properly, the user understands what they can say and get clear feedback the system heard them correctly. 이러한 두 신호를 통해 사용자는 음성을 기본 입력으로 사용할 때 안심할 수 있습니다.These two signals make the user feel confident in using Voice as a primary input. 다음은 음성 입력이 인식될 때 커서에 나타나는 결과와 사용자에게 이러한 사실을 전달하는 방법을 보여 주는 다이어그램입니다.Below is a diagram showing what happens to the cursor when voice input is recognized and how it communicates that to the user.

1. 일반 커서 상태1. Regular cursor state
1. 일반 커서 상태1. Regular cursor state

2. 음성 피드백을 전달 하 고 사라집니다.2. Communicates voice feedback and then disappears
2. 음성 피드백을 전달 하 고 사라집니다.2. Communicates voice feedback and then disappears

3.*3. 일반 커서 상태Regular cursor state
3. 일반 커서 상태로 돌아갑니다.3. Returns to regular cursor state




혼합 현실에서 "음성"에 대해 알아야 할 주요 사항Top things users should know about "speech" in mixed reality

  • 단추를 대상으로 하는 동안 "선택" 이라고 말할 수 있습니다 .이 단추를 사용 하 여 단추를 선택할 수 있습니다.Say "Select" while targeting a button (you can use this anywhere to select a button).
  • 일부 앱에서는 작업을 수행하기 위해 label name of an app bar button 이라고 말할 수 있습니다.You can say the label name of an app bar button in some apps to take an action. 예를 들어 앱을 확인 하는 동안 사용자는 "제거" 명령을 사용 하 여 전 세계에서 앱을 제거할 수 있습니다. 이렇게 하면 사용자가 손을 선택 하지 않아도 됩니다.For example, while looking at an app, a user can say the command "Remove" to remove the app from the world (this saves time from having to select it with your hand).
  • Cortana 수신 대기를 시작할 수 있습니다 .You can start Cortana listening by saying "Hey Cortana." 질문을 하거나("Hey Cortana, how tall is the Eiffel tower"), 앱을 열도록 말하거나("Hey Cortana, open Netflix"), 시작 메뉴를 불러오도록 말할 수 있습니다("Hey Cortana, take me home").You can ask her questions ("Hey Cortana, how tall is the Eiffel tower"), tell her to open an app ("Hey Cortana, open Netflix"), or tell her to bring up the Start Menu ("Hey Cortana, take me home") and more.

음성에 대한 사용자의 일반적인 질문 및 어려움Common questions and concerns users have about voice

  • 어떤 말을 할 수 있나요?What can I say?
  • 시스템이 내 말을 제대로 알아듣는지 어떻게 알 수 있나요?How do I know the system heard me correctly?
    • 시스템이 내 음성 명령을 계속 잘못 알아듣습니다.The system keeps getting my voice commands wrong.
    • 음성 명령을 받아도 반응하지 않습니다.It doesn’t react when I give it a voice command.
  • 음성 명령을 제공할 때 잘못된 방식으로 반응합니다.It reacts the wrong way when I give it a voice command.
  • 특정 앱이나 앱 명령을 대상으로 음성 명령을 내리려면 어떻게 하나요?How do I target my voice to a specific app or app command?
  • 음성을 사용해서 항목을 HoloLens의 홀로그래픽 프레임 밖으로 보낼 수 있나요?Can I use voice to command things out the holographic frame on HoloLens?

통신Communication

HoloLens에서 제공 하는 사용자 지정 된 오디오 입력 처리 옵션을 활용 하려는 응용 프로그램의 경우 앱에서 사용할 수 있는 다양 한 오디오 스트림 범주 를 이해 하는 것이 중요 합니다.For applications that want to take advantage of the customized audio input processing options provided by HoloLens, it's important to understand the various audio stream categories your app can consume. Windows 10은 다양 한 스트림 범주를 지원 하 고, HoloLens는 이러한 세 가지를 사용 하 여 주변 환경 오디오 캡처 (즉, "캠코더") 시나리오에 사용할 수 있는 음성, 통신 등에 맞게 조정 된 마이크 오디오 품질을 최적화할 수 있도록 합니다.Windows 10 supports several different stream categories and HoloLens makes use of three of these to enable custom processing to optimize the microphone audio quality tailored for speech, communication, and other, which can be used for ambient environment audio capture (that is, "camcorder") scenarios.

  • AudioCategory_Communications stream 범주는 통화 품질 및 내레이션 시나리오에 맞게 사용자 지정 되며 클라이언트에 사용자 음성의 16Khz 24 비트 mono 오디오 스트림을 제공 합니다.The AudioCategory_Communications stream category is customized for call quality and narration scenarios and provides the client with a 16-kHz 24-bit mono audio stream of the user's voice
  • AudioCategory_Speech stream 범주는 HoloLens (Windows) 음성 엔진에 맞게 사용자 지정 되며 사용자 음성의 16Khz 24 비트 mono 스트림을 제공 합니다.The AudioCategory_Speech stream category is customized for the HoloLens (Windows) speech engine and provides it with a 16-kHz 24-bit mono stream of the user's voice. 이 범주는 필요한 경우 타사 음성 엔진에서 사용할 수 있습니다.This category can be used by third-party speech engines if needed.
  • AudioCategory_Other stream 범주는 주변 환경 오디오 녹음에 맞게 사용자 지정 되며 클라이언트에 48-kHz 24 비트 스테레오 오디오 스트림을 제공 합니다.The AudioCategory_Other stream category is customized for ambient environment audio recording and provides the client with a 48-kHz 24-bit stereo audio stream.

이러한 오디오 처리는 모두 하드웨어 가속입니다. 즉, HoloLens CPU에서 동일한 처리가 수행 된 경우 보다 기능이 훨씬 더 많은 전력을 소모 하 게 됩니다.All this audio processing is hardware accelerated which means the features drain a lot less power than if the same processing was done on the HoloLens CPU. 시스템 배터리 수명을 최대화 하 고 오프 로드 된 기본 제공 오디오 입력 처리 기능을 활용 하기 위해 CPU에서 기타 오디오 입력 처리를 실행 하지 않도록 합니다.Avoid running other audio input processing on the CPU to maximize system battery life and take advantage of the built-in, offloaded audio input processing.

언어Languages

HoloLens 2는 여러 언어를 지원합니다.HoloLens 2 supports multiple languages. 음성 명령은 여러 키보드가 설치 되어 있거나 앱이 다른 언어로 음성 인식기를 만들려고 하는 경우에도 항상 시스템의 표시 언어로 실행 됩니다.Keep in mind that speech commands will always run in the system's display language even if multiple keyboards are installed or if apps attempt to create a speech recognizer in a different language.

문제 해결Troubleshooting

"Select" 및 "안녕하세요 Cortana"를 사용 하는 데 문제가 있는 경우 더 조용한 공간으로 이동 하거나, 소음의 원본에서 떨어진 곳으로 이동 하거나, 더 크게 말해 보세요.If you're having any issues using "select" and "Hey Cortana", try moving to a quieter space, turning away from the source of noise, or by speaking louder. 지금은 HoloLens의 모든 음성 인식이 특별히 미국 영어의 기본 스피커로 조정 되 고 최적화 됩니다.At this time, all speech recognition on HoloLens is tuned and optimized specifically to native speakers of United States English.

Windows Mixed Reality Developer Edition 릴리스 2017에서는 초기 HMD 연결 후 PC 데스크톱에 로그 아웃 했다가 다시 로그인 한 후 오디오 끝점 관리 논리가 정상적으로 작동 합니다 (계속).For the Windows Mixed Reality Developer Edition release 2017, the audio endpoint management logic will work fine (forever) after logging out and back in to the PC desktop after the initial HMD connection. WMR OOBE를 통과 한 후 첫 번째 로그 아웃 이벤트 이전에는 사용자가 HMD를 처음으로 연결 하기 전에 시스템이 설정 된 방법에 따라 오디오 없음에서 오디오 전환 없이 다양 한 오디오 기능 문제를 겪을 수 있습니다.Before that first sign out/in event after going through WMR OOBE, the user could experience various audio functionality issues ranging from no audio to no audio switching depending on how the system was set up before connecting the HMD for the first time.



Unity 용 MRTK (Mixed Reality Toolkit)의 음성 입력Voice input in MRTK (Mixed Reality Toolkit) for Unity

Mrtk 를 사용 하면 개체에 음성 명령을 쉽게 할당할 수 있습니다.With MRTK, you can easily assign voice command on any objects. MRTK의 음성 입력 프로필 을 사용 하 여 키워드를 정의 합니다.Use MRTK's Speech Input Profile to define your keywords. SpeechInputHandler 스크립트를 할당 하 여 음성 입력 프로필에 정의 된 키워드에 대 한 모든 개체 응답을 만들 수 있습니다.By assigning SpeechInputHandler script, you can make any object respond to the keywords defined in the Speech Input Profile. 또한 SpeechInputHandler는 사용자의 신뢰도를 높이기 위해 음성 확인 레이블을 제공 합니다.SpeechInputHandler also provides speech confirmation label to improve the user's confidence.


참고 항목See also