받아쓰기 - MRTK2

받아쓰기를 사용하면 사용자가 오디오 클립을 녹음하고 전사를 얻을 수 있습니다. 이를 사용하려면 받아쓰기 시스템이 입력 시스템 프로필에 등록되어 있는지 확인합니다. Windows 받아쓰기 입력 공급자 는 기본 제공 받아쓰기 시스템이지만 를 구현하는 IMixedRealityDictationSystem대체 받아쓰기 시스템을 만들 수 있습니다.

요구 사항

받아쓰기 시스템은 받아쓰기를 처리하기 위해 기본 Windows 음성 API를 사용하는 Unity의 DictationRecognizer 를 사용합니다. 이는 이 기능이 Windows 기반 플랫폼에만 있음을 의미합니다.

받아쓰기 시스템을 사용하려면 PlayerSettings - 기능 섹션의 "인터넷 클라이언트" 및 "마이크" 애플리케이션 기능이 모두 필요합니다. Unity의 음성 입력에 대한 자세한 내용은 Windows Mixed Reality 설명서를 참조하세요.

구성

데이터 공급자

받아쓰기 서비스를 설정한 후에는 스크립트를 사용하여 DictationHandler 세션을 시작 및 중지하고 UnityEvents를 통해 전사 결과를 얻을 수 있습니다.

받아쓰기 처리기
  • 받아쓰기 가설 은 사용자가 지금까지 캡처한 오디오의 초기의 거친 전사로 말할 때 발생합니다.
  • 받아쓰기 결과는 지금까지 캡처된 오디오의 최종 전사와 함께 각 문장의 끝에서 발생합니다(즉, 사용자가 일시 중지하는 경우).
  • 받아쓰기 완료 는 녹음 세션이 끝날 때 오디오의 전체 최종 전사와 함께 발생합니다.
  • 받아쓰기 서비스의 오류를 알리기 위해 받아쓰기 오류가 발생합니다. 이 경우 전사에는 오류에 대한 설명이 포함됩니다.

예제 장면

MRTK/Examples/Demos/Input/Scenes/Dictation받아쓰기 장면은 사용 중인 스크립트를 DictationHandler 보여줍니다. 더 많은 제어가 필요한 경우 이 스크립트를 확장하거나 받아쓰기 이벤트를 직접 수신하도록 고유한 구현을 IMixedRealityDictationHandler 만들 수 있습니다.

받아쓰기 데모