Dyktowania

Dyktowanie umożliwia użytkownikom nagrywanie klipów dźwiękowych i uzyskiwanie transkrypcji. Aby go użyć, upewnij się, że system dyktowania jest zarejestrowany w profilu systemu wejściowego. Windows dostawca danych wejściowych dyktowania to dostarczany od teraz system dyktowania, ale można utworzyć alternatywne systemy dyktowania implementujące IMixedRealityDictationSystem .

Wymagania

System dyktowania używa funkcji DictationRecognizer aparatu Unity, która sama używa bazowych interfejsów API Windows mowy do obsługi dyktowania. Należy pamiętać, że oznacza to, że ta funkcja jest obecna tylko Windows platformach opartych na platformach.

Korzystanie z systemu dyktowania wymaga możliwości aplikacji "Klient internetowy" i "Mikrofon" w sekcji PlayerSettings - Capabilities. Zobacz Windows Mixed Reality dokumentacji, aby uzyskać więcej informacji na temat danych wejściowych głosu w a aparatu Unity.

Konfiguracja

Data provider

Po skonfigurowaniu usługi dyktowania możesz użyć skryptu, aby rozpocząć i zatrzymać rejestrowanie sesji oraz uzyskać wyniki transkrypcji za pośrednictwem DictationHandler aparatu UnityEvents.

Dictation Handler
  • Hipoteza dyktowania jest wywoływana, gdy użytkownik mówi z wcześnie, wątką transkrypcją przechwyconych do tej pory dźwięku.
  • Wynik dyktowania jest wywoływany na końcu każdego zdania (tj. gdy użytkownik wstrzymuje się) z końcową transkrypcją przechwyconego do tej pory dźwięku.
  • Dyktowanie zakończone jest wywoływane na końcu sesji rejestrowania z pełną, końcową transkrypcją dźwięku.
  • Błąd dyktowania jest wywoływany w celu informowania o błędach w usłudze dyktowania. Transkrypcja w tym przypadku zawiera opis błędu.

Przykładowa scena

Scena dyktowania w MRTK/Examples/Demos/Input/Scenes/Dictation programie pokazuje DictationHandler skrypt w użyciu. Jeśli potrzebujesz większej kontroli, możesz rozszerzyć ten skrypt lub utworzyć własne wdrożenie w celu bezpośredniego odbierania zdarzeń IMixedRealityDictationHandler dyktowania.

Dictation Demo