Dyktowania

Dyktowanie umożliwia użytkownikom nagrywanie klipów audio i uzyskiwanie transkrypcji. Aby go użyć, upewnij się, że system dyktowania jest zarejestrowany w profilu systemu wejściowego. Windows dostawcą danych wejściowych dyktowania jest system dyktowania udostępniany poza polem, ale można utworzyć alternatywne systemy dyktowania.IMixedRealityDictationSystem

Wymagania

System dyktowania używa DictationRecognizer aparatu Unity, który używa podstawowych interfejsów API mowy Windows do obsługi dyktowania. Należy pamiętać, że oznacza to, że ta funkcja jest obecna tylko na platformach opartych na Windows.

Użycie systemu Dyktowania wymaga możliwości aplikacji "Klient internetowy" i "Mikrofon" w sekcji PlayerSettings — Capabilities (Funkcje). Aby uzyskać więcej informacji na temat danych wejściowych głosowych w środowisku Unity, zobacz dokumentację Windows Mixed Reality.

Konfigurowanie

Data provider

Po skonfigurowaniu usługi dyktowania możesz użyć skryptu DictationHandler do uruchamiania i zatrzymywania sesji nagrywania oraz uzyskiwania wyników transkrypcji za pośrednictwem aparatu UnityEvents.

Dictation Handler
  • Hipoteza dyktowania jest wywoływana , gdy użytkownik mówi z wczesnymi, szorstkimi transkrypcjami dźwięku przechwyconego do tej pory.
  • Wynik dyktowania jest zgłaszany na końcu każdego zdania (tj. gdy użytkownik wstrzymuje się) z ostateczną transkrypcją dźwięku przechwyconego do tej pory.
  • Dictation Complete jest wywoływany na końcu sesji nagrywania z pełną, ostateczną transkrypcją dźwięku.
  • Błąd dyktowania jest zgłaszany w celu informowania o błędach w usłudze dyktowania. Transkrypcja w tym przypadku zawiera opis błędu.

Przykładowa scena

Scena DictationHandlerdyktowania w programie MRTK/Examples/Demos/Input/Scenes/Dictation pokazuje używany skrypt. Jeśli potrzebujesz większej kontroli, możesz rozszerzyć ten skrypt lub utworzyć własne wdrożenie IMixedRealityDictationHandler w celu bezpośredniego odbierania zdarzeń dyktowania.

Dictation Demo