Ditado – MRTK2

O ditado permite que os usuários gravem clipes de áudio e obtenham uma transcrição. Para usá-lo, verifique se um sistema de ditado está registrado no Perfil do Sistema de Entrada. Windows Provedor de Entrada de Ditado é o sistema de ditado fornecido fora da caixa, mas sistemas de ditado alternativos podem ser criados implementando IMixedRealityDictationSystem.

Requisitos

O sistema de ditado usa DictationRecognizer do Unity, que usa as APIs de fala Windows subjacentes para lidar com o ditado. Observe que isso implica que esse recurso só está presente em plataformas baseadas em Windows.

O uso do sistema de ditado requer os recursos de aplicativo "Cliente da Internet" e "Microfone" na seção PlayerSettings – Capabilities. Consulte Windows Mixed Reality Documentação para obter mais detalhes sobre a entrada de voz no Unity.

Configuração

Data provider

Depois de configurar um serviço de ditado, você pode usar o DictationHandler script para iniciar e parar as sessões de gravação e obter os resultados da transcrição por meio do UnityEvents.

Dictation Handler
  • A hipótese de ditado é gerada à medida que o usuário fala com transcrições iniciais e ásperas do áudio capturado até agora.
  • O resultado do ditado é gerado no final de cada frase (ou seja, quando o usuário pausa) com a transcrição final do áudio capturado até agora.
  • O ditado Concluído é gerado no final da sessão de gravação com a transcrição completa e final do áudio.
  • Erro de ditado é gerado para informar sobre erros no serviço de ditado. A transcrição nesse caso contém uma descrição do erro.

Exemplo de cena

A cena de ditado mostra MRTK/Examples/Demos/Input/Scenes/Dictation o DictationHandler script em uso. Se você precisar de mais controle, poderá estender esse script ou criar sua própria implementação IMixedRealityDictationHandler para receber eventos de ditado diretamente.

Dictation Demo