Introdução

Concluído

Os recursos de fala de IA nos permitem gerenciar sistemas domésticos e automáticos com instruções de voz, obter respostas de computadores para perguntas faladas, gerar legendas de áudio e muito mais.

Para habilitar esse tipo de interação, o sistema de IA deverá ser compatível com dois recursos:

  • Reconhecimento de Fala: a capacidade de detectar e interpretar a entrada falada
  • Sintetização de voz: a capacidade de gerar uma saída falada

A Fala de IA do Azure fornece recursos de conversão de fala em texto e conversão de texto em fala por meio de reconhecimento de fala e síntese. Você pode usar modelos de serviço para Fala predefinidos e personalizados para diversas tarefas, desde transcrever áudio em texto com alta precisão, identificar alto-falantes em conversas, criar vozes personalizadas e muito mais. Em seguida, você aprenderá como funcionam os recursos de fala de IA.