¿Qué es la traducción de voz?

En este artículo, descubrirá las ventajas y funcionalidades del servicio de traducción de voz, un servicio que le permite agregar a las secuencias de audio traducciones de voz a voz y de voz a texto en varios idiomas y en tiempo real.

Con el SDK de Voz o la CLI de Voz, las aplicaciones, herramientas y dispositivos pueden acceder a las transcripciones de origen y a las salidas de traducción del audio proporcionado. A medida que se detecta la voz, se van devolviendo resultados provisionales de transcripción y traducción. Asimismo, los resultados finales pueden convertirse en voz sintetizada.

Para obtener una lista de los idiomas admitidos para la traducción de voz, consulte Compatibilidad con idiomas y voces.

Características principales

  • Traducción de voz a texto con resultados de reconocimiento.
  • Traducción de voz a voz.
  • Compatibilidad para traducir a varios idiomas de destino.
  • Resultados de reconocimiento y traducción provisionales.

Introducción

Como primer paso, pruebe con el artículo de Inicio rápido de traducción de voz. El servicio de traducción de voz está disponible con el SDK de Voz y la CLI de Voz.

Encontrará ejemplos de conversión de voz en texto y traducción del SDK de Voz en GitHub. En estos ejemplos se tratan escenarios comunes como la lectura de audio de un archivo o flujo, el reconocimiento y traducción únicos y continuos, y el trabajo con modelos personalizados.

Pasos siguientes