¿Qué es la traducción de voz?

Artículo
01/22/2024

En este artículo, descubrirá las ventajas y funcionalidades del servicio de traducción de voz, un servicio que le permite agregar a las secuencias de audio traducciones de voz a voz y de voz a texto en varios idiomas y en tiempo real.

Con el SDK de Voz o la CLI de Voz, las aplicaciones, herramientas y dispositivos pueden acceder a las transcripciones de origen y a las salidas de traducción del audio proporcionado. A medida que se detecta la voz, se van devolviendo resultados provisionales de transcripción y traducción. Asimismo, los resultados finales pueden convertirse en voz sintetizada.

Para obtener una lista de los idiomas admitidos para la traducción de voz, consulte Compatibilidad con idiomas y voces.

Características principales

Traducción de voz a texto con resultados de reconocimiento.
Traducción de voz a voz.
Compatibilidad para traducir a varios idiomas de destino.
Resultados de reconocimiento y traducción provisionales.

Introducción

Como primer paso, pruebe con el artículo de Inicio rápido de traducción de voz. El servicio de traducción de voz está disponible con el SDK de Voz y la CLI de Voz.

Encontrará ejemplos de conversión de voz en texto y traducción del SDK de Voz en GitHub. En estos ejemplos se tratan escenarios comunes como la lectura de audio de un archivo o flujo, el reconocimiento y traducción únicos y continuos, y el trabajo con modelos personalizados.

Pasos siguientes

Pruebe con el artículo de Inicio rápido de traducción de voz.
Instale el SDK de Voz.
Instale la CLI de Voz.

¿Qué es la traducción de voz?

Características principales

Introducción

Pasos siguientes

Recursos adicionales