¿Qué es la traducción de voz?What is speech translation?

La traducción de voz de Servicios de voz de Azure permite la traducción voz a voz y voz a texto de secuencias de audio en varios idiomas en tiempo real.Speech translation from Azure Speech Services, enables real-time, multi-language speech-to-speech and speech-to-text translation of audio streams. Con el SDK de voz, sus aplicaciones, herramientas y los dispositivos tienen acceso a las transcripciones de origen y a las salidas de traducción del audio proporcionadas.With the Speech SDK, your applications, tools, and devices have access to source transcriptions and translation outputs for provided audio. Se devuelven resultados provisionales de transcripción y traducción cuando se detecta la voz y los resultados finales se pueden convertir en voz sintetizada.Interim transcription and translation results are returned as speech is detected, and finals results can be converted into synthesized speech.

El motor de traducción de Microsoft usa tecnología de dos enfoques diferentes: traducción automática estadística (SMT) y traducción automática neuronal (NMT).Microsoft's translation engine is powered by two different approaches: statistical machine translation (SMT) and neural machine translation (NMT). SMT usa análisis estadísticos avanzados para estimar las mejores traducciones posibles dado el contexto de unas pocas palabras.SMT uses advanced statistical analysis to estimate the best possible translations given the context of a few words. Con NMT, las redes neuronales se utilizan para proporcionar traducciones más precisas y naturales mediante el contexto completo de las oraciones para traducir palabras.With NMT, neural networks are used to provide more accurate, natural-sounding translations by using the full context of sentences to translate words.

En la actualidad, Microsoft utiliza NMT para la traducción a los idiomas más populares.Today, Microsoft uses NMT for translation to most popular languages. Todos los idiomas disponibles para la traducción de voz a voz cuentan con la tecnología de NMT.All languages available for speech-to-speech translation are powered by NMT. La traducción de voz a texto puede utilizar SMT o NMT, según el par de idiomas.Speech-to-text translation may use SMT or NMT depending on the language pair. Si el idioma de destino admite NMT, la traducción completa se realiza con NMT.When the target language is supported by NMT, the full translation is NMT-powered. Si el idioma de destino no admite NMT, la traducción es un híbrido de NMT y SMT, con el idioma inglés como "enlace" entre los dos idiomas.When the target language isn't supported by NMT, the translation is a hybrid of NMT and SMT, using English as a "pivot" between the two languages.

Características principalesCore features

Estas son las características disponibles en el SDK de voz y las API REST de Speech Services:Here are the features available via the Speech SDK and REST APIs:

Caso de usoUse case SDKSDK RESTREST
Traducción de voz a texto con resultados de reconocimiento.Speech-to-text translation with recognition results. Yes SinNo
Traducción de voz a voz.Speech-to-speech translation. Yes SinNo
Resultados de reconocimiento y traducción provisionales.Interim recognition and translation results. Yes SinNo

Introducción a la traducción de vozGet started with speech translation

Le ofrecemos inicios rápidos diseñados para que ejecute el código en menos de 10 minutos.We offer quickstarts designed to have you running code in less than 10 minutes. Esta tabla incluye una lista de inicios rápidos de traducción de voz ordenados por idioma.This table includes a list of speech translation quickstarts organized by language.

Guía de inicio rápidoQuickstart PlataformaPlatform Referencia de APIAPI reference
C#, .NET CoreC#, .NET Core WindowsWindows BrowseBrowse
C#, .NET FrameworkC#, .NET Framework WindowsWindows BrowseBrowse
C#, UWPC#, UWP WindowsWindows BrowseBrowse
C++C++ WindowsWindows BrowseBrowse
JavaJava Windows, Linux, macOSWindows, Linux, macOS BrowseBrowse

Código de ejemploSample code

Hay un ejemplo de código para el SDK de voz disponible en GitHub.Sample code for the Speech SDK is available on GitHub. En estos ejemplos se tratan escenarios comunes como la lectura de audio de un archivo o secuencia, el reconocimiento o traducción continuos y de una sola emisión, y el trabajo con modelos personalizados.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition/translation, and working with custom models.

Guías de migraciónMigration guides

Si sus aplicaciones, herramientas o productos usan Translator Speech API, hemos creado guías que le ayudarán a migrar a los servicios de Voz.If your applications, tools, or products are using the Translator Speech API, we've created guides to help you migrate to the Speech Services.

Documentos de referenciaReference docs

Pasos siguientesNext steps