Introducción

Completado

El servicio Voz de Azure AI proporciona API que puede usar para compilar aplicaciones habilitadas para voz. Esta característica incluye:

  • Conversión de voz en texto: una API que permite el reconocimiento de voz en la que la aplicación puede aceptar la entrada hablada.
  • Text to Speech: una API que permite la síntesis de voz en la que la aplicación puede proporcionar la salida hablada.
  • Speech Translation: una API que puede usar para traducir la entrada hablada en varios idiomas.
  • Speaker Recognition: una API que permite a la aplicación reconocer hablantes individuales en función de su voz.
  • Reconocimiento de la intención: una API que usa el reconocimiento del lenguaje conversacional para determinar el significado semántico de la entrada hablada.

Este módulo se centra en el reconocimiento de voz y la síntesis de voz, que son funcionalidades importantes de cualquier aplicación habilitada para voz.

En este módulo aprenderá a:

  • Aprovisionamiento de un recurso de Azure para el servicio de Voz de Azure AI
  • Uso de la API Speech-to-Text para implementar el reconocimiento de voz
  • Uso de la API Text-to-Speech para implementar la síntesis de voz
  • Configuración del formato de audio y las voces
  • Uso de Lenguaje de marcado de síntesis de voz (SSML)

En las unidades del módulo se incluye información conceptual importante sobre el servicio de Voz de Azure AI y cómo usar su API mediante uno de los kits de desarrollo de software (SDK) admitidos, después de lo cual podrá probar el servicio Voz de Azure AI personalmente en un ejercicio práctico. Para completar el ejercicio práctico, necesitará una suscripción a Microsoft Azure. Si aún no tiene una, puede solicitar una prueba gratuita en https://azure.com/free.