Speech Services

Voz

Idea de solución

Si le gustaría que expandamos este artículo con más información, como posibles casos de uso, servicios alternativos, consideraciones de implementación o una guía de precios, comuníquese a través de los Comentarios de GitHub.

Con Servicios de voz resulta sencillo transcribir cada llamada. Indexe la transcripción para realizar búsquedas de texto completo o aplique Text Analytics para detectar opiniones, idiomas y frases clave para información detallada. Si las grabaciones del centro de llamadas contienen terminología especializada (como nombres de producto o jerga de TI), puede crear un modelo de lenguaje personalizado para enseñar el vocabulario a Speech Services. Un modelo acústico personalizado ayuda a Speech Services a comprender a los hablantes, incluso con ruido de fondo o conexiones telefónicas defectuosas.

Para más información, consulte cómo funciona la transcripción por lotes con Speech Services.

Architecture

Diagrama de la arquitectura Descargue un SVG de esta arquitectura.

Data Flow

  1. Adapte un modelo para el dominio e impleméntelo.
  2. Cargue las grabaciones en un contenedor de blobs.
  3. Cree una solicitud POST para la transcripción por lotes.
  4. Speech Services programa el trabajo de transcripción.
  5. Los archivos estéreo se dividen en dos canales.
  6. Los archivos mono se someten a diarización para distinguir entre los altavoces.
  7. Descargue la transcripción mediante el identificador de transcripción.

Componentes

Pasos siguientes