Speech Services

음성

솔루션 아이디어

잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보를 사용하여 이 문서를 확장하려는 경우 GitHub 피드백을통해 알려주세요!

Speech Services를 사용하여 모든 호출을 쉽게 전사할 수 있습니다. 전체 텍스트 검색에대한 전사를 인덱싱하거나 Text Analytics 적용하여 인사이트에 대한 감정, 언어 및 핵심 구를 검색합니다. 콜 센터 기록에 제품 이름 또는 IT 전문 용어와 같은 특수 용어가 포함된 경우 Speech Services에 어휘를 교육하는 사용자 지정 언어 모델을 만듭니다. 사용자 지정 음향 모델을 사용하면 Speech Services가 배경 소음이나 전화 연결이 좋지 않은 경우에도 화자를 이해하는 데 도움이 됩니다.

자세한 내용은 Speech Services에서 일괄 처리 전사가 작동하는 방식을 읽어보십시오.

Architecture

아키텍처 다이어그램 이 아키텍처의 SVG를 다운로드합니다.

데이터 흐름

  1. 도메인에 맞게 모델 조정 및 해당 모델 배포
  2. Blob 컨테이너에 기록 업로드
  3. 일괄 처리 전사에 대한 POST 요청 만들기
  4. Speech Services는 전사 작업을 예약합니다.
  5. 스테레오 파일은 두 채널로 분할됩니다.
  6. 모노 파일은 화자를 구분하기 위해 분류를 거칩니다.
  7. 전사 ID를 사용하여 전사 다운로드

구성 요소

다음 단계