음성 API 서비스 유형

Azure Cognitive Services Speech Service를 사용하여 음성 텍스트 변환, 텍스트 음성 변환, 음성 변환 및 화자 인식을 비롯한 음성 언어 변환을 수행할 수 있습니다.

참고

용어 또는 구에 대한 인사이트를 수집하거나 음성 또는 서면 언어에 대한 자세한 컨텍스트 분석을 얻으려면 Azure Cognitive Service for Language 를 사용합니다.

서비스

이 순서도는 필요에 맞는 음성 서비스를 선택하는 데 도움이 될 수 있습니다.

음성 서비스를 선택하는 방법을 보여 주는 다이어그램

다이어그램의 왼쪽은 오디오-오디오 또는 오디오-텍스트 변환 프로세스를 보여 줍니다.

다이어그램의 오른쪽은 텍스트-오디오 프로세스를 보여 줍니다.

다음 표에서는 몇 가지 일반적인 사용 사례에 대한 서비스를 권장합니다.

사용 사례	사용할 서비스
녹화된 비디오 또는 라이브 비디오에 대한 선택 자막 제공	음성 텍스트 변환
전화 통화 또는 모임의 대본 만들기	음성 텍스트 변환
자동화된 메모 받아쓰기 구현	음성 텍스트 변환
추가 처리를 위해 의도한 사용자 입력 확인	음성 텍스트 변환
사용자 입력에 대한 음성 응답 생성	텍스트 음성 변환
전화 시스템용 음성 메뉴 만들기	텍스트 음성 변환
핸즈프리 시나리오에서 전자 메일 또는 문자 메시지를 소리 내어 읽기	텍스트 음성 변환
기차역이나 공항과 같은 공공 장소에서 공지 방송	텍스트 음성 변환
음성 또는 음성 대화의 동시 양방향 번역을 위한 실시간 선택 자막 생성	음성 텍스트 변환

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

주요 작성자:

기타 기여자:

비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.