음성 API 서비스 유형
Azure Cognitive Services Speech Service를 사용하여 음성 텍스트 변환, 텍스트 음성 변환, 음성 변환 및 화자 인식을 비롯한 음성 언어 변환을 수행할 수 있습니다.
참고
용어 또는 구에 대한 인사이트를 수집하거나 음성 또는 서면 언어에 대한 자세한 컨텍스트 분석을 얻으려면 Azure Cognitive Service for Language 를 사용합니다.
서비스
- 음성 텍스트 변환은 오디오 스트림을 실시간으로 또는 일괄 처리로 텍스트로 변환할 수 있습니다.
- 텍스트 음성 변환 을 사용하면 애플리케이션에서 텍스트를 인간과 유사한 음성으로 변환할 수 있습니다.
- 음성 번역 은 오디오 스트림의 다국어 음성 음성 변환 및 음성 텍스트 변환을 제공합니다.
음성 서비스를 선택하는 방법
이 순서도는 필요에 맞는 음성 서비스를 선택하는 데 도움이 될 수 있습니다.
다이어그램의 왼쪽은 오디오-오디오 또는 오디오-텍스트 변환 프로세스를 보여 줍니다.
- 음성 텍스트 변환은 음성을 오디오 원본에서 텍스트 형식으로 변환하는 데 사용됩니다.
- 음성 음성 변환은 한 언어의 음성을 다른 언어로 음성으로 번역하는 데 사용됩니다.
다이어그램의 오른쪽은 텍스트-오디오 프로세스를 보여 줍니다.
- 텍스트 음성 변환은 텍스트 원본에서 음성 오디오를 생성하는 데 사용됩니다.
일반 사용 예
다음 표에서는 몇 가지 일반적인 사용 사례에 대한 서비스를 권장합니다.
사용 사례 | 사용할 서비스 |
---|---|
녹화된 비디오 또는 라이브 비디오에 대한 선택 자막 제공 | 음성 텍스트 변환 |
전화 통화 또는 모임의 대본 만들기 | 음성 텍스트 변환 |
자동화된 메모 받아쓰기 구현 | 음성 텍스트 변환 |
추가 처리를 위해 의도한 사용자 입력 확인 | 음성 텍스트 변환 |
사용자 입력에 대한 음성 응답 생성 | 텍스트 음성 변환 |
전화 시스템용 음성 메뉴 만들기 | 텍스트 음성 변환 |
핸즈프리 시나리오에서 전자 메일 또는 문자 메시지를 소리 내어 읽기 | 텍스트 음성 변환 |
기차역이나 공항과 같은 공공 장소에서 공지 방송 | 텍스트 음성 변환 |
음성 또는 음성 대화의 동시 양방향 번역을 위한 실시간 선택 자막 생성 | 음성 텍스트 변환 |
참가자
Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.
주요 작성자:
기타 기여자:
- Mick Alberts | 기술 문서 작성자
- Ashish Chahuan | 선임 클라우드 솔루션 설계자
- Brandon Cowen | 선임 클라우드 솔루션 아키텍트
- 만짓 싱 | 소프트웨어 엔지니어
- Christina Skarpathiotaki | 선임 클라우드 솔루션 설계자
- Nathan Widdup | Azure 선임 Fast-Track 엔지니어
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.
다음 단계
- Speech Service란?
- Speech API 블로그 게시물
- 학습 경로: Azure Cognitive Services 프로비전 및 관리
- 학습 경로: Azure Cognitive Speech Services를 사용하여 음성 처리 및 번역
관련 참고 자료
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기