전문적인 음성을 위한 프로젝트 만들기

데이터, 모델, 테스트 및 엔드포인트와 같은 사용자 지정 신경망 음성용 콘텐츠는 Speech Studio에서 프로젝트로 구성됩니다. 각 프로젝트는 국가/지역, 언어, 그리고 만들고 싶은 목소리의 성별에 따라 다릅니다. 예를 들어 미국에서 영어를 사용하는 콜 센터의 채팅 봇에 사용되는 여성 음성 프로젝트를 만들 수 있습니다.

고품질 음성을 만들기 위해 전문 녹음에 투자하기 전에 CNV(사용자 지정 신경망 음성) Lite를 사용해 CNV를 데모하고 평가합니다.

몇 가지 오디오 파일과 연결된 대화 내용 기록만 있으면 시작할 수 있습니다. 사용자 지정 신경망 음성에서 언어지역을 지원하는지 확인합니다.

사용자 지정 신경망 음성 Pro 프로젝트 만들기

사용자 지정 신경망 음성 Pro 프로젝트를 만들려면 다음 단계를 수행합니다.

  1. Speech Studio에 로그인합니다.

  2. 작업할 구독 및 음성 리소스를 선택합니다.

    Important

    사용자 지정 신경망 음성 학습은 현재 일부 지역에서만 사용할 수 있습니다. 음성 모델이 지원되는 지역에서 학습되면 필요에 따라 다른 지역의 Speech 리소스에 복사할 수 있습니다. 자세한 내용은 지역 표의 각주를 참조하세요.

  3. 사용자 지정 음성>프로젝트 만들기를 선택합니다.

  4. 사용자 지정 신경망 음성 Pro>다음을 선택합니다.

  5. 마법사에서 제공하는 지침에 따라 프로젝트를 만듭니다.

이름으로 새 프로젝트를 선택하거나 프로젝트로 이동을 선택합니다. 왼쪽 패널에는 성우 설정, 학습 데이터 준비, 모델 학습모델 배포와 같은 메뉴 항목이 표시됩니다.

다음 단계

전문 음성 프로젝트에는 성우 둥의 설명, 학습 데이터 세트, 음성 모델 및 엔드포인트가 포함되어 있습니다.

각 프로젝트는 국가/지역, 언어, 그리고 만들고 싶은 목소리의 성별에 따라 다릅니다. 예를 들어 미국에서 영어를 사용하는 콜 센터의 채팅 봇에 사용되는 여성 음성 프로젝트를 만들 수 있습니다.

프로젝트 만들기

전문 음성 프로젝트를 만들려면 Custom Voice API의 Projects_Create 작업을 사용합니다. 다음 지침에 따라 요청 본문을 생성합니다.

  • 필수 kind 속성을 ProfessionalVoice로 설정합니다. 나중에 종류를 변경할 수 없습니다.
  • 선택적으로 프로젝트 설명에 대해 description 속성을 설정합니다. 프로젝트 설명은 나중에 변경될 수 있습니다.

다음 Projects_Create 예에 표시된 것처럼 URI를 사용하여 HTTP PUT 요청을 만듭니다.

  • YourResourceKey를 Speech 리소스 키로 바꿉니다.
  • YourResourceRegion을 음성 리소스 지역으로 바꿉니다.
  • ProjectId를 원하는 프로젝트 ID로 바꿉니다. 대/소문자 구분 ID는 음성 리소스 내에서 고유해야 합니다. ID는 프로젝트의 URI에 사용되며 나중에 변경할 수 없습니다.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2023-12-01-preview"

응답 본문은 다음 형식으로 표시되어야 합니다.

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

후속 API 요청에서 프로젝트 id를 사용하여 성우 동의를 추가하고 학습 집합을 만듭니다.

다음 단계