Compartilhar via


Implantar seu modelo de voz profissional como um ponto de extremidade

Após criar e treinar com êxito seu modelo de voz, implante-o em um ponto de extremidade de voz neural personalizada.

Observação

Você pode criar até 50 pontos de extremidade com um recurso de Fala padrão (S0), cada um com sua própria voz neural personalizada.

Para usar sua voz neural personalizada, você deve especificar o nome do modelo de voz, usar o URI personalizado diretamente em uma solicitação HTTP e usar o mesmo recurso de fala para passar pela autenticação do serviço de conversão de texto em fala.

Adicionar um ponto de extremidade de implantação

Para criar um ponto de extremidade de voz neural personalizado:

  1. Entre no Speech Studio.

  2. Selecione Voz personalizada> Nome do seu projeto >Implantar modelo>Implantar modelo.

  3. Selecione um modelo de voz que você deseja associar a este ponto de extremidade.

  4. Insira um Nome e uma Descrição para o ponto de extremidade personalizado.

  5. Selecione Tipo de ponto de extremidade de acordo com seu cenário. Se o recurso estiver em uma região com suporte, a configuração padrão para o tipo de ponto de extremidade será Alto desempenho. Caso contrário, se o recurso estiver em uma região sem suporte, a única opção disponível será Retomada rápida.

    • Alto desempenho: otimizado para cenários com solicitações de síntese em tempo real e de alto volume, como IA de conversa, bots de call center. Leva cerca de 5 minutos para implantar ou retomar um ponto de extremidade. Para obter informações sobre regiões em que há suporte para o tipo de ponto de extremidade de alto desempenho , consulte as notas de rodapé na tabela de regiões.
    • Retomada rápida: otimizado para cenários de criação de conteúdo de áudio com solicitações de síntese menos frequentes. Fácil e rápido de implantar ou retomar um ponto de extremidade em menos de um minuto. Há suporte para o tipo de ponto de extremidade De retomada rápida em todas as regiões em que a conversão de texto em fala está disponível.
  6. Clique em Implantar para criar o ponto de extremidade.

Depois que o ponto de extremidade for implantado, o nome dele aparecerá como um link. Selecione no link para exibir informações específicas do seu ponto de extremidade, como a chave do ponto de extremidade, a URL do ponto de extremidade e o código de exemplo. Quando o status da implantação for Com êxito, o ponto de extremidade estará pronto para uso.

Configurações do aplicativo

As configurações do aplicativo que você usa como parâmetros de solicitação da API REST estão disponíveis na guia Implantar modelo no Speech Studio.

Screenshot of custom endpoint app settings in Speech Studio.

  • A Chave do ponto de extremidade mostra a chave do recurso de Fala com o qual o ponto de extremidade está associado. Use a chave do ponto de extremidade como o valor do seu Ocp-Apim-Subscription-Key cabeçalho de solicitação.
  • A URL do ponto de extremidade mostra sua região de serviço. Use o valor que precede voice.speech.microsoft.com como seu parâmetro de solicitação de região de serviço. Por exemplo, use eastus se a URL do ponto de extremidade for https://eastus.voice.speech.microsoft.com/cognitiveservices/v1.
  • A URL do ponto de extremidade mostra a ID do ponto de extremidade. Use o valor acrescentado ao ?deploymentId= parâmetro de consulta como o valor do parâmetro de solicitação de ID do ponto de extremidade.

Usar sua voz personalizada

O ponto de extremidade personalizado é funcionalmente idêntico ao ponto de extremidade padrão usado para solicitações de conversão de texto em fala.

Uma diferença é que o EndpointId deve ser especificado para usar a voz personalizada por meio do SDK de Fala. Você pode começar com o início rápido da conversão de texto em fala e, em seguida, atualizar o código com EndpointId e o SpeechSynthesisVoiceName. Para obter mais informações, consulte usar um ponto de extremidade personalizado.

Para usar uma voz neural personalizada por meio de Speech Synthesis Markup Language (SSML), especifique o nome do modelo como o nome da voz. Este exemplo usa a voz YourCustomVoiceName.

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

Alternar para um novo modelo de voz em seu produto

Depois de você atualizar seu modelo de voz para a versão mais recente do mecanismo ou se quiser mudar para uma nova voz em seu produto, precisará reimplantar o novo modelo de voz para um novo ponto de extremidade. Não há suporte para a reimplantação do novo modelo de voz no ponto de extremidade existente. Após a implantação, alterne o tráfego para o ponto de extremidade recém-criado. Inicialmente, recomendamos transferir o tráfego para o novo ponto de extremidade em um ambiente de teste para garantir que o tráfego funcione bem e, em seguida, transferir para o novo ponto de extremidade no ambiente de produção. Durante a transição, é necessário manter o ponto de extremidade antigo. Se houver alguns problemas com o novo ponto de extremidade durante a transição, você poderá voltar para o ponto de extremidade antigo. Se o tráfego estiver funcionando bem no novo ponto de extremidade por cerca de 24 horas (valor recomendado), você poderá excluir o ponto de extremidade antigo.

Observação

Se o nome de voz for alterado e você estiver usando o SSML (Speech Synthesis Markup Language), use o novo nome de voz no SSML.

Suspender e retomar um ponto de extremidade

É possível suspender ou retomar um ponto de extremidade, para limitar gastos e conservar recursos que não estão em uso. Você não será cobrado enquanto o ponto de extremidade estiver suspenso. Ao retomar um ponto de extremidade, você pode usar a mesma URL do ponto de extremidade no aplicativo para sintetizar a fala.

Observação

A operação de suspensão será concluída quase imediatamente. A operação de retomada é concluída em aproximadamente a mesma quantidade de tempo que uma nova implantação.

Esta seção descreve como suspender ou retomar um ponto de extremidade de voz neural personalizado no portal do Speech Studio.

Suspender ponto de extremidade

  1. Para suspender e desativar seu ponto de extremidade, selecione Suspender na guia Implantar modelo no Speech Studio.

    Screenshot of the select suspend endpoint option.

  2. Na caixa de diálogo exibida, selecione Enviar. Depois que o ponto de extremidade for suspenso, o Speech Studio mostrará a notificação de ponto de extremidade suspensa com êxito.

Retomar ponto de extremidade

  1. Para retomar e ativar seu ponto de extremidade, selecione retomar na guia Implantar modelo no Speech Studio.

    Screenshot of the select resume endpoint option.

  2. Na caixa de diálogo exibida, selecione Enviar. Depois que você reativar o ponto de extremidade com êxito, o status será alterado de Suspenso para bem-sucedido.

Próximas etapas

Após criar e treinar com êxito seu modelo de voz, implante-o em um ponto de extremidade de voz neural personalizada.

Observação

Você pode criar até 50 pontos de extremidade com um recurso de Fala padrão (S0), cada um com sua própria voz neural personalizada.

Adicionar um ponto de extremidade de implantação

Para criar um ponto de extremidade, use a operação Endpoints_Create da API de voz personalizada. Construa o corpo da solicitação de acordo com as seguintes instruções:

  • Defina a propriedade projectId necessária. Consulte Criar um projeto.
  • Defina a propriedade modelId obrigatória. Consulte treinar um modelo de voz.
  • Defina a propriedade description obrigatória. A descrição da voz pode ser alterada posteriormente.

Faça uma solicitação HTTP PUT usando o URI, conforme mostrado no exemplo Endpoints_Create a seguir.

  • Substitua YourResourceKey pela chave do recurso de Fala.
  • Substitua YourResourceRegion pela região do Recurso de Fala.
  • Substitua EndpointId por uma ID de ponto de extremidade de sua escolha. A ID deve ser um GUID e deve ser exclusiva em seu recurso de Fala. A ID será usada no URI do projeto e não poderá ser alterada posteriormente.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/EndpointId?api-version=2023-12-01-preview"

Você deve receber um corpo de resposta no seguinte formato:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

O cabeçalho de resposta contém a propriedade Operation-Location. Use esse URI para obter detalhes sobre a operação Endpoints_Create. Aqui está um exemplo do cabeçalho da resposta:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/284b7e37-f42d-4054-8fa9-08523c3de345?api-version=2023-12-01-preview
Operation-Id: 284b7e37-f42d-4054-8fa9-08523c3de345

Use o ponto de extremidade Operation-Location em solicitações de API subsequentes para suspender e retomar um ponto de extremidade e excluir um ponto de extremidade.

Usar sua voz personalizada

Para usar sua voz neural personalizada, você deve especificar o nome do modelo de voz, usar o URI personalizado diretamente em uma solicitação HTTP e usar o mesmo recurso de fala para passar pela autenticação do serviço de conversão de texto em fala.

O ponto de extremidade personalizado é funcionalmente idêntico ao ponto de extremidade padrão usado para solicitações de conversão de texto em fala.

Uma diferença é que o EndpointId deve ser especificado para usar a voz personalizada por meio do SDK de Fala. Você pode começar com o início rápido da conversão de texto em fala e, em seguida, atualizar o código com EndpointId e o SpeechSynthesisVoiceName. Para obter mais informações, consulte usar um ponto de extremidade personalizado.

Para usar uma voz neural personalizada por meio de Speech Synthesis Markup Language (SSML), especifique o nome do modelo como o nome da voz. Este exemplo usa a voz YourCustomVoiceName.

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

Suspender um ponto de extremidade

É possível suspender ou retomar um ponto de extremidade, para limitar gastos e conservar recursos que não estão em uso. Você não será cobrado enquanto o ponto de extremidade estiver suspenso. Ao retomar um ponto de extremidade, você pode usar a mesma URL do ponto de extremidade no aplicativo para sintetizar a fala.

Para suspender um ponto de extremidade, use a operação Endpoints_Suspend da API de voz personalizada.

Faça uma solicitação HTTP POST usando o URI, conforme mostrado no exemplo Endpoints_Suspend a seguir.

  • Substitua YourResourceKey pela chave do recurso de Fala.
  • Substitua YourResourceRegion pela região do Recurso de Fala.
  • Substitua YourEndpointId pela ID do ponto de extremidade que você recebeu quando criou o ponto de extremidade.
curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:suspend?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

Você deve receber um corpo de resposta no seguinte formato:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Disabling",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

Retomar um ponto de extremidade

Para suspender um ponto de extremidade, use a operação Endpoints_Resume da API de voz personalizada.

Faça uma solicitação HTTP POST usando o URI, conforme mostrado no exemplo Endpoints_Resume a seguir.

  • Substitua YourResourceKey pela chave do recurso de Fala.
  • Substitua YourResourceRegion pela região do Recurso de Fala.
  • Substitua YourEndpointId pela ID do ponto de extremidade que você recebeu quando criou o ponto de extremidade.
curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:resume?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

Você deve receber um corpo de resposta no seguinte formato:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Running",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

Excluir um ponto de extremidade

Para excluir um ponto de extremidade, use a operação Endpoints_Delete da API de voz personalizada.

Faça uma solicitação HTTP DELETE usando o URI, conforme mostrado no exemplo Endpoints_Delete a seguir.

  • Substitua YourResourceKey pela chave do recurso de Fala.
  • Substitua YourResourceRegion pela região do Recurso de Fala.
  • Substitua YourEndpointId pela ID do ponto de extremidade que você recebeu quando criou o ponto de extremidade.
curl -v -X DELETE "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey"

Você deve receber um cabeçalho de resposta com o código de status 204.

Alternar para um novo modelo de voz em seu produto

Depois de você atualizar seu modelo de voz para a versão mais recente do mecanismo ou se quiser mudar para uma nova voz em seu produto, precisará reimplantar o novo modelo de voz para um novo ponto de extremidade. Não há suporte para a reimplantação do novo modelo de voz no ponto de extremidade existente. Após a implantação, alterne o tráfego para o ponto de extremidade recém-criado. Inicialmente, recomendamos transferir o tráfego para o novo ponto de extremidade em um ambiente de teste para garantir que o tráfego funcione bem e, em seguida, transferir para o novo ponto de extremidade no ambiente de produção. Durante a transição, é necessário manter o ponto de extremidade antigo. Se houver alguns problemas com o novo ponto de extremidade durante a transição, você poderá voltar para o ponto de extremidade antigo. Se o tráfego estiver funcionando bem no novo ponto de extremidade por cerca de 24 horas (valor recomendado), você poderá excluir o ponto de extremidade antigo.

Observação

Se o nome de voz for alterado e você estiver usando o SSML (Speech Synthesis Markup Language), use o novo nome de voz no SSML.

Próximas etapas