SpeechConfig Classe

  • java.lang.Object
    • com.microsoft.cognitiveservices.speech.SpeechConfig

Implementações

java.lang.AutoCloseable

public class SpeechConfig
implements java.lang.AutoCloseable

Configuração de fala. Observação: close() deve ser chamado para liberar recursos subjacentes mantidos pelo objeto . Alterado na versão 1.7.0

Resumo do campo

Modificador e tipo Campo e descrição
static java.lang.Class<?> speechConfigClass

Acessador para carregar a biblioteca nativa.

Resumo do Construtor

Modificador Construtor Description
protected SpeechConfig(long handleValue)

Construtor interno para o objeto de configuração de fala.

Resumo do método

Modificador e tipo Método e descrição
void close()

Descarte os recursos associados.

void enableAudioLogging()

Habilitar o log de áudio no serviço.

void enableDictation()

Habilitar ditado.

static SpeechConfig fromAuthorizationToken(String authorizationToken, String region)

Cria uma instância de uma configuração de fala com o token de autorização e a região de serviço especificados.

static SpeechConfig fromEndpoint(URI endpoint)

Cria uma instância da configuração de fala com o ponto de extremidade especificado.

static SpeechConfig fromEndpoint(URI endpoint, String subscriptionKey)

Cria uma instância da configuração de fala com o ponto de extremidade e a chave de assinatura especificados.

static SpeechConfig fromHost(URI host)

Cria uma instância da configuração de fala com o host especificado.

static SpeechConfig fromHost(URI host, String subscriptionKey)

Cria uma instância da configuração de fala com a chave de assinatura e host especificada.

static SpeechConfig fromSubscription(String subscriptionKey, String region)

Cria uma instância de uma configuração de fala com a chave de assinatura e a região de serviço especificadas.

java.lang.String getAuthorizationToken()

Obtém o token de autorização.

java.lang.String getEndpointId()

Obtém a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala ou um modelo de voz personalizado para síntese de fala.

SafeHandle getImpl()

Obtenha o identificador nativo para o objeto de configuração de fala.

OutputFormat getOutputFormat()

Obtém o formato de saída de reconhecimento de fala (simples ou detalhado).

java.lang.String getProperty(PropertyId id)

Obtém a propriedade por ID da propriedade.

java.lang.String getProperty(String name)

Obtém uma propriedade nomeada como valor.

java.lang.String getSpeechRecognitionLanguage()

Obtém o idioma de reconhecimento de fala

java.lang.String getSpeechSynthesisLanguage()

Obtém a linguagem de síntese de fala.

java.lang.String getSpeechSynthesisOutputFormat()

Obtém o formato de saída de síntese de fala.

java.lang.String getSpeechSynthesisVoiceName()

Obtém o nome da voz de síntese de fala.

void requestWordLevelTimestamps()

Inclui carimbos de data/hora no nível da palavra.

void setAuthorizationToken(String value)

Define o token de autorização.

void setEndpointId(String value)

Define a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala ou um modelo de voz personalizado para síntese de fala.

void setOutputFormat(OutputFormat format)

Define o formato de saída de reconhecimento de fala (simples ou detalhado).

void setProfanity(ProfanityOption profanity)

Define a opção de palavrões.

void setProperty(PropertyId id, String value)

Define a propriedade por ID da propriedade.

void setProperty(String name, String value)

Define uma propriedade nomeada como valor.

void setProxy(String proxyHostName, int proxyPort, String proxyUserName, String proxyPassword)

Define a configuração de proxy Adicionada na versão 1.1.0.

void setServiceProperty(String name, String value, ServicePropertyChannel channel)

Define um valor de propriedade que será passado para o serviço usando o canal especificado.

void setSpeechRecognitionLanguage(String value)

Define a linguagem de reconhecimento de fala

void setSpeechSynthesisLanguage(String value)

Define a linguagem de síntese de fala.

void setSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat value)

Define o formato de saída de síntese de fala.

void setSpeechSynthesisVoiceName(String value)

Define o nome da voz da síntese de fala.

Métodos herdados de java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Detalhes do campo

speechConfigClass

public static Class speechConfigClass

Acessador para carregar a biblioteca nativa. Mantém a classe ativa para que a classe GC não a recupere (e as variáveis locais!)

Detalhes do construtor

SpeechConfig

protected SpeechConfig(long handleValue)

Construtor interno para o objeto de configuração de fala.

Parameters:

handleValue - O identificador nativo.

Detalhes do método

close

public void close()

Descarte os recursos associados.

enableAudioLogging

public void enableAudioLogging()

Habilitar o log de áudio no serviço. Os logs de áudio e conteúdo são armazenados no armazenamento de propriedade da Microsoft ou em sua própria conta de armazenamento vinculada à sua assinatura dos Serviços Cognitivos (recurso de Fala habilitado para BYOS (Bring Your Own Storage). Adicionado na versão 1.5.0.

enableDictation

public void enableDictation()

Habilitar ditado. Compatível apenas com o reconhecimento contínuo de fala. Adicionado na versão 1.5.0.

fromAuthorizationToken

public static SpeechConfig fromAuthorizationToken(String authorizationToken, String region)

Cria uma instância de uma configuração de fala com o token de autorização e a região de serviço especificados. Observação: o chamador precisa garantir que o token de autorização seja válido. Antes que o token de autorização expire, o chamador precisa atualizá-lo chamando esse setter com um novo token válido. À medida que os valores de configuração são copiados ao criar um novo reconhecedor, o novo valor de token não se aplicará aos reconhecedores que já foram criados. Para reconhecedores que foram criados antes, você precisa definir o token de autorização do reconhecedor correspondente para atualizar o token. Caso contrário, os reconhecedores encontrarão erros durante o reconhecimento.

Parameters:

authorizationToken - O token de autorização.
region - O nome da região (consulte a página da região).

Returns:

Uma instância de configuração de fala.

fromEndpoint

public static SpeechConfig fromEndpoint(URI endpoint)

Cria uma instância da configuração de fala com o ponto de extremidade especificado. Esse método destina-se apenas a usuários que usam um ponto de extremidade ou parâmetros de serviço não padrão. Observação: os parâmetros de consulta especificados no URI do ponto de extremidade não são alterados, mesmo que sejam definidos por outras APIs. Por exemplo, se a linguagem de reconhecimento for definida no URI como o parâmetro de consulta "language=de-DE", e também definida por setSpeechRecognitionLanguage("en-US"), a configuração de idioma no URI terá precedência e o idioma efetivo será "de-DE". Somente os parâmetros que não são especificados no URI do ponto de extremidade podem ser definidos por outras APIs. Observação: se o ponto de extremidade exigir uma chave de assinatura para autenticação, use fromEndpoint(java.net.URI, String) para passar a chave de assinatura como parâmetro. Para usar um token de autorização com fromEndpoint, use esse método para criar uma instância speechConfig e, em seguida, chame setAuthorizationToken() na instância speechconfig criada. Observação: adicionado na versão 1.5.0.

Parameters:

endpoint - O ponto de extremidade de serviço ao qual se conectar.

Returns:

Uma instância de configuração de fala.

fromEndpoint

public static SpeechConfig fromEndpoint(URI endpoint, String subscriptionKey)

Cria uma instância da configuração de fala com o ponto de extremidade e a chave de assinatura especificados. Esse método destina-se apenas a usuários que usam um ponto de extremidade ou parâmetros de serviço não padrão. Observação: os parâmetros de consulta especificados no URI do ponto de extremidade não são alterados, mesmo que sejam definidos por outras APIs. Por exemplo, se a linguagem de reconhecimento for definida no URI como o parâmetro de consulta "language=de-DE", e também definida por setSpeechRecognitionLanguage("en-US"), a configuração de idioma no URI terá precedência e o idioma efetivo será "de-DE". Somente os parâmetros que não são especificados no URI do ponto de extremidade podem ser definidos por outras APIs. Observação: para usar um token de autorização com fromEndpoint, use fromEndpoint(java.net.URI) e chame setAuthorizationToken() na instância speechconfig criada.

Parameters:

endpoint - O ponto de extremidade de serviço ao qual se conectar.
subscriptionKey - A chave de assinatura.

Returns:

Uma instância de configuração de fala.

fromHost

public static SpeechConfig fromHost(URI host)

Cria uma instância da configuração de fala com o host especificado. Esse método destina-se apenas a usuários que usam um host de serviço não padrão. O caminho do recurso padrão será assumido. Para serviços com um caminho de recurso não padrão ou nenhum caminho, use fromEndpoint. Observação: os parâmetros de consulta não são permitidos no URI do host e devem ser definidos por outras APIs. Observação: se o host exigir uma chave de assinatura para autenticação, use fromHost(java.net.URI, String) para passar a chave de assinatura como parâmetro. Para usar um token de autorização com fromHost, use esse método para criar uma instância speechConfig e, em seguida, chame setAuthorizationToken() na instância speechconfig criada. Observação: adicionado na versão 1.8.0.

Parameters:

host - O host de serviço ao qual se conectar. O formato é "protocol://host:port" em que ":p ort" é opcional.

Returns:

Uma instância de configuração de fala.

fromHost

public static SpeechConfig fromHost(URI host, String subscriptionKey)

Cria uma instância da configuração de fala com a chave de assinatura e host especificada. Esse método destina-se apenas a usuários que usam um host de serviço não padrão. O caminho do recurso padrão será assumido. Para serviços com um caminho de recurso não padrão ou nenhum caminho, use fromEndpoint. Observação: os parâmetros de consulta não são permitidos no URI do host e devem ser definidos por outras APIs. Observação: para usar um token de autorização com fromHost, use fromHost(java.net.URI) e chame setAuthorizationToken() na instância speechconfig criada. Observação: adicionado na versão 1.8.0.

Parameters:

host - O host de serviço ao qual se conectar. O formato é "protocol://host:port" em que ":p ort" é opcional.
subscriptionKey - A chave de assinatura.

Returns:

Uma instância de configuração de fala.

fromSubscription

public static SpeechConfig fromSubscription(String subscriptionKey, String region)

Cria uma instância de uma configuração de fala com a chave de assinatura e a região de serviço especificadas.

Parameters:

subscriptionKey - A chave de assinatura.
region - O nome da região (consulte a página região).

Returns:

Uma instância de configuração de fala.

getAuthorizationToken

public String getAuthorizationToken()

Obtém o token de autorização.

Returns:

O token de autorização.

getEndpointId

public String getEndpointId()

Obtém a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala ou um modelo de voz personalizado para síntese de fala.

Returns:

A ID do ponto de extremidade.

getImpl

public SafeHandle getImpl()

Obtenha o identificador nativo para o objeto de configuração de fala.

Returns:

O identificador nativo.

getOutputFormat

public OutputFormat getOutputFormat()

Obtém o formato de saída de reconhecimento de fala (simples ou detalhado). Observação: esse formato de saída é para resultados de reconhecimento de fala, use com.microsoft.cognitiveservices.speech.SpeechConfig#setSpeechSynthesisOutputFormat para definir o formato de saída de áudio sintetizado.

Returns:

Retorna o formato de saída de reconhecimento de fala.

getProperty

public String getProperty(PropertyId id)

Obtém a propriedade por propertyId. Adicionado na versão 1.3.0.

Parameters:

id - PropertyId da propriedade .

Returns:

O valor.

getProperty

public String getProperty(String name)

Obtém uma propriedade nomeada como valor.

Parameters:

name - o nome da propriedade .

Returns:

O valor.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Obtém o idioma de reconhecimento de fala

Returns:

Retorna o idioma de reconhecimento.

getSpeechSynthesisLanguage

public String getSpeechSynthesisLanguage()

Obtém a linguagem de síntese de fala. Adicionado na versão 1.7.0

Returns:

Retorna a linguagem de síntese.

getSpeechSynthesisOutputFormat

public String getSpeechSynthesisOutputFormat()

Obtém o formato de saída de síntese de fala. Adicionado na versão 1.7.0

Returns:

Retorna o formato de saída de síntese.

getSpeechSynthesisVoiceName

public String getSpeechSynthesisVoiceName()

Obtém o nome da voz de síntese de fala. Adicionado na versão 1.7.0

Returns:

Retorna o nome da voz de síntese.

requestWordLevelTimestamps

public void requestWordLevelTimestamps()

Inclui carimbos de data/hora no nível da palavra. Adicionado na versão 1.5.0.

setAuthorizationToken

public void setAuthorizationToken(String value)

Define o token de autorização. Observação: o chamador precisa garantir que o token de autorização seja válido. Antes que o token de autorização expire, o chamador precisa atualizá-lo chamando esse setter com um novo token válido. Como os valores de configuração são copiados ao criar um novo reconhecedor, o novo valor de token não se aplicará aos reconhecedores que já foram criados. Para reconhecedores que foram criados antes, você precisa definir o token de autorização do reconhecedor correspondente para atualizar o token. Caso contrário, os reconhecedores encontrarão erros durante o reconhecimento.

Parameters:

value - o token de autorização.

setEndpointId

public void setEndpointId(String value)

Define a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala ou um modelo de voz personalizado para síntese de fala.

Parameters:

value - a ID do ponto de extremidade.

setOutputFormat

public void setOutputFormat(OutputFormat format)

Define o formato de saída de reconhecimento de fala (simples ou detalhado). Observação: esse formato de saída é para resultados de reconhecimento de fala, use com.microsoft.cognitiveservices.speech.SpeechConfig#setSpeechSynthesisOutputFormat para definir o formato de saída de áudio sintetizado.

Parameters:

format - O formato de saída de reconhecimento de fala.

setProfanity

public void setProfanity(ProfanityOption profanity)

Define a opção de palavrões. Adicionado na versão 1.5.0.

Parameters:

profanity - a opção de propriedade a ser definida.

setProperty

public void setProperty(PropertyId id, String value)

Define a propriedade por propertyId. Adicionado na versão 1.3.0.

Parameters:

id - PropertyId da propriedade .
value - O valor.

setProperty

public void setProperty(String name, String value)

Define uma propriedade nomeada como valor.

Parameters:

name - o nome da propriedade .
value - o valor .

setProxy

public void setProxy(String proxyHostName, int proxyPort, String proxyUserName, String proxyPassword)

Define a configuração de proxy Adicionada na versão 1.1.0. Observação: a funcionalidade de proxy não está disponível no macOS. Essa função não terá efeito nesta plataforma.

Parameters:

proxyHostName - o nome do host do servidor proxy, sem o esquema de protocolo (http://)
proxyPort - o número da porta do servidor proxy.
proxyUserName - o nome de usuário do servidor proxy. Use a cadeia de caracteres vazia se nenhum nome de usuário for necessário.
proxyPassword - a senha do servidor proxy. Use a cadeia de caracteres vazia se nenhuma senha de usuário for necessária.

setServiceProperty

public void setServiceProperty(String name, String value, ServicePropertyChannel channel)

Define um valor de propriedade que será passado para o serviço usando o canal especificado. Adicionado na versão 1.5.0.

Parameters:

name - o nome da propriedade.
value - o valor da propriedade.
channel - o canal usado para passar a propriedade especificada para o serviço.

setSpeechRecognitionLanguage

public void setSpeechRecognitionLanguage(String value)

Define a linguagem de reconhecimento de fala

Parameters:

value - o identificador de idioma no formato BCP-47.

setSpeechSynthesisLanguage

public void setSpeechSynthesisLanguage(String value)

Define a linguagem de síntese de fala. Adicionado na versão 1.7.0

Parameters:

value - o identificador de idioma no formato BCP-47 (por exemplo, en-US).

setSpeechSynthesisOutputFormat

public void setSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat value)

Define o formato de saída de síntese de fala. Adicionado na versão 1.7.0

Parameters:

value - A ID do formato de saída de síntese (por exemplo, Riff16Khz16BitMonoPcm).

setSpeechSynthesisVoiceName

public void setSpeechSynthesisVoiceName(String value)

Define o nome da voz da síntese de fala. Adicionado na versão 1.7.0

Parameters:

value - O nome da voz da síntese de fala.

Aplica-se a