SpeechRecognizer Classe

Definição

Transcreve a fala em texto. A fala pode chegar por meio de microfone, arquivo de áudio ou outro fluxo de entrada de áudio.

public sealed class SpeechRecognizer : Microsoft.CognitiveServices.Speech.Recognizer
type SpeechRecognizer = class
    inherit Recognizer
Public NotInheritable Class SpeechRecognizer
Inherits Recognizer
Herança
SpeechRecognizer

Exemplos

Este exemplo usa o reconhecedor de fala de um microfone e escuta eventos gerados pelo reconhecedor.

public async Task SpeechContinuousRecognitionAsync()
{
    // Creates an instance of a speech config with specified subscription key and region.
    // Replace with your own subscription key and service region (e.g., "westus").
    var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");

    // Creates a speech recognizer from microphone.
    using (var recognizer = new SpeechRecognizer(config))
    {
        // Subscribes to events.
        recognizer.Recognizing += (s, e) => {
            Console.WriteLine($"RECOGNIZING: Text={e.Result.Text}");
        };

        recognizer.Recognized += (s, e) => {
            var result = e.Result;
            Console.WriteLine($"Reason: {result.Reason.ToString()}");
            if (result.Reason == ResultReason.RecognizedSpeech)
            {
                    Console.WriteLine($"Final result: Text: {result.Text}.");
            }
        };

        recognizer.Canceled += (s, e) => {
            Console.WriteLine($"\n    Canceled. Reason: {e.Reason.ToString()}, CanceledReason: {e.Reason}");
        };

        recognizer.SessionStarted += (s, e) => {
            Console.WriteLine("\n    Session started event.");
        };

        recognizer.SessionStopped += (s, e) => {
            Console.WriteLine("\n    Session stopped event.");
        };

        // Starts continuous recognition. 
        // Uses StopContinuousRecognitionAsync() to stop recognition.
        await recognizer.StartContinuousRecognitionAsync().ConfigureAwait(false);

        do
        {
            Console.WriteLine("Press Enter to stop");
        } while (Console.ReadKey().Key != ConsoleKey.Enter);

        // Stops recognition.
        await recognizer.StopContinuousRecognitionAsync().ConfigureAwait(false);
    }
}

Comentários

Confira também: Introdução à conversão de fala em texto

Construtores

SpeechRecognizer(EmbeddedSpeechConfig)

Cria uma nova instância de SpeechRecognizer usando EmbeddedSpeechConfig, configurada para receber fala do microfone padrão. Adicionado em 1.19.0

SpeechRecognizer(EmbeddedSpeechConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer usando EmbeddedSpeechConfig, configurada para receber fala de uma fonte de áudio especificada em um objeto AudioConfig. Adicionado em 1.19.0

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig)

Cria uma nova instância de SpeechRecognizer, usando EmbeddedSpeechConfig, que determina o idioma de origem de uma lista de opções. Adicionado em 1.20.0

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer, usando EmbeddedSpeechConfig, que determina o idioma de origem de uma lista de opções. Adicionado em 1.20.0

SpeechRecognizer(HybridSpeechConfig)

Cria uma nova instância de SpeechRecognizer usando HybridSpeechConfig, configurada para receber fala do microfone padrão.

SpeechRecognizer(HybridSpeechConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer usando HybridSpeechConfig, configurada para receber fala de uma fonte de áudio especificada em um objeto AudioConfig.

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig)

Cria uma nova instância de SpeechRecognizer, usando HybridSpeechConfig, que determina o idioma de origem de uma lista de opções.

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer, usando HybridSpeechConfig, que determina o idioma de origem de uma lista de opções.

SpeechRecognizer(SpeechConfig)

Cria uma nova instância de SpeechRecognizer configurada para receber fala do microfone padrão.

SpeechRecognizer(SpeechConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer configurada para receber fala de uma fonte de áudio especificada em um objeto AudioConfig.

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig)

Cria uma nova instância de SpeechRecognizer que determina o idioma de origem de uma lista de opções. Adicionado em 1.9.0

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer. Adicionado em 1.9.0

SpeechRecognizer(SpeechConfig, SourceLanguageConfig)

Cria uma nova instância de SpeechRecognizer. Adicionado em 1.9.0

SpeechRecognizer(SpeechConfig, SourceLanguageConfig, AudioConfig)

Cria uma nova instância de SpeechRecognizer. Adicionado em 1.9.0

SpeechRecognizer(SpeechConfig, String)

Cria uma nova instância de SpeechRecognizer configurada para receber fala em um idioma específico. Adicionado em 1.9.0

SpeechRecognizer(SpeechConfig, String, AudioConfig)

Cria uma nova instância de SpeechRecognizer configurada para receber fala em um idioma específico de uma fonte de áudio especificada em um objeto AudioConfig. Adicionado em 1.9.0

Campos

disposed

disposed é um sinalizador usado para indicar se o objeto é descartado.

(Herdado de Recognizer)
gch

Identificador de GC para retornos de chamada para contexto.

(Herdado de Recognizer)
isDisposing

Indica se o objeto está sendo descartado no momento.

(Herdado de Recognizer)
pointerHandle

Interno para registro em log.

(Herdado de Recognizer)
recognizerLock

recognizerLock é usado para sincronizar o acesso a variáveis de membro de objetos de vários threads

(Herdado de Recognizer)

Propriedades

AuthorizationToken

Obtém ou define o token de autorização usado para se comunicar com o serviço.

Observação: seu código precisa garantir que o token de autorização seja válido. Antes que o token de autorização expire, seu código precisa atualizá-lo chamando esse setter com um novo token válido. Caso contrário, o reconhecedor produzirá erros durante o reconhecimento.

EndpointId

Obtém a ID do ponto de extremidade de um modelo de fala personalizado a ser usado para reconhecimento de fala.

OutputFormat

Obtém a configuração de formato de saída.

Properties

A coleção de propriedades e seus valores definidos para este SpeechRecognizer. Observação: a coleção de propriedades só é válida até que o reconhecedor que possui essas Propriedades seja descartado ou finalizado.

SpeechRecognitionLanguage

Obtém o nome do idioma que foi definido quando o reconhecedor foi criado.

Métodos

Dispose()

Descarte os recursos associados.

(Herdado de Recognizer)
Dispose(Boolean)

Esse método executa a limpeza de recursos. O parâmetro booliano disposing indica se o método é chamado de Dispose() (se disposing for true) ou do finalizador (se disposing for false). As classes derivadas devem substituir esse método para descartar o recurso, se necessário.

(Herdado de Recognizer)
Finalize()

Transcreve a fala em texto. A fala pode chegar por meio de microfone, arquivo de áudio ou outro fluxo de entrada de áudio.

RecognizeOnceAsync()

Inicia o reconhecimento de fala como uma operação assíncrona.

StartContinuousRecognitionAsync()

Inicia o reconhecimento de fala em um fluxo de áudio contínuo como uma operação assíncrona até stopContinuousRecognitionAsync() ser chamado. Você deve assinar eventos para receber resultados de reconhecimento.

StartKeywordRecognitionAsync(KeywordRecognitionModel)

Configura o reconhecedor com o modelo de palavra-chave fornecido. Depois de chamar esse método, o reconhecedor está escutando o palavra-chave para iniciar o reconhecimento. Chame StopKeywordRecognitionAsync() para encerrar o reconhecimento iniciado palavra-chave. Você deve assinar eventos para receber resultados de reconhecimento.

StopContinuousRecognitionAsync()

Interrompe uma operação de reconhecimento em execução assim que possível e solicita imediatamente um resultado com base na entrada que foi processada até agora. Isso funciona para todas as operações de reconhecimento, não apenas as contínuas, e facilita o uso de botões push-to-talk ou "concluir agora" para pontos de extremidade de áudio manuais.

StopKeywordRecognitionAsync()

Encerra o reconhecimento iniciado palavra-chave.

Eventos

Canceled

O evento Canceled sinaliza que o reconhecimento de fala foi cancelado.

Recognized

O evento Recognized sinaliza que um resultado de reconhecimento final é recebido.

Recognizing

O evento Recognizing sinaliza que um resultado de reconhecimento intermediário é recebido.

SessionStarted

Define o manipulador de eventos para o evento iniciado pela sessão.

(Herdado de Recognizer)
SessionStopped

Define o manipulador de eventos para o evento de sessão interrompida.

(Herdado de Recognizer)
SpeechEndDetected

Define o manipulador de eventos para o evento detectado de fim de fala.

(Herdado de Recognizer)
SpeechStartDetected

Define o manipulador de eventos para o evento detectado de início de fala.

(Herdado de Recognizer)

Aplica-se a