com.microsoft.cognitiveservices.speech

Clases

AudioDataStream

Representa la secuencia de datos de audio utilizada para operar los datos de audio como una secuencia.

AutoDetectSourceLanguageConfig

Representa la configuración de idioma de origen de detección automática que se usa para especificar los posibles candidatos de idioma de origen Nota: se debe llamar a close() para liberar los recursos subyacentes mantenidos por el objeto.

AutoDetectSourceLanguageResult

Representa el resultado de detectar automáticamente los idiomas de origen agregados en la versión 1.8.0.

CancellationDetails

Contiene información detallada sobre por qué se canceló un resultado.

ClassLanguageModel

Representa un modelo de lenguajede clase.

Connection

Connection es una clase de proxy para administrar la conexión al servicio de voz del reconocedor especificado.

ConnectionEventArgs

Define la carga de los eventos de conexión, como Connected/Disconnected.

ConnectionMessage

Mensaje de conexiónrepresenta los mensajes específicos de implementación enviados y recibidos del servicio de voz.

ConnectionMessageEventArgs

Define la carga de los eventos de mensajesrecibidos de conexión.

Diagnostics

Registro nativo y otros diagnósticos

EmbeddedSpeechConfig

Clase que define la configuración de voz insertada (sin conexión).

Grammar

Representa una gramática genérica que se usa para ayudar a mejorar la precisión del recogniton de voz.

GrammarList

Permite agregar varias gramáticas a speechRecognizer para mejorar la precisión del reconocimiento de voz.

HybridSpeechConfig

Clase que define configuraciones híbridas (en la nube e insertadas) para el reconocimiento de voz y la síntesis de voz.

KeywordRecognitionEventArgs

Define el contenido de una palabra clave que reconoce o reconoce eventos.

KeywordRecognitionModel

Representa un modelo de reconocimiento de palabras clave para reconocer cuándo el usuario dice una palabra clave para iniciar el reconocimiento de voz adicional.

KeywordRecognitionResult

Define el resultado del reconocimiento de palabras clave.

KeywordRecognizer

Realiza el reconocimiento de palabras clave en la entrada de voz.

NoMatchDetails

Contiene información detallada sobre los resultados del reconocimiento sincoincidencias.

PhraseListGrammar

Permite adiciones de frases nuevas para mejorar el reconocimiento de voz.

PronunciationAssessmentConfig

Representa la configuración de evaluación de pronunciación.

PronunciationAssessmentResult

Representa el resultado de la evaluación de pronunciación.

PropertyCollection

Representa la colección de propiedades y sus valores.

RecognitionEventArgs

Define la carga de eventos de reconocimiento, como inicio y finalización de voz detectados.

RecognitionResult

Contiene información detallada sobre el resultado de una operación de reconocimiento.

Recognizer

Define la clase base Recognizer que contiene principalmente controladores de eventos comunes.

SessionEventArgs

Define la carga delos eventos Session Started/Stopped.

SourceLanguageConfig

Representa la configuración del idioma de origen que se usa para especificar el idioma de origen de reconocimiento.

SpeechConfig

Configuración de voz.

SpeechRecognitionCanceledEventArgs

Define la carga de eventos cancelados del reconocimiento de voz.

SpeechRecognitionEventArgs

Define el contenido del evento de reconocimiento o reconocimiento de voz.

SpeechRecognitionModel

Contiene información detallada del modelo de reconocimiento de voz.

SpeechRecognitionResult

Define el resultado del reconocimiento de voz.

SpeechRecognizer

Realiza el reconocimiento de voz desde micrófono, archivo u otras secuencias de entrada de audio y obtiene texto transcrito como resultado.

SpeechSynthesisBookmarkEventArgs

Define el contenido del evento de marcador de síntesis de voz.

SpeechSynthesisCancellationDetails

Contiene información detallada sobre por qué se canceló una síntesis de voz.

SpeechSynthesisEventArgs

Define el contenido del evento relacionado con la síntesis de voz.

SpeechSynthesisResult

Contiene información detallada sobre el resultado de una operación de síntesis de voz.

SpeechSynthesisVisemeEventArgs

Define el contenido del evento de visema de síntesis de voz.

SpeechSynthesisWordBoundaryEventArgs

Define el contenido del evento de límite de palabras de síntesis de voz.

SpeechSynthesizer

Realiza la síntesis de voz en altavoz, archivo u otras secuencias de salida de audio y obtiene audio sintetizado como resultado.

SpeechTranslationModel

Contiene información detallada del modelo de traducción de voz.

SynthesisVoicesResult

Contiene información detallada sobre la lista de voces de síntesis recuperadas.

VoiceInfo

Contiene información detallada sobre la información de voz de síntesis.

Enumeraciones

CancellationErrorCode

Define el código de error en caso de que motivo de cancelaciónsea Error.

CancellationReason

Define las posibles razones por las que se puede cancelar un resultado de reconocimiento.

NoMatchReason

Define las posibles razones por las que podría no reconocerse un resultado de reconocimiento.

OutputFormat

Defina los formatos de salida de Speech Recognizer.

ProfanityOption

Defina la opción soece para el resultado de la respuesta.

PronunciationAssessmentGradingSystem

Define el sistema de puntos para la calibración de la puntuación de pronunciación; el valor predeterminado es FivePoint.

PronunciationAssessmentGranularity

Define la granularidad de evaluación de pronunciación; el valor predeterminado es Phoneme.

PropertyId

Define los identificadores de propiedad.

ResultReason

Define las posibles razones por las que se puede generar un resultado de reconocimiento.

ServicePropertyChannel

Define los canales usados para enviar propiedades de servicio.

SpeechSynthesisBoundaryType

Define el tipo de límite del evento de límite de síntesis de voz.

SpeechSynthesisOutputFormat

Define el posible formato de audio de salida de síntesis de voz.

StreamStatus

Define el estado posible de la secuencia de datos de audio.

SynthesisVoiceGender

Defina el género de voz de síntesis.

SynthesisVoiceType

Defina el tipo de voz de síntesis.