SpeechConfig Clase
Clase que define las configuraciones para el reconocimiento de voz/intención y la síntesis de voz.
La configuración se puede inicializar de diferentes maneras:
from subscription: pase una clave de suscripción y una región.
desde el punto de conexión: pase un punto de conexión. La clave de suscripción o el token de autorización son opcionales.
from host: pase una dirección de host. La clave de suscripción o el token de autorización son opcionales.
del token de autorización: pase un token de autorización y una región.
- Herencia
-
builtins.objectSpeechConfig
Constructor
SpeechConfig(subscription: str | None = None, region: str | None = None, endpoint: str | None = None, host: str | None = None, auth_token: str | None = None, speech_recognition_language: str | None = None)
Parámetros
Nombre | Description |
---|---|
subscription
|
Clave de suscripción. valor predeterminado: None
|
region
|
Nombre de la región (consulte la página región). valor predeterminado: None
|
endpoint
|
Punto de conexión de servicio al que se va a conectar. valor predeterminado: None
|
host
|
Host de servicio al que se va a conectar. Se asume la ruta de acceso del recurso estándar. El formato es "protocol://host:port", donde ":p ort" es opcional. valor predeterminado: None
|
auth_token
|
Token de autorización. valor predeterminado: None
|
speech_recognition_language
|
Idioma de entrada para el reconocimiento de voz. El idioma se especifica en formato BCP-47. valor predeterminado: None
|
Métodos
enable_audio_logging |
Habilita el registro de audio en el servicio. Los registros de audio y contenido se almacenan en el almacenamiento propiedad de Microsoft o en su propia cuenta de almacenamiento vinculada a su suscripción de Cognitive Services (Bring Your Own Storage (BYOS) habilitado para el recurso de voz. Nota Se agregó en la versión 1.5.0. |
enable_dictation |
Habilita el dictado. Solo se admite en el reconocimiento continuo de voz. Nota Se agregó en la versión 1.5.0. |
get_property |
Obtenga una propiedad por identificador. |
get_property_by_name |
Obtiene una propiedad por nombre. |
request_word_level_timestamps |
Incluye marcas de tiempo de nivel de palabra en el resultado de la respuesta. Nota Se agregó en la versión 1.5.0. |
set_profanity |
Establezca la opción soece. Nota Se agregó en la versión 1.5.0. |
set_properties |
Establezca varias propiedades por identificador. |
set_properties_by_name |
Establezca varias propiedades por nombre. |
set_property |
Establezca una propiedad por identificador. |
set_property_by_name |
Establezca una propiedad por nombre. |
set_proxy |
Establecer información de proxy. Nota La funcionalidad de proxy no está disponible en macOS. Esta función no tendrá ningún efecto en esta plataforma. |
set_service_property |
Establece un valor de propiedad que se pasará al servicio mediante el canal especificado. Nota Se agregó en la versión 1.5.0. |
set_speech_synthesis_output_format |
Establezca el formato de audio de salida de síntesis de voz. |
enable_audio_logging
Habilita el registro de audio en el servicio. Los registros de audio y contenido se almacenan en el almacenamiento propiedad de Microsoft o en su propia cuenta de almacenamiento vinculada a su suscripción de Cognitive Services (Bring Your Own Storage (BYOS) habilitado para el recurso de voz.
Nota
Se agregó en la versión 1.5.0.
enable_audio_logging()
enable_dictation
Habilita el dictado. Solo se admite en el reconocimiento continuo de voz.
Nota
Se agregó en la versión 1.5.0.
enable_dictation()
get_property
Obtenga una propiedad por identificador.
get_property(property_id: PropertyId) -> str
Parámetros
Nombre | Description |
---|---|
property_id
Requerido
|
Identificador de la propiedad que se va a recuperar. |
Devoluciones
Tipo | Description |
---|---|
Valor de la propiedad. |
get_property_by_name
Obtiene una propiedad por nombre.
get_property_by_name(property_name: str) -> str
Parámetros
Nombre | Description |
---|---|
property_name
Requerido
|
Nombre de la propiedad que se va a recuperar. |
Devoluciones
Tipo | Description |
---|---|
Valor de la propiedad. |
request_word_level_timestamps
Incluye marcas de tiempo de nivel de palabra en el resultado de la respuesta.
Nota
Se agregó en la versión 1.5.0.
request_word_level_timestamps()
set_profanity
Establezca la opción soece.
Nota
Se agregó en la versión 1.5.0.
set_profanity(profanity_option: ProfanityOption) -> None
Parámetros
Nombre | Description |
---|---|
profanity_option
Requerido
|
Nivel de palabras soeces que se va a establecer. |
set_properties
Establezca varias propiedades por identificador.
set_properties(properties: Dict[PropertyId, str])
Parámetros
Nombre | Description |
---|---|
properties
Requerido
|
Identificadores de propiedad de asignación de dict a los valores que se van a establecer. |
set_properties_by_name
Establezca varias propiedades por nombre.
set_properties_by_name(properties: Dict[str, str])
Parámetros
Nombre | Description |
---|---|
properties
Requerido
|
Identificadores de propiedad de asignación de dict a los valores que se van a establecer. |
set_property
Establezca una propiedad por identificador.
set_property(property_id: PropertyId, value: str)
Parámetros
Nombre | Description |
---|---|
property_id
Requerido
|
Identificador de la propiedad que se va a establecer. |
value
Requerido
|
Valor que se va a establecer para la propiedad . |
set_property_by_name
Establezca una propiedad por nombre.
set_property_by_name(property_name: str, value: str)
Parámetros
Nombre | Description |
---|---|
property_name
Requerido
|
Nombre de la propiedad que se va a establecer. |
value
Requerido
|
Valor que se va a establecer para la propiedad . |
set_proxy
Establecer información de proxy.
Nota
La funcionalidad de proxy no está disponible en macOS. Esta función no tendrá ningún efecto en
esta plataforma.
set_proxy(hostname: str, port: int, username: str = None, password: str = None)
Parámetros
Nombre | Description |
---|---|
hostname
Requerido
|
Nombre de host del servidor proxy. No agregue información de protocolo (http) al nombre de host. |
port
Requerido
|
Número de puerto del servidor proxy. |
username
|
Nombre de usuario del servidor proxy. valor predeterminado: None
|
password
|
Contraseña del servidor proxy. valor predeterminado: None
|
set_service_property
Establece un valor de propiedad que se pasará al servicio mediante el canal especificado.
Nota
Se agregó en la versión 1.5.0.
set_service_property(name: str, value: str, channel: ServicePropertyChannel)
Parámetros
Nombre | Description |
---|---|
name
Requerido
|
Nombre de la propiedad. |
value
Requerido
|
Valor de propiedad. |
channel
Requerido
|
Canal usado para pasar la propiedad especificada al servicio. |
set_speech_synthesis_output_format
Establezca el formato de audio de salida de síntesis de voz.
set_speech_synthesis_output_format(format_id: SpeechSynthesisOutputFormat)
Parámetros
Nombre | Description |
---|---|
format_id
Requerido
|
Identificador de formato de audio, por ejemplo, Riff16Khz16BitMonoPcm. |
Atributos
authorization_token
Token de autorización que se usará para conectarse al servicio.
Nota
El autor de la llamada debe asegurarse de que el token de autorización es válido. Antes de
el token de autorización expira, el autor de la llamada debe actualizarlo llamando a este establecedor con un
nuevo token válido. A medida que se copian los valores de configuración al crear un nuevo reconocedor,
El nuevo valor de token no se aplicará a los reconocedores que ya se han creado. Para
reconocedores que se han creado antes, debe establecer el token de autorización de .
reconocedor correspondiente para actualizar el token. De lo contrario, los reconocedores se encontrarán
errores durante el reconocimiento.
endpoint_id
Identificador del punto de conexión.
output_format
Formato de salida (simple o detallado) del resultado del reconocimiento de voz.
region
Clave de región que se usó para crear el reconocedor.
speech_recognition_language
Nombre del idioma hablado que se va a reconocer en formato BCP-47.
speech_synthesis_language
Obtenga el lenguaje de síntesis de voz.
speech_synthesis_output_format_string
Obtiene la cadena de formato de audio de salida de síntesis de voz.
speech_synthesis_voice_name
Obtiene el nombre de voz de síntesis de voz.
subscription_key
Clave de suscripción que se usó para crear recognizer.
Azure SDK for Python
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de