Notas de la versiónRelease notes

SDK de Voz 1.6.0: versión de junio de 2019Speech SDK 1.6.0: 2019-June release

MuestrasSamples

  • Ejemplos de inicio rápido para Texto a voz en UWP y UnityQuickstart samples for Text To Speech on UWP and Unity
  • Ejemplo de inicio rápido para Swift en iOSQuickstart sample for Swift on iOS
  • Ejemplos de Unity para Traducción y Reconocimiento de la intención comunicativa y VozUnity samples for Speech & Intent Recognition and Translation
  • Ejemplos de inicio rápido actualizados para DialogServiceConnectorUpdated quickstart samples for DialogServiceConnector

Mejoras y cambiosImprovements / Changes

  • Espacio de nombres de cuadro de diálogo:Dialog namespace:
    • El nombre de SpeechBotConnector se cambió a DialogServiceConnectorSpeechBotConnector has been renamed to DialogServiceConnector
    • El nombre de BotConfig se cambió a DialogServiceConfigBotConfig has been renamed to DialogServiceConfig
    • BotConfig::FromChannelSecret() se reasignó a DialogServiceConfig::FromBotSecret()BotConfig::FromChannelSecret() has been remapped to DialogServiceConfig::FromBotSecret()
    • Todos los clientes de Voz de Direct Line existentes siguen siendo compatibles después del cambio de nombreAll existing Direct Line Speech clients continue to be supported after the rename
  • Actualización del adaptador REST de TTS para admitir una conexión persistente de proxyUpdate TTS REST adapter to support proxy, persistent connection
  • Un mejor mensaje de error cuando se pasa una región no válidaImprove error message when an invalid region is passed
  • Swift/Objective-C:Swift/Objective-C:
    • Mejores informes de errores: los métodos que pueden generar un error ahora se encuentran en dos versiones: una que expone un objeto NSError para el control de errores y una que genera una excepción.Improved error reporting: Methods that can result in an error are now present in two versions: One that exposes an NSError object for error handling, and one that raises an exception. La primera se expone a Swift.The former are exposed to Swift. Este cambio requiere adaptaciones en el código Swift existente.This change requires adaptations to existing Swift code.
    • Mejor control de eventosImproved event handling

Correcciones de erroresBug fixes

  • Corrección de TTS: donde el futuro de SpeakTextAsync se devolvió sin esperar hasta que haya terminado la representación del audioFix for TTS: where SpeakTextAsync future returned without waiting until audio has completed rendering
  • Corrección para la serialización de las cadenas en C# para permitir la compatibilidad total con idiomasFix for marshaling strings in C# to enable full language support
  • Corrección del problema de las aplicaciones centrales de .NET para cargar la biblioteca principal con un marco de destino net461 en ejemplosFix for .NET core app problem to load core library with net461 target framework in samples
  • Corrección de problemas ocasionales para implementar bibliotecas nativas en la carpeta de salida en los ejemplosFix for occasional issues to deploy native libraries to the output folder in samples
  • Corrección para cerrar el socket web de manera confiableFix for web socket closing reliably
  • Corrección de un posible bloqueo al abrir una conexión con una carga muy elevada en LinuxFix for possible crash while opening a connection under very heavy load on Linux
  • Corrección de metadatos faltantes en el paquete de marcos para macOSFix for missing metadata in the framework bundle for macOS
  • Corrección de problemas con pip install --user en WindowsFix for problems with pip install --user on Windows

Speech SDK 1.5.1Speech SDK 1.5.1

Se trata de una versión de corrección de errores y solo afecta al SDK nativo o administrado.This is a bug fix release and only affecting the native/managed SDK. No afecta a la versión de JavaScript del SDK.It is not affecting the JavaScript version of the SDK.

Correcciones de erroresBug fixes

  • Corrección de FromSubscription cuando se usa con la transcripción de la conversación.Fix FromSubscription when used with Conversation Transcription.
  • Corrección de errores en la detección de palabras clave para el asistente virtual por voz.Fix bug in keyword spotting for voice-first virtual assistant.

Speech SDK 1.5.0 Versión de mayo de 2019Speech SDK 1.5.0: 2019-May release

Nuevas características:New features

  • la funcionalidad de palabra de reactivación (detección de palabras clave/KWS) ahora está disponible para Windows y Linux.Wake word (Keyword spotting/KWS) functionality is now available for Windows and Linux. La funcionalidad KWS podría funcionar con cualquier tipo de micrófono; no obstante, la compatibilidad oficial de KWS está limitada actualmente a las matrices de micrófonos que se encuentran en el hardware de Azure Kinect DK o el SDK de dispositivos de voz.KWS functionality might work with any microphone type, official KWS support, however, is currently limited to the microphone arrays found in the Azure Kinect DK hardware or the Speech Devices SDK.
  • La funcionalidad de sugerencia de frases está disponible a través del SDK.Phrase hint functionality is available through the SDK. Para más información, consulte esta página.For more information, see here.
  • La funcionalidad de transcripción de conversaciones está disponible a través del SDK.Conversation transcription functionality is available through the SDK. Consulte aquí.See here.
  • Compatibilidad agregada con los asistentes virtuales por voz mediante el canal Direct Line Speech.Add support for voice-first virtual assistants using the Direct Line Speech channel.

MuestrasSamples

  • Se han agregado ejemplos para nuevas características o nuevos servicios admitidos por el SDK.Added samples for new features or new services supported by the SDK.

Mejoras y cambiosImprovements / Changes

  • Se han agregado varias propiedades de reconocimiento para ajustar el comportamiento del servicio o los resultados del servicio (por ejemplo, enmascaramiento de palabras soeces etc.).Added various recognizer properties to adjust service behavior or service results (like masking profanity and others).
  • Ahora puede configurar el reconocimiento a través de las propiedades de configuración estándar, incluso si ha creado el valor de FromEndpoint del reconocedor.You can now configure the recognizer through the standard configuration properties, even if you created the recognizer FromEndpoint.
  • Objective-C: la propiedad OutputFormat se agregó a SPXSpeechConfiguration.Objective-C: OutputFormat property was added to SPXSpeechConfiguration.
  • El SDK ahora admite Debian 9 como una distribución de Linux.The SDK now supports Debian 9 as a Linux distribution.

Correcciones de erroresBug fixes

  • Se ha corregido un problema donde el recurso de altavoz se destruía demasiado pronto en la conversión de texto a voz.Fixed a problem where the speaker resource was destructed too early in text-to-speech.

Speech SDK 1.4.2Speech SDK 1.4.2

Se trata de una versión de corrección de errores y solo afecta al SDK nativo o administrado.This is a bug fix release and only affecting the native/managed SDK. No afecta a la versión de JavaScript del SDK.It is not affecting the JavaScript version of the SDK.

Speech SDK 1.4.1Speech SDK 1.4.1

Esta es una versión solo para JavaScript.This is a JavaScript-only release. No se agregó ninguna característica.No features have been added. Se realizaron las siguientes correcciones:The following fixes were made:

  • Se impide que el paquete web cargue https-proxy-agent.Prevent web pack from loading https-proxy-agent.

Speech SDK 1.4.0 Versión de abril de 2019Speech SDK 1.4.0: 2019-April release

Nuevas características:New features

  • El SDK admite ahora el servicio de conversión de texto a voz en versión beta.The SDK now supports the text-to-speech service as a beta version. Se admite en Windows y Linux Desktop desde C++ y C#.It is supported on Windows and Linux Desktop from C++ and C#. Para más información, consulte la información general sobre la conversión de texto a voz.For more information, check the text-to-speech overview.
  • El SDK ahora admite archivos de audio MP3 y Opus/OGG como archivos de entrada de secuencia.The SDK now supports MP3 and Opus/OGG audio files as stream input files. Esta característica solo está disponible en Linux desde C++ y C# y está actualmente en versión beta (más detalles aquí).This feature is available only on Linux from C++ and C# and is currently in beta (more details here).
  • Speech SDK para Java, .NET Core, C++ y Objective-C ha conseguido compatibilidad con macOS.The Speech SDK for Java, .NET core, C++ and Objective-C have gained macOS support. La compatibilidad de Objective-C con macOS está actualmente en versión beta.The Objective-C support for macOS is currently in beta.
  • iOS: Speech SDK para iOS (Objective-C) ahora también se publica como una instancia de CocoaPod.iOS: The Speech SDK for iOS (Objective-C) is now also published as a CocoaPod.
  • JavaScript: compatibilidad con micrófono no predeterminada como dispositivo de entrada.JavaScript: Support for non-default microphone as an input device.
  • JavaScript: compatibilidad con servidores proxy para Node.js.JavaScript: Proxy support for Node.js.

MuestrasSamples

  • se han agregado ejemplos para usar Speech SDK con C++ y con Objective-C en macOS.Samples for using the Speech SDK with C++ and with Objective-C on macOS have been added.
  • Se han agregado ejemplos que muestran el uso del servicio de conversión de texto a voz.Samples demonstrating the usage of the text-to-speech service have been added.

Mejoras y cambiosImprovements / Changes

  • Python: ahora se exponen propiedades adicionales de los resultados del reconocimiento mediante la propiedad properties.Python: Additional properties of recognition results are now exposed via the properties property.
  • Para la compatibilidad adicional con el desarrollo y la depuración, puede redirigir la información de registro y diagnóstico del SDK a un archivo de registro (más información aquí).For additional development and debug support, you can redirect SDK logging and diagnostics information into a log file (more details here).
  • JavaScript: mejora del rendimiento del procesamiento de audio.JavaScript: Improve audio processing performance.

Correcciones de erroresBug fixes

  • Mac/iOS: se corrigió un error que daba lugar a una larga espera cuando no se podía establecer una conexión con el servicio de Voz.Mac/iOS: A bug that led to a long wait when a connection to the Speech Service could not be established was fixed.
  • Python: mejora del control de errores en los argumentos de las devoluciones de llamada de Python.Python: improve error handling for arguments in Python callbacks.
  • JavaScript: se corrigieron los informes de estado erróneos de la voz que finalizaban en RequestSession.JavaScript: Fixed wrong state reporting for speech ended on RequestSession.

Speech SDK 1.3.1 Actualización de febrero de 2019Speech SDK 1.3.1: 2019-February refresh

Se trata de una versión de corrección de errores y solo afecta al SDK nativo o administrado.This is a bug fix release and only affecting the native/managed SDK. No afecta a la versión de JavaScript del SDK.It is not affecting the JavaScript version of the SDK.

Corrección de errorBug fix

  • Se ha corregido una fuga de memoria cuando se usa la entrada de micrófono.Fixed a memory leak when using microphone input. No afecta a la entrada de archivos o basada en secuencias.Stream based or file input is not affected.

Speech SDK 1.3.0: versión de febrero de 2019Speech SDK 1.3.0: 2019-February release

Nuevas característicasNew Features

  • Speech SDK admite la selección del micrófono de entrada mediante la clase AudioConfig.The Speech SDK supports selection of the input microphone through the AudioConfig class. Esto permite transmitir datos de audio a los servicios de Voz desde un micrófono no predeterminado.This allows you to stream audio data to the Speech Services from a non-default microphone. Para más información, consulte la documentación en la que se describe cómo seleccionar un dispositivo de entrada de audio.For more information, see the documentation describing audio input device selection. Esta característica aún no está disponible en JavaScript.This feature is not yet available from JavaScript.
  • Speech SDK ahora es compatible con Unity en una versión beta.The Speech SDK now supports Unity in a beta version. Proporcione sus comentarios en la sección de problemas en el repositorio de ejemplos de GitHub.Provide feedback through the issue section in the GitHub sample repository. Esta versión es compatible con Unity en Windows x86 y x64 (aplicaciones de escritorio o de la Plataforma universal de Windows) y Android (ARM32/64, x86).This release supports Unity on Windows x86 and x64 (desktop or Universal Windows Platform applications), and Android (ARM32/64, x86). Puede encontrar más información en nuestra guía de inicio rápido sobre Unity.More information is available in our Unity quickstart.
  • El archivo Microsoft.CognitiveServices.Speech.csharp.bindings.dll (incluido en versiones anteriores) ya no es necesario.The file Microsoft.CognitiveServices.Speech.csharp.bindings.dll (shipped in previous releases) isn't needed anymore. La funcionalidad está ahora integrada en el SDK principal.The functionality is now integrated into the core SDK.

MuestrasSamples

El siguiente contenido nuevo está disponible en nuestro repositorio de ejemplo:The following new content is available in our sample repository:

  • Ejemplos adicionales para AudioConfig.FromMicrophoneInput.Additional samples for AudioConfig.FromMicrophoneInput.
  • Ejemplos adicionales de Python para traducción y reconocimiento de intenciones.Additional Python samples for intent recognition and translation.
  • Ejemplos adicionales para usar el objeto de conexión en iOS.Additional samples for using the Connection object in iOS.
  • Ejemplos adicionales de Java para la traducción con la salida de audio.Additional Java samples for translation with audio output.
  • Nuevo ejemplo de uso de la API de REST de transcripción de lotes.New sample for use of the Batch Transcription REST API.

Mejoras y cambiosImprovements / Changes

  • PythonPython
    • Mensajes de error y verificación de parámetros mejorada en SpeechConfig.Improved parameter verification and error messages in SpeechConfig.
    • Compatibilidad agregada para el objeto de conexión.Add support for the Connection object.
    • Compatibilidad con Python (x86) de 32 bits en Windows.Support for 32-bit Python (x86) on Windows.
    • Speech SDK para Python ya no está disponible como beta.The Speech SDK for Python is out of beta.
  • iOSiOS
    • El SDK ahora se compila en función de la versión 12.1 del SDK de iOS.The SDK is now built against the iOS SDK version 12.1.
    • El SDK ahora es compatible con las versiones 9.2 y posteriores de iOS.The SDK now supports iOS versions 9.2 and later.
    • Documentación de referencia mejorada y corrección de varios nombres de propiedad.Improve reference documentation and fix several property names.
  • JavaScriptJavaScript
    • Compatibilidad agregada para el objeto de conexión.Add support for the Connection object.
    • Archivos de definición de tipos agregados para JavaScript agrupado.Add type definition files for bundled JavaScript
    • Compatibilidad e implementación iniciales para sugerencias de frases.Initial support and implementation for phrase hints.
    • Colección de propiedades devuelta con JSON del servicio para reconocimiento.Return properties collection with service JSON for recognition
  • Los archivos DLL de Windows contienen ahora un recurso de versión.Windows DLLs do now contain a version resource.
  • Si crea un valor de FromEndpoint de reconocedor, puede agregar parámetros directamente a la dirección URL del punto de conexión.If you create a recognizer FromEndpoint you can add parameters directly to the endpoint URL. Con FromEndpoint no puede configurar el reconocedor mediante las propiedades de configuración estándar.Using FromEndpoint you can't configure the recognizer through the standard configuration properties.

Correcciones de erroresBug fixes

  • La contraseña de proxy y el nombre de usuario de proxy vacíos no se administraron correctamente.Empty proxy username and proxy password were not handled correctly. Con esta versión, si establece el nombre de usuario de proxy y la contraseña de proxy en una cadena vacía, no se enviarán al conectarse al proxy.With this release, if you set proxy username and proxy password to an empty string, they will not be submitted when connecting to the proxy.
  • El identificador de sesión creado por el SDK no siempre es realmente aleatorio para algunos lenguajes o  entornos.SessionId's created by the SDK were not always truly random for some languages / environments. Se ha agregado la inicialización del generador aleatorio para corregir este problema.Added random generator initialization to fix this issue.
  • Control mejorado del token de autorización.Improve handling of authorization token. Si desea usar un token de autorización, especifíquelo en SpeechConfig y deje la clave de suscripción vacía.If you want to use an authorization token, specify in the SpeechConfig and leave the subscription key empty. A continuación, cree el reconocedor como de costumbre.Then create the recognizer as usual.
  • En algunos casos, el objeto de conexión no se publicó correctamente.In some cases the Connection object wasn't released correctly. Ahora se ha corregido.This issue has been fixed.
  • Se corrigió el ejemplo de JavaScript para admitir la salida de audio para la síntesis de traducción también en Safari.The JavaScript sample was fixed to support audio output for translation synthesis also on Safari.

Speech SDK 1.2.1Speech SDK 1.2.1

Esta es una versión solo para JavaScript.This is a JavaScript-only release. No se agregó ninguna característica.No features have been added. Se realizaron las siguientes correcciones:The following fixes were made:

  • Activar el final del flujo en turn.end, y no en speech.end.Fire end of stream at turn.end, not at speech.end.
  • Corregir error de la bomba de audio por el que no se programaba el siguiente envío en caso de error del envío actual.Fix bug in audio pump that did not schedule next send if the current send failed.
  • Corregir el reconocimiento continuo con el token de autenticación.Fix continuous recognition with auth token.
  • Corrección de errores de diferentes reconocedores y puntos de conexión.Bug fix for different recognizer / endpoints.
  • Mejoras en la documentación.Documentation improvements.

Speech SDK 1.2.0: Versión de diciembre de 2018Speech SDK 1.2.0: 2018-December release

Nuevas característicasNew Features

  • PythonPython
    • La versión beta de la compatibilidad con Python (3.5 y versiones posteriores) está disponible con esta versión.The Beta version of Python support (3.5 and above) is available with this release. Para más información, consulte aquí](quickstart-python.md).For more information, see here](quickstart-python.md).
  • JavaScriptJavaScript
    • Speech SDK para JavaScript ha sido de código abierto.The Speech SDK for JavaScript has been open-sourced. El código fuente está disponible en GitHub.The source code is available on GitHub.
    • Ya se admite Node.js; puede encontrar más información aquí.We now support Node.js, more info can be found here.
    • Se quitó la restricción de longitud para las sesiones de audio; la reconexión se realizará automáticamente en la portada.The length restriction for audio sessions has been removed, reconnection will happen automatically under the cover.
  • Objeto de conexiónConnection Object
    • Desde el reconocedor, puede acceder a un objeto de conexión.From the Recognizer, you can access a Connection object. Este objeto le permite iniciar la conexión al servicio y suscribirse para conectar y desconectar eventos explícitamente.This object allows you to explicitly initiate the service connection and subscribe to connect and disconnect events. (Esta característica no está disponible aún ni en JavaScript ni en Python).(This feature is not yet available from JavaScript and Python.)
  • Compatibilidad con Ubuntu 18.04.Support for Ubuntu 18.04.
  • AndroidAndroid
    • Compatibilidad con ProGuard habilitada durante la generación del APK.Enabled ProGuard support during APK generation.

MejorasImprovements

  • Mejoras en el uso de subprocesos internos, lo que reduce el número de subprocesos, bloqueos y exclusiones mutuas.Improvements in the internal thread usage, reducing the number of threads, locks, mutexes.
  • Se mejoraron los informes de errores y la información.Improved error reporting / information. En algunos casos, los mensajes de error no se propagan totalmente.In several cases, error messages have not been propagated out all the way out.
  • Se actualizaron las dependencias de desarrollo en JavaScript para usar los módulos actualizados.Updated development dependencies in JavaScript to use up-to-date modules.

Correcciones de erroresBug fixes

  • Fugas de memoria fijas debido a un error de coincidencia de tipos en RecognizeAsync.Fixed memory leaks due to a type mismatch in RecognizeAsync.
  • En algunos casos, se perdieron excepciones.In some cases exceptions were being leaked.
  • Corrección de las fugas de memoria en los argumentos de eventos de traducción.Fixing memory leak in translation event arguments.
  • Se ha corregido un problema de bloqueo al volver a conectar en sesiones de larga ejecución.Fixed a locking issue on reconnect in long running sessions.
  • Se ha corregido un problema que podría dar lugar a que faltase el resultado final para las traducciones con errores.Fixed an issue that could lead to missing final result for failed translations.
  • C#: Si no se esperaba una operación asincrónica en el subproceso principal, es posible que se pudiese desechar el reconocedor antes de completarse la tarea asincrónica.C#: If an async operation wasn't awaited in the main thread, it was possible the recognizer could be disposed before the async task was completed.
  • Java: Se ha corregido un problema que provocaba un bloqueo de la VM de Java.Java: Fixed a problem resulting in a crash of the Java VM.
  • Objective-C: Se ha corregido la asignación fija; se devolvió RecognizedIntent en lugar de RecognizingIntent.Objective-C: Fixed enum mapping; RecognizedIntent was returned instead of RecognizingIntent.
  • JavaScript: Se ha establecido el formato de salida predeterminado en "simple" en SpeechConfig.JavaScript: Set default output format to 'simple' in SpeechConfig.
  • JavaScript: Se ha quitado una incoherencia entre las propiedades del objeto de configuración en JavaScript y otros lenguajes.JavaScript: Removing inconsistency between properties on the config object in JavaScript and other languages.

MuestrasSamples

  • Se han actualizado y corregido varios ejemplos, como las voces de salida para la traducción, etc.Updated and fixed several samples (for example output voices for translation, etc.).
  • Se han agregado ejemplos de Node.js en el repositorio de ejemplo.Added Node.js samples in the sample repository.

Speech SDK 1.1.0Speech SDK 1.1.0

Nuevas característicasNew Features

  • Compatibilidad con Android x86/x64.Support for Android x86/x64.
  • Compatibilidad con proxy: En el objeto SpeechConfig, ahora puede llamar a una función para establecer la información del proxy (nombre de host, puerto, nombre de usuario y contraseña).Proxy Support: In the SpeechConfig object, you can now call a function to set the proxy information (hostname, port, username, and password). Esta característica no está disponible aún en iOS.This feature is not yet available on iOS.
  • Mensajes y códigos de error mejorados.Improved error code and messages. Si un reconocimiento devolvió un error, esto ya ha establecido Reason (en el evento cancelado) o CancellationDetails (en el resultado del reconocimiento) en Error.If a recognition returned an error, this did already set Reason (in canceled event) or CancellationDetails (in recognition result) to Error. El evento cancelado ahora contiene dos miembros adicionales, ErrorCode y ErrorDetails.The canceled event now contains two additional members, ErrorCode and ErrorDetails. Si el servidor devolvió información de error adicional con el error notificado, ahora estará disponible en los nuevos miembros.If the server returned additional error information with the reported error, it will now be available in the new members.

MejorasImprovements

  • Verificación adicional agregada en la configuración del reconocedor y mensaje de error adicional agregado.Added additional verification in the recognizer configuration, and added additional error message.
  • Control mejorado del silencio prolongado en medio de un archivo de audio.Improved handling of long-time silence in middle of an audio file.
  • Paquete NuGet: para proyectos de .NET Framework, evita la compilación con la configuración de AnyCPU.NuGet package: for .NET Framework projects, it prevents building with AnyCPU configuration.

Correcciones de erroresBug fixes

  • En los reconocedores se han encontrado varias excepciones corregidas.Fixed several exceptions found in recognizers. Además, las excepciones se detectan y se convierten en un evento cancelado.In addition, exceptions are caught and converted into Canceled event.
  • Corrección de una fuga de memoria en la administración de propiedades.Fix a memory leak in property management.
  • Se corrigió el error en el que un archivo de entrada de audio podría bloquear el reconocedor.Fixed bug in which an audio input file could crash the recognizer.
  • Se corrigió un error donde se podrían recibir eventos después de un evento de detención de la sesión.Fixed a bug where events could be received after a session stop event.
  • Se corrigieron algunas condiciones de subprocesos.Fixed some race conditions in threading.
  • Se corrigió un problema de compatibilidad de iOS que podría dar lugar a un bloqueo.Fixed an iOS compatibility issue that could result in a crash.
  • Mejoras de estabilidad para la compatibilidad del micrófono en Android.Stability improvements for Android microphone support.
  • Se corrigió un error donde un reconocedor en JavaScript ignoraría el lenguaje de reconocimiento.Fixed a bug where a recognizer in JavaScript would ignore the recognition language.
  • Se corrigió un error que impide establecer el valor EndpointId (en algunos casos) en JavaScript.Fixed a bug preventing setting the EndpointId (in some cases) in JavaScript.
  • Se cambió el orden de los parámetros en AddIntent en JavaScript y se agregó la firma de AddIntent en JavaScript.Changed parameter order in AddIntent in JavaScript, and added missing AddIntent JavaScript signature.

MuestrasSamples

  • Se ha agregado un ejemplo de C++ y C# sobre el uso de transmisiones de inserción y extracción en el repositorio de ejemplos.Added C++ and C# samplea for pull and push stream usage in the sample repository.

Speech SDK 1.0.1Speech SDK 1.0.1

Mejoras en la confiabilidad y correcciones de errores:Reliability improvements and bug fixes:

  • Corrección de un potencial error grave debido a una condición de carrera al desechar un reconocedorFixed potential fatal error due to race condition in disposing recognizer
  • Corrección de un potencial error grave en el caso de propiedades sin establecer.Fixed potential fatal error in case of unset properties.
  • Comprobación adicional de errores y parámetros.Added additional error and parameter checking.
  • Objective-C: corrección de posibles errores graves causados por la invalidación de nombres en NSString.Objective-C: Fixed possible fatal error caused by name overriding in NSString.
  • Objective-C: ajuste de visibilidad en la APIObjective-C: Adjusted visibility of API
  • JavaScript: corrección con respecto a los eventos y sus cargas.JavaScript: Fixed regarding events and their payloads.
  • Mejoras en la documentación.Documentation improvements.

Se ha agregado un nuevo ejemplo de Javascript en nuestro repositorio de ejemplos.In our sample repository, a new sample for JavaScript was added.

SDK de Voz 1.0.0 de Cognitive Services: Versión de septiembre de 2018Cognitive Services Speech SDK 1.0.0: 2018-September release

Nuevas características:New features

Cambios importantesBreaking changes

  • Con esta versión se presentan una serie de cambios importantes.With this release, a number of breaking changes are introduced. Consulte esta página para más información.Check this page for details.

SDK de Voz 0.6.0 de Cognitive Services: Versión de agosto de 2018Cognitive Services Speech SDK 0.6.0: 2018-August release

Nuevas características:New features

  • Ahora, las aplicaciones de UWP creadas con SDK de Voz superan el Kit para la certificación de aplicaciones en Windows (WACK).UWP apps built with the Speech SDK now can pass the Windows App Certification Kit (WACK). Consulte la Guía de inicio rápido de UWP.Check out the UWP quickstart.
  • Compatibilidad con .NET Standard 2.0 en Linux (Ubuntu 16.04 x64).Support for .NET Standard 2.0 on Linux (Ubuntu 16.04 x64).
  • Experimental: compatibilidad con Java 8 en Windows (64 bits) y Linux (Ubuntu 16.04 x 64).Experimental: Support Java 8 on Windows (64-bit) and Linux (Ubuntu 16.04 x64). Consulte la Guía de inicio rápido de Java Runtime Environment.Check out the Java Runtime Environment quickstart.

Cambios funcionalesFunctional change

  • Se expone más información detallada sobre los errores de conexión.Expose additional error detail information on connection errors.

Cambios importantesBreaking changes

  • En Java (Android), la función SpeechFactory.configureNativePlatformBindingWithDefaultCertificate ya no requiere un parámetro de ruta de acceso.On Java (Android), the SpeechFactory.configureNativePlatformBindingWithDefaultCertificate function no longer requires a path parameter. Ahora, la ruta de acceso se detecta automáticamente en todas las plataformas compatibles.Now the path is automatically detected on all supported platforms.
  • En Java y C#, se ha quitado el descriptor de acceso get- de la propiedad EndpointUrl.The get-accessor of the property EndpointUrl in Java and C# was removed.

Correcciones de erroresBug fixes

  • En Java, se implementa ahora el resultado de la síntesis de audio en el reconocedor de traducción.In Java, the audio synthesis result on the translation recognizer is implemented now.
  • Se ha corregido un error que podía provocar subprocesos inactivos y un mayor número de sockets abiertos y sin usar.Fixed a bug that could cause inactive threads and an increased number of open and unused sockets.
  • Se ha corregido un problema por el que un proceso de reconocimiento de larga ejecución podía terminar en mitad de la transmisión.Fixed a problem, where a long-running recognition could terminate in the middle of the transmission.
  • Se ha corregido una condición de carrera en el proceso de apagado del reconocedor.Fixed a race condition in recognizer shutdown.

SDK de Voz 0.5.0 de Cognitive Services: Versión de julio de 2018Cognitive Services Speech SDK 0.5.0: 2018-July release

Nuevas características:New features

  • Compatibilidad con la plataforma Android (API 23: Android Marshmallow 6.0 o posterior).Support Android platform (API 23: Android 6.0 Marshmallow or higher). Consulte el inicio rápido de Android.Check out the Android quickstart.
  • Compatibilidad con .NET Standard 2.0 en Windows.Support .NET Standard 2.0 on Windows. Consulte el inicio rápido de .NET Core.Check out the .NET Core quickstart.
  • Experimental: compatibilidad con UWP en Windows (versión 1709 o posterior).Experimental: Support UWP on Windows (version 1709 or later).
    • Consulte la Guía de inicio rápido de UWP.Check out the UWP quickstart.
    • Nota: Las aplicaciones de UWP creadas con el SDK de Voz no pasan aún el Kit para la certificación de aplicaciones en Windows (WACK).Note: UWP apps built with the Speech SDK do not yet pass the Windows App Certification Kit (WACK).
  • Compatibilidad con el reconocimiento de ejecución prolongada con reconexión automática.Support long-running recognition with automatic reconnection.

Cambios funcionalesFunctional changes

  • StartContinuousRecognitionAsync() admite reconocimiento de ejecución prolongada.StartContinuousRecognitionAsync() supports long-running recognition.
  • El resultado del reconocimiento contiene más campos.The recognition result contains more fields. Tienen un desplazamiento desde el principio del audio y la duración (ambos en tics) del texto reconocido y valores adicionales que representan el estado de reconocimiento, por ejemplo, InitialSilenceTimeout e InitialBabbleTimeout.They're offset from the audio beginning and duration (both in ticks) of the recognized text and additional values that represent recognition status, for example, InitialSilenceTimeout and InitialBabbleTimeout.
  • Compatibilidad con AuthorizationToken para la creación de instancias de fábrica.Support AuthorizationToken for creating factory instances.

Cambios importantesBreaking changes

  • Eventos de reconocimiento: el tipo de evento NoMatch se combina con el evento Error.Recognition events: NoMatch event type was merged into the Error event.
  • SpeechOutputFormat en C# se llama ahora OutputFormat para concordar con C++.SpeechOutputFormat in C# was renamed to OutputFormat to stay aligned with C++.
  • El tipo de valor devuelto de algunos métodos de la interfaz AudioInputStream se ha modificado ligeramente:The return type of some methods of the AudioInputStream interface changed slightly:
    • En Java, el método read ahora devuelve long en lugar de int.In Java, the read method now returns long instead of int.
    • En C#, el método Read ahora devuelve uint en lugar de int.In C#, the Read method now returns uint instead of int.
    • En C++, los métodos Read y GetFormat ahora devuelven size_t en lugar de int.In C++, the Read and GetFormat methods now return size_t instead of int.
  • C++: las instancias de secuencias de entrada de audio ahora solo se pueden pasar como un valor shared_ptr.C++: Instances of audio input streams now can be passed only as a shared_ptr.

Correcciones de erroresBug fixes

  • Se han corregido los valores devueltos incorrectos cuando se agota el tiempo de espera de RecognizeAsync().Fixed incorrect return values in the result when RecognizeAsync() times out.
  • Se ha eliminado la dependencia de las bibliotecas de Media Foundation en Windows.The dependency on media foundation libraries on Windows was removed. El SDK ahora usa las API de audio básicas.The SDK now uses Core Audio APIs.
  • Corrección de la documentación: se ha agregado una página de regiones para describir cuáles son las regiones admitidas.Documentation fix: Added a regions page to describe the supported regions.

Problema conocidoKnown issue

  • SDK de Voz para Android no informa de los resultados de la síntesis de voz para la traducción.The Speech SDK for Android doesn't report speech synthesis results for translation. Este problema se solucionará en la próxima versión.This issue will be fixed in the next release.

SDK de Voz 0.4.0 de Cognitive Services: Versión de junio de 2018Cognitive Services Speech SDK 0.4.0: 2018-June release

Cambios funcionalesFunctional changes

  • AudioInputStreamAudioInputStream

    Un reconocedor ahora puede consumir una secuencia como origen de audio.A recognizer now can consume a stream as the audio source. Para más información, consulte la guía de procedimientos relacionada.For more information, see the related how-to guide.

  • Formato de salida detalladoDetailed output format

    Al crear un elemento SpeechRecognizer, puede solicitar el formato de salida Detailed o Simple.When you create a SpeechRecognizer, you can request Detailed or Simple output format. DetailedSpeechRecognitionResult contiene una puntuación de confianza, texto reconocido, formato léxico sin formato, formato normalizado y formato normalizado con palabras soeces enmascaradas.The DetailedSpeechRecognitionResult contains a confidence score, recognized text, raw lexical form, normalized form, and normalized form with masked profanity.

Cambio importanteBreaking change

  • En C# se cambia de SpeechRecognitionResult.RecognizedText a SpeechRecognitionResult.Text.Changed to SpeechRecognitionResult.Text from SpeechRecognitionResult.RecognizedText in C#.

Correcciones de erroresBug fixes

  • Se ha corregido un posible problema de devolución de llamada en la capa USP durante el apagado.Fixed a possible callback issue in the USP layer during shutdown.

  • Si un reconocedor usaba un archivo de entrada de audio, mantenía el identificador de archivo más tiempo del necesario.If a recognizer consumed an audio input file, it was holding on to the file handle longer than necessary.

  • Se han eliminado varios interbloqueos entre el suministro de mensajes y el reconocedor.Removed several deadlocks between the message pump and the recognizer.

  • Se desencadena un resultado NoMatch cuando se agota la respuesta del servicio.Fire a NoMatch result when the response from service is timed out.

  • Las bibliotecas de Media Foundation en Windows son de carga retrasada.The media foundation libraries on Windows are delay loaded. Esta biblioteca solo es necesaria para la entrada del micrófono.This library is required for microphone input only.

  • La velocidad de carga de los datos de audio se limita al doble de la velocidad de audio original.The upload speed for audio data is limited to about twice the original audio speed.

  • En Windows, los ensamblados .NET de C# ahora son de nombre seguro.On Windows, C# .NET assemblies now are strong named.

  • Corrección de la documentación: Region necesita información para crear un reconocedor.Documentation fix: Region is required information to create a recognizer.

Se han agregado más ejemplos y se actualizan constantemente.More samples have been added and are constantly being updated. Para obtener el conjunto más reciente de ejemplos, consulte el repositorio de GitHub de ejemplos de SDK de Voz.For the latest set of samples, see the Speech SDK samples GitHub repository.

SDK de Voz 0.2.12733 de Cognitive Services: Versión de mayo de 2018Cognitive Services Speech SDK 0.2.12733: 2018-May release

Esta versión es la primera versión preliminar pública de SDK de Voz de Cognitive Services.This release is the first public preview release of the Cognitive Services Speech SDK.