Inicio rápido: Reconocimiento de voz con el SDK de Voz para PythonQuickstart: Recognize speech with the Speech SDK for Python

En este artículo se muestra cómo usar los servicios de voz mediante el SDK de voz de Python.This article shows how to use the Speech Services through the Speech SDK for Python. Se ilustra cómo reconocer la voz por la entrada del micrófono.It illustrates how to recognize speech from microphone input.

Requisitos previosPrerequisites

  • Una clave de suscripción de Azure para los servicios de voz.An Azure subscription key for the Speech Services. Obtenga una gratis.Get one for free.

  • Python 3.5 o versiones posteriores.Python 3.5 or later.

  • El paquete del SDK de Voz de Python está disponible para estos sistemas operativos:The Python Speech SDK package is available for these operating systems:

    • Windows: x64 y x86.Windows: x64 and x86.
    • Mac: macOS X versión 10.12 o posterior.Mac: macOS X version 10.12 or later.
    • Linux: Ubuntu 16.04, Ubuntu 18.04, Debian 9 en x64.Linux: Ubuntu 16.04, Ubuntu 18.04, Debian 9 on x64.
  • En Linux, ejecute estos comandos para instalar los paquetes necesarios:On Linux, run these commands to install the required packages:

    • En Ubuntu:On Ubuntu:

      sudo apt-get update
      sudo apt-get install build-essential libssl1.0.0 libasound2
      
    • En Debian 9:On Debian 9:

      sudo apt-get update
      sudo apt-get install build-essential libssl1.0.2 libasound2
      
  • En Windows, necesita Microsoft Visual C++ Redistributable para Visual Studio 2019 para su plataforma.On Windows, you need the Microsoft Visual C++ Redistributable for Visual Studio 2019 for your platform.

Instalación de Speech SDKInstall the Speech SDK

Importante

Al descargar cualquiera de los componentes del SDK de Voz de Azure Cognitive Services de esta página, acepta su licencia.By downloading any of the Speech SDK for Azure Cognitive Services components on this page, you acknowledge its license. Consulte los términos de licencia del software de Microsoft para el SDK de Voz.See the Microsoft Software License Terms for the Speech SDK.

Este comando instala el paquete de Python desde PyPI para el SDK de Voz:This command installs the Python package from PyPI for the Speech SDK:

pip install azure-cognitiveservices-speech

Soporte técnico y actualizacionesSupport and updates

Las actualizaciones del paquete de Python del SDK de Voz se distribuirán mediante PyPI y se anunciarán en la página Notas de la versión.Updates to the Speech SDK Python package are distributed via PyPI and announced in the Release notes. Si hay disponible una nueva versión, puede actualizarse a ella con el comando pip install --upgrade azure-cognitiveservices-speech.If a new version is available, you can update to it with the command pip install --upgrade azure-cognitiveservices-speech. Para comprobar qué versión está instalada actualmente, inspeccione la variable azure.cognitiveservices.speech.__version__.Check which version is currently installed by inspecting the azure.cognitiveservices.speech.__version__ variable.

Si tiene un problema o falta una característica, consulte las opciones de ayuda y soporte técnico.If you have a problem, or you're missing a feature, see Support and help options.

Creación de una aplicación de Python mediante el SDK de VozCreate a Python application that uses the Speech SDK

Ejecución del ejemploRun the sample

Puede copiar el código de ejemplo de este inicio rápido en un archivo de código fuente quickstart.py y ejecutarlo en el IDE o en la consola:You can copy the sample code from this quickstart to a source file quickstart.py and run it in your IDE or in the console:

python quickstart.py

También, puede descargar este tutorial de inicio rápido como un cuaderno de Jupyter del repositorio de ejemplos del SDK de Voz y ejecutarlo como un cuaderno.Or you can download this quickstart tutorial as a Jupyter notebook from the Speech SDK sample repository and run it as a notebook.

Código de ejemploSample code

import azure.cognitiveservices.speech as speechsdk

# Creates an instance of a speech config with specified subscription key and service region.
# Replace with your own subscription key and service region (e.g., "westus").
speech_key, service_region = "YourSubscriptionKey", "YourServiceRegion"
speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)

# Creates a recognizer with the given settings
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config)

print("Say something...")


# Starts speech recognition, and returns after a single utterance is recognized. The end of a
# single utterance is determined by listening for silence at the end or until a maximum of 15
# seconds of audio is processed.  The task returns the recognition text as result. 
# Note: Since recognize_once() returns only a single utterance, it is suitable only for single
# shot recognition like command or query. 
# For long-running multi-utterance recognition, use start_continuous_recognition() instead.
result = speech_recognizer.recognize_once()

# Checks result.
if result.reason == speechsdk.ResultReason.RecognizedSpeech:
    print("Recognized: {}".format(result.text))
elif result.reason == speechsdk.ResultReason.NoMatch:
    print("No speech could be recognized: {}".format(result.no_match_details))
elif result.reason == speechsdk.ResultReason.Canceled:
    cancellation_details = result.cancellation_details
    print("Speech Recognition canceled: {}".format(cancellation_details.reason))
    if cancellation_details.reason == speechsdk.CancellationReason.Error:
        print("Error details: {}".format(cancellation_details.error_details))

Instalación y uso del SDK de Voz con Visual Studio CodeInstall and use the Speech SDK with Visual Studio Code

  1. Descargue e instale una versión de 64 bits (3.5 o posterior) de Python en el equipo.Download and install a 64-bit version of Python, 3.5 or later, on your computer.

  2. Descargue e instale Visual Studio Code.Download and install Visual Studio Code.

  3. Abra Visual Studio Code e instale la extensión de Python.Open Visual Studio Code and install the Python extension. Seleccione File > Preferences > Extensions (Archivo > Preferencias > Extensiones) en el menú.Select File > Preferences > Extensions from the menu. Busque Python.Search for Python.

    Instalación de la extensión de Python

  4. Cree una carpeta en la que almacenar el proyecto.Create a folder to store the project in. Por ejemplo, puede usar para ello el Explorador de Windows.An example is by using Windows Explorer.

  5. En Visual Studio Code, seleccione el icono de File (Archivo).In Visual Studio Code, select the File icon. A continuación, abra la carpeta que creó.Then open the folder you created.

    Abrir una carpeta

  6. Cree un archivo de código fuente de Python speechsdk.py mediante la selección del icono de nuevo archivo.Create a new Python source file, speechsdk.py, by selecting the new file icon.

    Creación de un archivo

  7. Copie, pegue y guarde el código de Python en el archivo recién creado.Copy, paste, and save the Python code to the newly created file.

  8. Inserte la información de la suscripción de los servicios de voz.Insert your Speech Services subscription information.

  9. Si se selecciona, se muestra un intérprete de Python en el lado izquierdo de la barra de estado en la parte inferior de la ventana.If selected, a Python interpreter displays on the left side of the status bar at the bottom of the window. En caso contrario, aparecerá una lista de los intérpretes de Python disponibles.Otherwise, bring up a list of available Python interpreters. Abra la paleta de comandos (Ctrl+Mayús+P) y escriba Python: Select Interpreter (Seleccionar intérprete).Open the command palette (Ctrl+Shift+P) and enter Python: Select Interpreter. Elija un valor apropiado.Choose an appropriate one.

  10. Puede instalar el paquete de Python del SDK de Voz desde dentro de Visual Studio Code.You can install the Speech SDK Python package from within Visual Studio Code. Hágalo si no está instalado aún para el intérprete de Python seleccionado.Do that if it's not installed yet for the Python interpreter you selected. Para instalar el paquete del SDK de Voz, abra un terminal.To install the Speech SDK package, open a terminal. Abra de nuevo la paleta de comandos (Ctrl+Mayús+P) y escriba Terminal: Create New Integrated Terminal (Crear terminal integrado).Bring up the command palette again (Ctrl+Shift+P) and enter Terminal: Create New Integrated Terminal. En el terminal que se abre, escriba el comando python -m pip install azure-cognitiveservices-speech o el que sea apropiado para su sistema.In the terminal that opens, enter the command python -m pip install azure-cognitiveservices-speech or the appropriate command for your system.

  11. Para ejecutar el código de ejemplo, haga clic con el botón derecho en algún lugar dentro del editor.To run the sample code, right-click somewhere inside the editor. Seleccione Run Python File in Terminal (Ejecutar archivo de Python en terminal).Select Run Python File in Terminal. Diga algunas palabras cuando se le pida.Speak a few words when you're prompted. El texto transcrito se muestra poco después.The transcribed text displays shortly afterward.

    Ejecución de un ejemplo

Si tiene problemas para seguir estas instrucciones, consulte el tutorial de Python para Visual Studio Code con información más amplia.If you have issues following these instructions, refer to the more extensive Visual Studio Code Python tutorial.

Pasos siguientesNext steps