Snabbstart: Taligenkänning med Speech SDK för PythonQuickstart: Recognize speech with the Speech SDK for Python

Den här artikeln visar hur du använder tal tjänsterna via tal-SDK för python.This article shows how to use the Speech Services through the Speech SDK for Python. Den visar hur du kan känna igen tal från mikrofonens indata.It illustrates how to recognize speech from microphone input.

FörutsättningarPrerequisites

  • En Azure-prenumerations nyckel för tal tjänsterna.An Azure subscription key for the Speech Services. Skaffa en kostnadsfritt.Get one for free.

  • Python 3.5 eller senare.Python 3.5 or later.

  • Python Speech SDK-paketet är tillgängligt för dessa operativsystem:The Python Speech SDK package is available for these operating systems:

    • Windows: x64 och x86.Windows: x64 and x86.
    • Mac: Mac OS X version 10.12 eller senare.Mac: macOS X version 10.12 or later.
    • Linux: Ubuntu 16,04, Ubuntu 18,04, Debian 9 på x64.Linux: Ubuntu 16.04, Ubuntu 18.04, Debian 9 on x64.
  • Kör de här kommandona i Linux för att installera de nödvändiga paketen:On Linux, run these commands to install the required packages:

    • I Ubuntu:On Ubuntu:

      sudo apt-get update
      sudo apt-get install build-essential libssl1.0.0 libasound2
      
    • På Debian 9:On Debian 9:

      sudo apt-get update
      sudo apt-get install build-essential libssl1.0.2 libasound2
      
  • I Windows behöver du Microsoft Visual C++ Redistributable för Visual Studio 2019 för din plattform.On Windows, you need the Microsoft Visual C++ Redistributable for Visual Studio 2019 for your platform.

Installera Speech SDKInstall the Speech SDK

Viktigt

När du väljer att ladda ned någon av Speech SDK för Cognitive Services-komponenterna på den här sidan accepterar du även dess licens.By downloading any of the Speech SDK for Azure Cognitive Services components on this page, you acknowledge its license. Se licensvillkoren för Microsoft-programvara för Speech SDK.See the Microsoft Software License Terms for the Speech SDK.

Det här kommandot installerar Python-paketet från PyPI för Speech SDK:This command installs the Python package from PyPI for the Speech SDK:

pip install azure-cognitiveservices-speech

Support och uppdateringarSupport and updates

Uppdateringar av Python Speech SDK-paketet distribueras via PyPI och visas i Viktig information.Updates to the Speech SDK Python package are distributed via PyPI and announced in the Release notes. Om en ny version är tillgänglig kan du uppdatera till den med kommandot pip install --upgrade azure-cognitiveservices-speech.If a new version is available, you can update to it with the command pip install --upgrade azure-cognitiveservices-speech. Kontrollera vilken version som är installerad genom att granska variabeln azure.cognitiveservices.speech.__version__.Check which version is currently installed by inspecting the azure.cognitiveservices.speech.__version__ variable.

Om du har problem eller saknar en funktion kan du ta en titt på alternativen för support och hjälp.If you have a problem, or you're missing a feature, see Support and help options.

Skapa ett Python-program som använder Speech SDKCreate a Python application that uses the Speech SDK

Kör exempletRun the sample

Du kan kopiera exempelkoden till en källfil från den här snabbstarten quickstart.py och köra den i din IDE eller i konsolen:You can copy the sample code from this quickstart to a source file quickstart.py and run it in your IDE or in the console:

python quickstart.py

Eller så kan du ladda ned den här snabbstartssjälvstudien som en Jupyter Notebook från exempellagringsplatsen för Speech SDK och köra den som en notebook-fil.Or you can download this quickstart tutorial as a Jupyter notebook from the Speech SDK sample repository and run it as a notebook.

ExempelkodSample code

import azure.cognitiveservices.speech as speechsdk

# Creates an instance of a speech config with specified subscription key and service region.
# Replace with your own subscription key and service region (e.g., "westus").
speech_key, service_region = "YourSubscriptionKey", "YourServiceRegion"
speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)

# Creates a recognizer with the given settings
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config)

print("Say something...")


# Starts speech recognition, and returns after a single utterance is recognized. The end of a
# single utterance is determined by listening for silence at the end or until a maximum of 15
# seconds of audio is processed.  The task returns the recognition text as result. 
# Note: Since recognize_once() returns only a single utterance, it is suitable only for single
# shot recognition like command or query. 
# For long-running multi-utterance recognition, use start_continuous_recognition() instead.
result = speech_recognizer.recognize_once()

# Checks result.
if result.reason == speechsdk.ResultReason.RecognizedSpeech:
    print("Recognized: {}".format(result.text))
elif result.reason == speechsdk.ResultReason.NoMatch:
    print("No speech could be recognized: {}".format(result.no_match_details))
elif result.reason == speechsdk.ResultReason.Canceled:
    cancellation_details = result.cancellation_details
    print("Speech Recognition canceled: {}".format(cancellation_details.reason))
    if cancellation_details.reason == speechsdk.CancellationReason.Error:
        print("Error details: {}".format(cancellation_details.error_details))

Installera och använda Speech SDK med Visual Studio CodeInstall and use the Speech SDK with Visual Studio Code

  1. Ladda ned och installera en 64-bitarsversion (3.5 eller senare) av Python på din dator.Download and install a 64-bit version of Python, 3.5 or later, on your computer.

  2. Ladda ned och installera Visual Studio Code.Download and install Visual Studio Code.

  3. Öppna Visual Studio Code och installera Python-tillägget.Open Visual Studio Code and install the Python extension. Välj Arkiv > Inställningar > Tillägg på menyn.Select File > Preferences > Extensions from the menu. Sök efter Python.Search for Python.

    Installera Python-tillägget

  4. Skapa en mapp att lagra projektet i.Create a folder to store the project in. Ett exempel är med hjälp av Windows Explorer.An example is by using Windows Explorer.

  5. Från Visual Studio Code väljer du ikonen Arkiv.In Visual Studio Code, select the File icon. Öppna sedan den mapp du skapade.Then open the folder you created.

    Öppna en mapp

  6. Skapa en ny Python-källfil speechsdk.py genom att välja den nya filikonen.Create a new Python source file, speechsdk.py, by selecting the new file icon.

    Skapa en fil

  7. Kopiera, klistra in och spara Python-koden till den nyskapade filen.Copy, paste, and save the Python code to the newly created file.

  8. Infoga prenumerations information för tal tjänster.Insert your Speech Services subscription information.

  9. Om en Python-tolk har valts visas den på statusfältets vänstra sida, längst ner i fönstret.If selected, a Python interpreter displays on the left side of the status bar at the bottom of the window. Annars kan du ta fram en lista över tillgängliga Python-tolkar.Otherwise, bring up a list of available Python interpreters. Öppna kommandopaletten (Ctrl + Skift + P) och ange Python: Välj tolk.Open the command palette (Ctrl+Shift+P) and enter Python: Select Interpreter. Välj en som passar.Choose an appropriate one.

  10. Du kan installera Speech SDK Python-paketet i Visual Studio Code.You can install the Speech SDK Python package from within Visual Studio Code. Gör det om det inte är installerat än för Python-tolken som du valt.Do that if it's not installed yet for the Python interpreter you selected. Öppna en terminal för att installera Speech SDK-paketet.To install the Speech SDK package, open a terminal. Öppna kommandopaletten igen (Ctrl + Skift + P) igen och ange Terminal: Skapa en ny integrerad terminal.Bring up the command palette again (Ctrl+Shift+P) and enter Terminal: Create New Integrated Terminal. I terminalen som öppnas anger du kommandot python -m pip install azure-cognitiveservices-speech, eller lämpligt kommando för ditt system.In the terminal that opens, enter the command python -m pip install azure-cognitiveservices-speech or the appropriate command for your system.

  11. Kör exempelkoden genom att högerklicka någonstans i redigeraren.To run the sample code, right-click somewhere inside the editor. Välj Kör Python-fil i Terminal.Select Run Python File in Terminal. Säg några få ord när du uppmanas.Speak a few words when you're prompted. Den transkriberade texten visas strax därefter.The transcribed text displays shortly afterward.

    Köra ett exempel

Om det finns problem med att följa dessa anvisningar finns den mer omfattande självstudien Visual Studio Code Python.If you have issues following these instructions, refer to the more extensive Visual Studio Code Python tutorial.

Nästa stegNext steps