Rychlý Start: rozpoznávání řeči z mikrofonuQuickstart: Recognize speech from a microphone

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo do, zobrazte si nebo stáhněte všechny ukázky sady Speech SDK C# na GitHubu.If you prefer to jump right in, view or download all Speech SDK C# Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

Volba cílového prostředíChoose your target environment

PožadavkyPrerequisites

Než začnete:Before you get started:

Otevřete projekt v aplikaci Visual StudioOpen your project in Visual Studio

Prvním krokem je ujistit se, že máte projekt otevřený v aplikaci Visual Studio.The first step is to make sure that you have your project open in Visual Studio.

  1. Spusťte Visual Studio 2019.Launch Visual Studio 2019.
  2. Načtěte svůj projekt a otevřete program.cs.Load your project and open Program.cs.

Zdrojový kódSource code

Obsah souboru program.cs nahraďte následujícím kódem jazyka C#.Replace the contents of the Program.cs file with the following C# code.

using System;
using System.Threading.Tasks;
using Microsoft.CognitiveServices.Speech;

namespace Speech.Recognition
{
    class Program
    {
        static async Task Main()
        {
            await RecognizeSpeechAsync();

            Console.WriteLine("Please press any key to continue...");
            Console.ReadLine();
        }

        static async Task RecognizeSpeechAsync()
        {
            var config =
                SpeechConfig.FromSubscription(
                    "YourSubscriptionKey",
                    "YourServiceRegion");

            using var recognizer = new SpeechRecognizer(config);
            
            var result = await recognizer.RecognizeOnceAsync();
            switch (result.Reason)
            {
                case ResultReason.RecognizedSpeech:
                    Console.WriteLine($"We recognized: {result.Text}");
                    break;
                case ResultReason.NoMatch:
                    Console.WriteLine($"NOMATCH: Speech could not be recognized.");
                    break;
                case ResultReason.Canceled:
                    var cancellation = CancellationDetails.FromResult(result);
                    Console.WriteLine($"CANCELED: Reason={cancellation.Reason}");
    
                    if (cancellation.Reason == CancellationReason.Error)
                    {
                        Console.WriteLine($"CANCELED: ErrorCode={cancellation.ErrorCode}");
                        Console.WriteLine($"CANCELED: ErrorDetails={cancellation.ErrorDetails}");
                        Console.WriteLine($"CANCELED: Did you update the subscription info?");
                    }
                    break;
            }
        }
    }
}

Hodnoty YourSubscriptionKey a YourServiceRegion nahraďte skutečnými hodnotami z prostředku řeči.Replace the YourSubscriptionKey and YourServiceRegion values with actual values from the Speech resource.

  • Přejděte do Azure Portal a otevřete prostředek řeči.Navigate to the Azure portal , and open the Speech resource
  • Pod klíčem nalevo jsou k dispozici dva dostupné klíče předplatného.Under the Keys on the left, there are two available subscription keys
    • Použijte buď jednu jako náhradu YourSubscriptionKey hodnoty.Use either one as the YourSubscriptionKey value replacement
  • V přehledu vlevo si všimněte oblasti a namapujte ji na identifikátor oblasti .Under the Overview on the left, note the region and map it to the region identifier
    • Jako náhradu YourServiceRegion hodnoty použijte "westus" identifikátor oblasti , například: pro západní USAUse the Region identifier as the YourServiceRegion value replacement, for example: "westus" for West US

Vysvětlení kóduCode explanation

Pro vytvoření objektu konfigurace řeči se vyžaduje klíč a oblast předplatného prostředku pro rozpoznávání řeči.The Speech resource subscription key and region are required to create a speech configuration object. Objekt konfigurace je nutný k vytvoření instance objektu pro rozpoznávání řeči.The configuration object is needed to instantiate a speech recognizer object.

Instance nástroje pro rozpoznávání nabízí více způsobů rozpoznávání řeči.The recognizer instance exposes multiple ways to recognize speech. V tomto příkladu je rozpoznávání řeči rozpoznáno jednou.In this example, speech is recognized once. Tato funkce umožňuje, aby služba Speech Service věděli, že posíláte jednu frázi pro rozpoznávání, a že po identifikaci fráze pro zastavení rozpoznávání řeči.This functionality lets the Speech service know that you're sending a single phrase for recognition, and that once the phrase is identified to stop recognizing speech. Po získání výsledku kód zapíše důvod pro rozpoznávání do konzoly.Once the result is yielded, the code will write the recognition reason to the console.

Tip

Sada Speech SDK bude ve výchozím nastavení rozpoznávat použití en-us pro jazyk. informace o výběru zdrojového jazyka najdete v tématu určení zdrojového jazyka pro rozpoznávání řeči textu .The Speech SDK will default to recognizing using en-us for the language, see Specify source language for speech to text for information on choosing the source language.

Sestavení a spuštění aplikaceBuild and run app

Teď jste připraveni znovu sestavit aplikaci a otestovat funkci rozpoznávání řeči pomocí služby Speech.Now you're ready to rebuild your app and test the speech recognition functionality using the Speech service.

  1. Zkompilujte kód -z panelu nabídek v aplikaci Visual Studio, vyberte sestavení > řešenísestavení.Compile the code - From the menu bar of Visual Studio, choose Build > Build Solution.
  2. Spusťte aplikaci – z řádku nabídek zvolte ladění > Spustit ladění nebo stiskněte klávesu F5.Start your app - From the menu bar, choose Debug > Start Debugging or press F5.
  3. Spustit rozpoznávání – zobrazí výzvu k vymluvenému vynechání fráze v angličtině.Start recognition - It will prompt you to speak a phrase in English. Váš hlas se odešle službě Speech, přepisu jako text a vykreslí se v konzole nástroje.Your speech is sent to the Speech service, transcribed as text, and rendered in the console.

Další krokyNext steps

V rámci tohoto základního vědomí rozpoznávání řeči můžete pokračovat v zkoumání základních informací o běžných funkcích a úlohách v sadě Speech SDK.With this base knowledge of speech recognition, continue exploring the basics to learn about common functionality and tasks within the Speech SDK.

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo v, zobrazte si nebo stáhněte všechny ukázky sady Speech SDK pro sadu Speech na GitHubu.If you prefer to jump right in, view or download all Speech SDK C++ Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

Volba cílového prostředíChoose your target environment

PožadavkyPrerequisites

Než začnete:Before you get started:

Zdrojový kódSource code

Vytvořte zdrojový soubor C++ s názvem HelloWorld. cppa vložte do něj následující kód.Create a C++ source file named helloworld.cpp, and paste the following code into it.

#include <iostream> // cin, cout
#include <speechapi_cxx.h>

using namespace std;
using namespace Microsoft::CognitiveServices::Speech;

void recognizeSpeech() {
    // Creates an instance of a speech config with specified subscription key and service region.
    // Replace with your own subscription key and service region (e.g., "westus").
    auto config = SpeechConfig::FromSubscription("YourSubscriptionKey", "YourServiceRegion");

    // Creates a speech recognizer
    auto recognizer = SpeechRecognizer::FromConfig(config);
    cout << "Say something...\n";

    // Starts speech recognition, and returns after a single utterance is recognized. The end of a
    // single utterance is determined by listening for silence at the end or until a maximum of 15
    // seconds of audio is processed.  The task returns the recognition text as result. 
    // Note: Since RecognizeOnceAsync() returns only a single utterance, it is suitable only for single
    // shot recognition like command or query. 
    // For long-running multi-utterance recognition, use StartContinuousRecognitionAsync() instead.
    auto result = recognizer->RecognizeOnceAsync().get();

    // Checks result.
    if (result->Reason == ResultReason::RecognizedSpeech) {
        cout << "We recognized: " << result->Text << std::endl;
    }
    else if (result->Reason == ResultReason::NoMatch) {
        cout << "NOMATCH: Speech could not be recognized." << std::endl;
    }
    else if (result->Reason == ResultReason::Canceled) {
        auto cancellation = CancellationDetails::FromResult(result);
        cout << "CANCELED: Reason=" << (int)cancellation->Reason << std::endl;

        if (cancellation->Reason == CancellationReason::Error) {
            cout << "CANCELED: ErrorCode= " << (int)cancellation->ErrorCode << std::endl;
            cout << "CANCELED: ErrorDetails=" << cancellation->ErrorDetails << std::endl;
            cout << "CANCELED: Did you update the subscription info?" << std::endl;
        }
    }
}

int main(int argc, char **argv) {
    setlocale(LC_ALL, "");
    recognizeSpeech();
    return 0;
}

Hodnoty YourSubscriptionKey a YourServiceRegion nahraďte skutečnými hodnotami z prostředku řeči.Replace the YourSubscriptionKey and YourServiceRegion values with actual values from the Speech resource.

  • Přejděte do Azure Portal a otevřete prostředek řeči.Navigate to the Azure portal , and open the Speech resource
  • Pod klíčem nalevo jsou k dispozici dva dostupné klíče předplatného.Under the Keys on the left, there are two available subscription keys
    • Použijte buď jednu jako náhradu YourSubscriptionKey hodnoty.Use either one as the YourSubscriptionKey value replacement
  • V přehledu vlevo si všimněte oblasti a namapujte ji na identifikátor oblasti .Under the Overview on the left, note the region and map it to the region identifier
    • Jako náhradu YourServiceRegion hodnoty použijte "westus" identifikátor oblasti , například: pro západní USAUse the Region identifier as the YourServiceRegion value replacement, for example: "westus" for West US

Vysvětlení kóduCode explanation

Pro vytvoření objektu konfigurace řeči se vyžaduje klíč a oblast předplatného prostředku pro rozpoznávání řeči.The Speech resource subscription key and region are required to create a speech configuration object. Objekt konfigurace je nutný k vytvoření instance objektu pro rozpoznávání řeči.The configuration object is needed to instantiate a speech recognizer object.

Instance nástroje pro rozpoznávání nabízí více způsobů rozpoznávání řeči.The recognizer instance exposes multiple ways to recognize speech. V tomto příkladu je rozpoznávání řeči rozpoznáno jednou.In this example, speech is recognized once. Tato funkce umožňuje, aby služba Speech Service věděli, že posíláte jednu frázi pro rozpoznávání, a že po identifikaci fráze pro zastavení rozpoznávání řeči.This functionality lets the Speech service know that you're sending a single phrase for recognition, and that once the phrase is identified to stop recognizing speech. Po získání výsledku kód zapíše důvod pro rozpoznávání do konzoly.Once the result is yielded, the code will write the recognition reason to the console.

Tip

Sada Speech SDK bude ve výchozím nastavení rozpoznávat použití en-us pro jazyk. informace o výběru zdrojového jazyka najdete v tématu určení zdrojového jazyka pro rozpoznávání řeči textu .The Speech SDK will default to recognizing using en-us for the language, see Specify source language for speech to text for information on choosing the source language.

Sestavení aplikaceBuild the app

Poznámka

Nezapomeňte zadat níže uvedené příkazy jako jeden příkazový řádek.Make sure to enter the commands below as a single command line. Nejjednodušším způsobem, jak to udělat, je zkopírovat příkaz pomocí tlačítka Kopírovat vedle každého příkazu a vložit ho do příkazového řádku vašeho prostředí.The easiest way to do that is to copy the command by using the Copy button next to each command, and then paste it at your shell prompt.

  • V systému x64 (64bitovém systému) spusťte následující příkaz, kterým vytvoříte aplikaci.On an x64 (64-bit) system, run the following command to build the application.

    g++ helloworld.cpp -o helloworld -I "$SPEECHSDK_ROOT/include/cxx_api" -I "$SPEECHSDK_ROOT/include/c_api" --std=c++14 -lpthread -lMicrosoft.CognitiveServices.Speech.core -L "$SPEECHSDK_ROOT/lib/x64" -l:libasound.so.2
    
  • V systému x86 (32bitovém systému) spusťte následující příkaz, kterým vytvoříte aplikaci.On an x86 (32-bit) system, run the following command to build the application.

    g++ helloworld.cpp -o helloworld -I "$SPEECHSDK_ROOT/include/cxx_api" -I "$SPEECHSDK_ROOT/include/c_api" --std=c++14 -lpthread -lMicrosoft.CognitiveServices.Speech.core -L "$SPEECHSDK_ROOT/lib/x86" -l:libasound.so.2
    
  • V systému ARM64 (64) spusťte následující příkaz, který sestaví aplikaci.On an ARM64 (64-bit) system, run the following command to build the application.

    g++ helloworld.cpp -o helloworld -I "$SPEECHSDK_ROOT/include/cxx_api" -I "$SPEECHSDK_ROOT/include/c_api" --std=c++14 -lpthread -lMicrosoft.CognitiveServices.Speech.core -L "$SPEECHSDK_ROOT/lib/arm64" -l:libasound.so.2
    

Spuštění aplikaceRun the app

  1. Nakonfigurujte cestu ke knihovně zavaděče, aby odkazovala na knihovnu sady Speech SDK.Configure the loader's library path to point to the Speech SDK library.

    • V systému x64 (64bitovém systému) zadejte následující příkaz.On an x64 (64-bit) system, enter the following command.

      export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:$SPEECHSDK_ROOT/lib/x64"
      
    • V systému x86 (32bitovém systému) zadejte tento příkaz.On an x86 (32-bit) system, enter this command.

      export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:$SPEECHSDK_ROOT/lib/x86"
      
    • V systému ARM64 (64 bitů) zadejte následující příkaz.On an ARM64 (64-bit) system, enter the following command.

      export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:$SPEECHSDK_ROOT/lib/arm64"
      
  2. Spusťte aplikaci.Run the application.

    ./helloworld
    
  3. V okně konzoly se zobrazí výzva požadující, abyste něco řekli.In the console window, a prompt appears, requesting that you say something. Vyslovte anglickou frázi nebo větu.Speak an English phrase or sentence. Vaše řeč se přenese do služby Speech a přepíše na text, který se zobrazí ve stejném okně.Your speech is transmitted to the Speech service and transcribed to text, which appears in the same window.

    Say something...
    We recognized: What's the weather like?
    

Další krokyNext steps

V rámci tohoto základního vědomí rozpoznávání řeči můžete pokračovat v zkoumání základních informací o běžných funkcích a úlohách v sadě Speech SDK.With this base knowledge of speech recognition, continue exploring the basics to learn about common functionality and tasks within the Speech SDK.

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo v, můžete si prohlédnout nebo stáhnout všechny ukázky sady Speech SDK Java na GitHubu.If you prefer to jump right in, view or download all Speech SDK Java Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

Volba cílového prostředíChoose your target environment

PožadavkyPrerequisites

Než začnete:Before you get started:

Zdrojový kódSource code

Chcete-li do projektu Java přidat novou prázdnou třídu, vyberte možnost soubor > Nová > Třída.To add a new empty class to your Java project, select File > New > Class. V okně New Java Class (Nová třída Javy) zadejte do pole Package (Balíček) speechsdk.quickstart a do pole Name (Název) zadejte Main (Hlavní).In the New Java Class window, enter speechsdk.quickstart into the Package field, and Main into the Name field.

Snímek obrazovky s oknem New Java Class (Nová třída Javy)

Obsah hlavního souboru. Java nahraďte následujícím fragmentem kódu:Replace the contents of the Main.java file with the following snippet:

package speechsdk.quickstart;

import java.util.concurrent.Future;
import com.microsoft.cognitiveservices.speech.*;

/**
 * Quickstart: recognize speech using the Speech SDK for Java.
 */
public class Main {

    /**
     * @param args Arguments are ignored in this sample.
     */
    public static void main(String[] args) {
        try {
            // Replace below with your own subscription key
            String speechSubscriptionKey = "YourSubscriptionKey";
            // Replace below with your own service region (e.g., "westus").
            String serviceRegion = "YourServiceRegion";

            int exitCode = 1;
            SpeechConfig config = SpeechConfig.fromSubscription(speechSubscriptionKey, serviceRegion);
            assert(config != null);

            SpeechRecognizer reco = new SpeechRecognizer(config);
            assert(reco != null);

            System.out.println("Say something...");

            Future<SpeechRecognitionResult> task = reco.recognizeOnceAsync();
            assert(task != null);

            SpeechRecognitionResult result = task.get();
            assert(result != null);

            if (result.getReason() == ResultReason.RecognizedSpeech) {
                System.out.println("We recognized: " + result.getText());
                exitCode = 0;
            }
            else if (result.getReason() == ResultReason.NoMatch) {
                System.out.println("NOMATCH: Speech could not be recognized.");
            }
            else if (result.getReason() == ResultReason.Canceled) {
                CancellationDetails cancellation = CancellationDetails.fromResult(result);
                System.out.println("CANCELED: Reason=" + cancellation.getReason());

                if (cancellation.getReason() == CancellationReason.Error) {
                    System.out.println("CANCELED: ErrorCode=" + cancellation.getErrorCode());
                    System.out.println("CANCELED: ErrorDetails=" + cancellation.getErrorDetails());
                    System.out.println("CANCELED: Did you update the subscription info?");
                }
            }

            reco.close();

            System.exit(exitCode);
        } catch (Exception ex) {
            System.out.println("Unexpected exception: " + ex.getMessage());

            assert(false);
            System.exit(1);
        }
    }
}

Hodnoty YourSubscriptionKey a YourServiceRegion nahraďte skutečnými hodnotami z prostředku řeči.Replace the YourSubscriptionKey and YourServiceRegion values with actual values from the Speech resource.

  • Přejděte do Azure Portal a otevřete prostředek řeči.Navigate to the Azure portal , and open the Speech resource
  • Pod klíčem nalevo jsou k dispozici dva dostupné klíče předplatného.Under the Keys on the left, there are two available subscription keys
    • Použijte buď jednu jako náhradu YourSubscriptionKey hodnoty.Use either one as the YourSubscriptionKey value replacement
  • V přehledu vlevo si všimněte oblasti a namapujte ji na identifikátor oblasti .Under the Overview on the left, note the region and map it to the region identifier
    • Jako náhradu YourServiceRegion hodnoty použijte "westus" identifikátor oblasti , například: pro západní USAUse the Region identifier as the YourServiceRegion value replacement, for example: "westus" for West US

Vysvětlení kóduCode explanation

Pro vytvoření objektu konfigurace řeči se vyžaduje klíč a oblast předplatného prostředku pro rozpoznávání řeči.The Speech resource subscription key and region are required to create a speech configuration object. Objekt konfigurace je nutný k vytvoření instance objektu pro rozpoznávání řeči.The configuration object is needed to instantiate a speech recognizer object.

Instance nástroje pro rozpoznávání nabízí více způsobů rozpoznávání řeči.The recognizer instance exposes multiple ways to recognize speech. V tomto příkladu je rozpoznávání řeči rozpoznáno jednou.In this example, speech is recognized once. Tato funkce umožňuje, aby služba Speech Service věděli, že posíláte jednu frázi pro rozpoznávání, a že po identifikaci fráze pro zastavení rozpoznávání řeči.This functionality lets the Speech service know that you're sending a single phrase for recognition, and that once the phrase is identified to stop recognizing speech. Po získání výsledku kód zapíše důvod pro rozpoznávání do konzoly.Once the result is yielded, the code will write the recognition reason to the console.

Tip

Sada Speech SDK bude ve výchozím nastavení rozpoznávat použití en-us pro jazyk. informace o výběru zdrojového jazyka najdete v tématu určení zdrojového jazyka pro rozpoznávání řeči textu .The Speech SDK will default to recognizing using en-us for the language, see Specify source language for speech to text for information on choosing the source language.

Sestavení a spuštění aplikaceBuild and run app

Stiskněte klávesu F11nebo vyberte Spustit > ladění.Press F11, or select Run > Debug. Následujících 15 sekund hlasového vstupu z mikrofonu se rozpozná a zaprotokoluje v okně konzoly.The next 15 seconds of speech input from your microphone will be recognized and logged in the console window.

Snímek obrazovky s výstupem konzoly po úspěšném rozpoznání

Další krokyNext steps

V rámci tohoto základního vědomí rozpoznávání řeči můžete pokračovat v zkoumání základních informací o běžných funkcích a úlohách v sadě Speech SDK.With this base knowledge of speech recognition, continue exploring the basics to learn about common functionality and tasks within the Speech SDK.

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo do, zobrazte si nebo Stáhněte si ukázky Python SDK pro řeč na GitHubu.If you prefer to jump right in, view or download all Speech SDK Python Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

PožadavkyPrerequisites

Než začnete:Before you get started:

Zdrojový kódSource code

Vytvořte soubor s názvem quickstart.py a vložte do něj následující kód Pythonu.Create a file named quickstart.py and paste the following Python code in it.

import azure.cognitiveservices.speech as speechsdk

# Creates an instance of a speech config with specified subscription key and service region.
# Replace with your own subscription key and service region (e.g., "westus").
speech_key, service_region = "YourSubscriptionKey", "YourServiceRegion"
speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)

# Creates a recognizer with the given settings
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config)

print("Say something...")


# Starts speech recognition, and returns after a single utterance is recognized. The end of a
# single utterance is determined by listening for silence at the end or until a maximum of 15
# seconds of audio is processed.  The task returns the recognition text as result. 
# Note: Since recognize_once() returns only a single utterance, it is suitable only for single
# shot recognition like command or query. 
# For long-running multi-utterance recognition, use start_continuous_recognition() instead.
result = speech_recognizer.recognize_once()

# Checks result.
if result.reason == speechsdk.ResultReason.RecognizedSpeech:
    print("Recognized: {}".format(result.text))
elif result.reason == speechsdk.ResultReason.NoMatch:
    print("No speech could be recognized: {}".format(result.no_match_details))
elif result.reason == speechsdk.ResultReason.Canceled:
    cancellation_details = result.cancellation_details
    print("Speech Recognition canceled: {}".format(cancellation_details.reason))
    if cancellation_details.reason == speechsdk.CancellationReason.Error:
        print("Error details: {}".format(cancellation_details.error_details))

Hodnoty YourSubscriptionKey a YourServiceRegion nahraďte skutečnými hodnotami z prostředku řeči.Replace the YourSubscriptionKey and YourServiceRegion values with actual values from the Speech resource.

  • Přejděte do Azure Portal a otevřete prostředek řeči.Navigate to the Azure portal , and open the Speech resource
  • Pod klíčem nalevo jsou k dispozici dva dostupné klíče předplatného.Under the Keys on the left, there are two available subscription keys
    • Použijte buď jednu jako náhradu YourSubscriptionKey hodnoty.Use either one as the YourSubscriptionKey value replacement
  • V přehledu vlevo si všimněte oblasti a namapujte ji na identifikátor oblasti .Under the Overview on the left, note the region and map it to the region identifier
    • Jako náhradu YourServiceRegion hodnoty použijte "westus" identifikátor oblasti , například: pro západní USAUse the Region identifier as the YourServiceRegion value replacement, for example: "westus" for West US

Vysvětlení kóduCode explanation

Pro vytvoření objektu konfigurace řeči se vyžaduje klíč a oblast předplatného prostředku pro rozpoznávání řeči.The Speech resource subscription key and region are required to create a speech configuration object. Objekt konfigurace je nutný k vytvoření instance objektu pro rozpoznávání řeči.The configuration object is needed to instantiate a speech recognizer object.

Instance nástroje pro rozpoznávání nabízí více způsobů rozpoznávání řeči.The recognizer instance exposes multiple ways to recognize speech. V tomto příkladu je rozpoznávání řeči rozpoznáno jednou.In this example, speech is recognized once. Tato funkce umožňuje, aby služba Speech Service věděli, že posíláte jednu frázi pro rozpoznávání, a že po identifikaci fráze pro zastavení rozpoznávání řeči.This functionality lets the Speech service know that you're sending a single phrase for recognition, and that once the phrase is identified to stop recognizing speech. Po získání výsledku kód zapíše důvod pro rozpoznávání do konzoly.Once the result is yielded, the code will write the recognition reason to the console.

Tip

Sada Speech SDK bude ve výchozím nastavení rozpoznávat použití en-us pro jazyk. informace o výběru zdrojového jazyka najdete v tématu určení zdrojového jazyka pro rozpoznávání řeči textu .The Speech SDK will default to recognizing using en-us for the language, see Specify source language for speech to text for information on choosing the source language.

Sestavení a spuštění aplikaceBuild and run app

Nyní jste připraveni testovat rozpoznávání řeči pomocí služby Speech.Now you're ready to test speech recognition using the Speech service.

Pokud tuto službu používáte v macOS a jedná se o první aplikaci v Pythonu, kterou jste sestavili tak, aby používala mikrofon, budete pravděpodobně muset dát terminálovému přístupu k mikrofonu.If you're running this on macOS and it's the first Python app you've built that uses a microphone, you'll probably need to give Terminal access to the microphone. Otevřete nastavení systému a vyberte zabezpečení & ochrana osobních údajů.Open System Settings and select Security & Privacy. V dalším kroku vyberte možnost soukromí a v seznamu vyhledejte možnost mikrofon .Next, select Privacy and locate Microphone in the list. Nakonec vyberte terminály a uložte.Last, select Terminal and save.

  1. Spusťte aplikaci – z příkazového řádku zadejte:Start your app - From the command line, type:
    python quickstart.py
    
  2. Spustit rozpoznávání – zobrazí výzvu k vymluvenému vynechání fráze v angličtině.Start recognition - It will prompt you to speak a phrase in English. Váš hlas se odešle službě Speech, přepisu jako text a vykreslí se v konzole nástroje.Your speech is sent to the Speech service, transcribed as text, and rendered in the console.

Další krokyNext steps

V rámci tohoto základního vědomí rozpoznávání řeči můžete pokračovat v zkoumání základních informací o běžných funkcích a úlohách v sadě Speech SDK.With this base knowledge of speech recognition, continue exploring the basics to learn about common functionality and tasks within the Speech SDK.

V tomto rychlém startu použijete rozhraní příkazového řádku (CLI) z příkazového řádku k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte text z zaznamenaného zvukového přepisu.In this quickstart, you use the Speech CLI from the command line to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Pomocí rozhraní příkazového řádku pro rozpoznávání řeči můžete snadno provádět běžné úlohy, jako jsou zdlouhavého přepisování konverzace.It's easy to use the Speech CLI to perform common recognition tasks, such as transcribing conversations. Po jednorázové konfiguraci vám funkce rozpoznávání řeči umožní interaktivní přepisovat zvuk do textu pomocí mikrofonu nebo ze souborů pomocí dávkového skriptu.After a one-time configuration, the Speech CLI lets you transcribe audio into text interactively with a microphone or from files using a batch script.

PožadavkyPrerequisites

Jediným předpokladem je předplatné služby Azure Speech.The only prerequisite is an Azure Speech subscription. Pokud ho ještě nemáte, přečtěte si příručku k vytvoření nového předplatného.See the guide on creating a new subscription if you don't already have one.

Stažení a instalaceDownload and install

Pomocí těchto kroků nainstalujete rozhraní příkazového řádku pro rozpoznávání řeči ve Windows:Follow these steps to install the Speech CLI on Windows:

  1. Nainstalujte buď .NET Framework 4,7 nebo .NET Core 3,0Install either .NET Framework 4.7 or .NET Core 3.0
  2. Stáhněte si archiv zippro rozpoznávání řeči a pak ho rozbalte.Download the Speech CLI zip archive, then extract it.
  3. Přejít do kořenového adresáře spx-zips , který jste extrahovali ze staženého souboru, a extrahovat podadresář, který potřebujete ( spx-net471 pro .NET Framework 4,7 nebo spx-netcore-win-x64 pro .NET Core 3,0 na CPU x64).Go to the root directory spx-zips that you extracted from the download, and extract the subdirectory that you need (spx-net471 for .NET Framework 4.7, or spx-netcore-win-x64 for .NET Core 3.0 on an x64 CPU).

Na příkazovém řádku změňte adresář na toto umístění a potom zadejte spx nápovědu k rozhraní příkazového řádku pro rozpoznávání řeči.In the command prompt, change directory to this location, and then type spx to see help for the Speech CLI.

Poznámka

PowerShell při hledání příkazu nekontroluje místní adresář.Powershell does not check the local directory when looking for a command. V prostředí PowerShell změňte adresář na umístění spx a zavolejte nástroj zadáním .\spx .In Powershell, change directory to the location of spx and call the tool by entering .\spx. Pokud přidáte tento adresář do vaší cesty, PowerShell a příkazový řádek Windows se najde spx z libovolného adresáře bez zahrnutí .\ předpony.If you add this directory to your path, Powershell and the Windows command prompt will find spx from any directory without including the .\ prefix.

Vytvořit konfiguraci předplatnéhoCreate subscription config

Pokud chcete začít používat rozhraní příkazového řádku, musíte nejdřív zadat klíč předplatného pro rozpoznávání řeči a informace o oblasti.To start using the Speech CLI, you first need to enter your Speech subscription key and region information. Identifikátor vaší oblasti najdete na stránce podpory oblasti .See the region support page to find your region identifier. Jakmile budete mít svůj klíč předplatného a identifikátor oblasti (např.Once you have your subscription key and region identifier (ex. eastus, westus ) spusťte následující příkazy.eastus, westus), run the following commands.

spx config @key --set YOUR-SUBSCRIPTION-KEY
spx config @region --set YOUR-REGION-ID

Ověřování předplatného je nyní uloženo pro budoucí požadavky SPX.Your subscription authentication is now stored for future SPX requests. Pokud potřebujete některou z těchto uložených hodnot odebrat, spusťte spx config @region --clear nebo spx config @key --clear .If you need to remove either of these stored values, run spx config @region --clear or spx config @key --clear.

Povolit mikrofonEnable microphone

Připojte se k počítači mikrofonu a zapněte ho a vypněte všechny aplikace, které můžou mikrofon používat.Plug in and turn on your PC microphone, and turn off any apps that might also use the microphone. Některé počítače mají integrovaný mikrofon, zatímco jiné vyžadují konfiguraci zařízení Bluetooth.Some computers have a built-in microphone, while others require configuration of a Bluetooth device.

Spuštění funkce CLI pro rozpoznávání řečiRun the Speech CLI

Teď jste připraveni spustit rozhraní příkazového řádku pro rozpoznávání řeči z mikrofonu.Now you're ready to run the Speech CLI to recognize speech from your microphone.

  1. Spusťte aplikaci – z příkazového řádku přejděte do adresáře, který obsahuje binární soubor CLI rozpoznávání řeči, a zadejte:Start your app - From the command line, change to the directory that contains the Speech CLI binary file, and type:

    spx recognize --microphone
    

    Poznámka

    Rozpoznávání řeči je výchozím nastavením angličtiny.The Speech CLI defaults to English. V tabulce převod řeči na textmůžete zvolit jiný jazyk.You can choose a different language from the Speech-to-text table. Přidejte například --source de-DE pro rozpoznávání rozpoznávání řeči v němčině.For example, add --source de-DE to recognize German speech.

  2. Spusťte rozpoznávání – mluvte do mikrofonu.Start recognition - Speak into the microphone. V reálném čase uvidíte přepis svých slov na text.You will see transcription of your words into text in real-time. Rozpoznávání řeči se zastaví po určité době tichého běhu nebo po stisknutí kombinace kláves CTRL + C.The Speech CLI will stop after a period of silence, or when you press ctrl-C.

Další krokyNext steps

Další informace o dalších funkcích rozhraní příkazového řádku najdete dál v prozkoumání základních informací.Continue exploring the basics to learn about other features of the Speech CLI.

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo v, můžete si prohlédnout nebo stáhnout všechny ukázky sady Speech SDK na webu GitHub.If you prefer to jump right in, view or download all Speech SDK Go Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

PožadavkyPrerequisites

Než začnete:Before you get started:

Nastavení vašeho prostředíSetup your environment

Aktualizujte soubor. mod nejnovější verzí sady SDK přidáním tohoto řádku.Update the go.mod file with the latest SDK version by adding this line

require (
    github.com/Microsoft/cognitive-services-speech-sdk-go v1.12.1
)

Začínáme s některým často používaným kódemStart with some boilerplate code

  1. Obsah zdrojového souboru (např.) nahraďte sr-quickstart.go níže, což zahrnuje:Replace the contents of your source file (e.g. sr-quickstart.go) with the below, which includes:
  • definice balíčku Main"main" package definition
  • Import nezbytných modulů ze sady Speech SDKimporting the necessary modules from the Speech SDK
  • proměnné pro ukládání informací o předplatném, které se nahradí později v tomto rychlém startuvariables for storing the subscription information that will be replaced later in this quickstart
  • Jednoduchá implementace pomocí mikrofonu pro vstup zvukua simple implementation using the microphone for audio input
  • obslužné rutiny událostí pro různé události, ke kterým dochází při rozpoznávání řečievent handlers for various events that take place during a speech recognition
package recognizer

import (
    "bufio"
    "fmt"
    "os"

    "github.com/Microsoft/cognitive-services-speech-sdk-go/audio"
    "github.com/Microsoft/cognitive-services-speech-sdk-go/speech"
)

func recognizingHandler(event speech.SpeechRecognitionEventArgs) {
    defer event.Close()
    fmt.Println("Recognizing:", event.Result.Text)
}

func recognizedHandler(event speech.SpeechRecognitionEventArgs) {
    defer event.Close()
    fmt.Println("Recognized:", event.Result.Text)
}

func cancelledHandler(event speech.SpeechRecognitionCanceledEventArgs) {
    defer event.Close()
    fmt.Println("Received a cancellation: ", event.ErrorDetails)
}

func main() {
    subscription :=  "YOUR_SUBSCRIPTION_KEY"
    region := "YOUR_SUBSCRIPTIONKEY_REGION"

    audioConfig, err := audio.NewAudioConfigFromDefaultMicrophoneInput()
    if err != nil {
        fmt.Println("Got an error: ", err)
        return
    }
    defer audioConfig.Close()
    config, err := speech.NewSpeechConfigFromSubscription(subscription, region)
    if err != nil {
        fmt.Println("Got an error: ", err)
        return
    }
    defer config.Close()
    speechRecognizer, err := speech.NewSpeechRecognizerFromConfig(config, audioConfig)
    if err != nil {
        fmt.Println("Got an error: ", err)
        return
    }
    defer speechRecognizer.Close()
    speechRecognizer.Recognizing(recognizingHandler)
    speechRecognizer.Recognized(recognizedHandler)
    speechRecognizer.Canceled(cancelledHandler)
    speechRecognizer.StartContinuousRecognitionAsync()
    defer speechRecognizer.StopContinuousRecognitionAsync()
    bufio.NewReader(os.Stdin).ReadBytes('\n')
}

YOUR_SUBSCRIPTION_KEYHodnoty a nahraďte YOUR_SUBSCRIPTIONKEY_REGION skutečnými hodnotami z prostředku řeči.Replace the YOUR_SUBSCRIPTION_KEY and YOUR_SUBSCRIPTIONKEY_REGION values with actual values from the Speech resource.

  • Přejděte do Azure Portal a otevřete prostředek řeči.Navigate to the Azure portal, and open the Speech resource
  • Pod klíčem nalevo jsou k dispozici dva dostupné klíče předplatného.Under the Keys on the left, there are two available subscription keys
    • Použijte buď jednu jako YOUR_SUBSCRIPTION_KEY náhradu hodnoty.Use either one as the YOUR_SUBSCRIPTION_KEY value replacement
  • V přehledu vlevo si všimněte oblasti a namapujte ji na identifikátor oblasti.Under the Overview on the left, note the region and map it to the region identifier
  • Jako náhradu hodnoty použijte identifikátor oblasti YOUR_SUBSCRIPTIONKEY_REGION , například: "westus" pro západní USAUse the Region identifier as the YOUR_SUBSCRIPTIONKEY_REGION value replacement, for example: "westus" for West US

Vysvětlení kóduCode explanation

Klíč předplatného řeči a oblast jsou nutné k vytvoření objektu konfigurace řeči.The Speech subscription key and region are required to create a speech configuration object. Objekt konfigurace je nutný k vytvoření instance objektu pro rozpoznávání řeči.The configuration object is needed to instantiate a speech recognizer object.

Instance nástroje pro rozpoznávání nabízí více způsobů rozpoznávání řeči.The recognizer instance exposes multiple ways to recognize speech. V tomto příkladu je rozpoznávání řeči nepřetržitě rozpoznáno.In this example, speech is continuously recognized. Tato funkce umožňuje službě rozpoznávání řeči zjistit, že posíláte mnoho frází pro rozpoznávání, a když se program ukončí a přestane rozpoznávat řeč.This functionality lets the Speech service know that you're sending many phrases for recognition, and when the program terminates to stop recognizing speech. V případě, že se výsledky vrátí, kód je zapíše do konzoly.As results are yielded, the code will write them to the console.

Sestavení a spuštěníBuild and run

Nyní jste nastavili sestavení projektu a testování rozpoznávání řeči pomocí služby Speech.You're now set up to build your project and test speech recognition using the Speech service.

  1. Sestavte projekt, např. "jít Build" .Build your project, e.g. "go build"
  2. Spusťte modul a vymluvte frázi nebo větu do mikrofonu zařízení.Run the module and speak a phrase or sentence into your device's microphone. Váš hlas se přenáší do služby Speech a přepisu na text, který se zobrazí ve výstupu.Your speech is transmitted to the Speech service and transcribed to text, which appears in the output.

Poznámka

Sada Speech SDK bude standardně rozpoznána pomocí en-US pro daný jazyk. informace o výběru zdrojového jazyka najdete v tématu určení zdrojového jazyka pro převod řeči na text .The Speech SDK will default to recognizing using en-us for the language, see Specify source language for speech to text for information on choosing the source language.

Další krokyNext steps

V tomto rychlém startu použijete sadu Speech SDK k interaktivnímu rozpoznávání řeči od vstupu mikrofonu a získáte přepis textu ze zachyceného zvuku.In this quickstart, you use the Speech SDK to interactively recognize speech from a microphone input, and get the text transcription from captured audio. Tato funkce se dá snadno integrovat do aplikací nebo zařízení pro běžné úlohy rozpoznávání, jako jsou zdlouhavého přepisování konverzace.It's easy to integrate this feature into your apps or devices for common recognition tasks, such as transcribing conversations. Dá se použít také pro složitější integrace, jako je použití bot frameworku se sadou Speech SDK pro vytváření hlasových asistentů.It can also be used for more complex integrations, like using the Bot Framework with the Speech SDK to build voice assistants.

Po splnění několika požadavků se rozpoznávání řeči pouze v mikrofonu provede čtyřmi kroky:After satisfying a few prerequisites, recognizing speech from a microphone only takes four steps:

  • Vytvořte SpeechConfig objekt z klíče a oblasti předplatného.Create a SpeechConfig object from your subscription key and region.
  • Vytvořte SpeechRecognizer objekt pomocí výše uvedeného SpeechConfig objektu.Create a SpeechRecognizer object using the SpeechConfig object from above.
  • Pomocí SpeechRecognizer objektu spusťte proces rozpoznávání pro jeden utterance.Using the SpeechRecognizer object, start the recognition process for a single utterance.
  • Zkontrolujte SpeechRecognitionResult vrácenou.Inspect the SpeechRecognitionResult returned.

Pokud si přejete přejít přímo do, zobrazte si nebo Stáhněte si ukázky JavaScriptu pro sadu Speech SDK na GitHubu.If you prefer to jump right in, view or download all Speech SDK JavaScript Samples on GitHub. V opačném případě můžeme začít.Otherwise, let's get started.

PožadavkyPrerequisites

Než začnete:Before you get started:

Vytvoření složky nového webuCreate a new Website folder

Vytvořte novou prázdnou složku.Create a new, empty folder. Pokud chcete ukázku hostovat na webovém serveru, ujistěte se, že má webový server k této složce přístup.In case you want to host the sample on a web server, make sure that the web server can access the folder.

Rozbalení sady Speech SDK pro JavaScript do příslušné složkyUnpack the Speech SDK for JavaScript into that folder

Stáhněte si sadu Speech SDK jako balíček .zip a rozbalte ho do nově vytvořené složky.Download the Speech SDK as a .zip package and unpack it into the newly created folder. Výsledkem je, že se dva soubory rozbalí microsoft.cognitiveservices.speech.sdk.bundle.js a microsoft.cognitiveservices.speech.sdk.bundle.js.map .This results in two files being unpacked, microsoft.cognitiveservices.speech.sdk.bundle.js and microsoft.cognitiveservices.speech.sdk.bundle.js.map. Druhý soubor je nepovinný a je vhodný pro ladění kódu SDK.The latter file is optional, and is useful for debugging into the SDK code.

Vytvoření stránky index.htmlCreate an index.html page

Vytvořte ve složce nový soubor index.html a otevřete ho v textovém editoru.Create a new file in the folder, named index.html and open this file with a text editor.

  1. Vytvořte následující kostru HTML:Create the following HTML skeleton:
<!DOCTYPE html>
<html>
<head>
  <title>Microsoft Cognitive Services Speech SDK JavaScript Quickstart</title>
  <meta charset="utf-8" />
</head>
<body style="font-family:'Helvetica Neue',Helvetica,Arial,sans-serif; font-size:13px;">
  <!-- <uidiv> -->
  <div id="warning">
    <h1 style="font-weight:500;">Speech Recognition Speech SDK not found (microsoft.cognitiveservices.speech.sdk.bundle.js missing).</h1>
  </div>
  
  <div id="content" style="display:none">
    <table width="100%">
      <tr>
        <td></td>
        <td><h1 style="font-weight:500;">Microsoft Cognitive Services Speech SDK JavaScript Quickstart</h1></td>
      </tr>
      <tr>
        <td align="right"><a href="https://docs.microsoft.com/azure/cognitive-services/speech-service/get-started" target="_blank">Subscription</a>:</td>
        <td><input id="subscriptionKey" type="text" size="40" value="subscription"></td>
      </tr>
      <tr>
        <td align="right">Region</td>
        <td><input id="serviceRegion" type="text" size="40" value="YourServiceRegion"></td>
      </tr>
      <tr>
        <td></td>
        <td><button id="startRecognizeOnceAsyncButton">Start recognition</button></td>
      </tr>
      <tr>
        <td align="right" valign="top">Results</td>
        <td><textarea id="phraseDiv" style="display: inline-block;width:500px;height:200px"></textarea></td>
      </tr>
    </table>
  </div>
  <!-- </uidiv> -->

  <!-- <speechsdkref> -->
  <!-- Speech SDK reference sdk. -->
  <script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>
  <!-- </speechsdkref> -->

  <!-- <authorizationfunction> -->
  <!-- Speech SDK Authorization token -->
  <script>
  // Note: Replace the URL with a valid endpoint to retrieve
  //       authorization tokens for your subscription.
  var authorizationEndpoint = "token.php";

  function RequestAuthorizationToken() {
    if (authorizationEndpoint) {
      var a = new XMLHttpRequest();
      a.open("GET", authorizationEndpoint);
      a.setRequestHeader("Content-Type", "application/x-www-form-urlencoded");
      a.send("");
      a.onload = function() {
          var token = JSON.parse(atob(this.responseText.split(".")[1]));
          serviceRegion.value = token.region;
          authorizationToken = this.responseText;
          subscriptionKey.disabled = true;
          subscriptionKey.value = "using authorization token (hit F5 to refresh)";
          console.log("Got an authorization token: " + token);
      }
    }
  }
  </script>
  <!-- </authorizationfunction> -->

  <!-- <quickstartcode> -->
  <!-- Speech SDK USAGE -->
  <script>
    // status fields and start button in UI
    var phraseDiv;
    var startRecognizeOnceAsyncButton;

    // subscription key and region for speech services.
    var subscriptionKey, serviceRegion;
    var authorizationToken;
    var SpeechSDK;
    var recognizer;

    document.addEventListener("DOMContentLoaded", function () {
      startRecognizeOnceAsyncButton = document.getElementById("startRecognizeOnceAsyncButton");
      subscriptionKey = document.getElementById("subscriptionKey");
      serviceRegion = document.getElementById("serviceRegion");
      phraseDiv = document.getElementById("phraseDiv");

      startRecognizeOnceAsyncButton.addEventListener("click", function () {
        startRecognizeOnceAsyncButton.disabled = true;
        phraseDiv.innerHTML = "";

        // if we got an authorization token, use the token. Otherwise use the provided subscription key
        var speechConfig;
        if (authorizationToken) {
          speechConfig = SpeechSDK.SpeechConfig.fromAuthorizationToken(authorizationToken, serviceRegion.value);
        } else {
          if (subscriptionKey.value === "" || subscriptionKey.value === "subscription") {
            alert("Please enter your Microsoft Cognitive Services Speech subscription key!");
            return;
          }
          speechConfig = SpeechSDK.SpeechConfig.fromSubscription(subscriptionKey.value, serviceRegion.value);
        }

        speechConfig.speechRecognitionLanguage = "en-US";
        var audioConfig  = SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
        recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);

        recognizer.recognizeOnceAsync(
          function (result) {
            startRecognizeOnceAsyncButton.disabled = false;
            phraseDiv.innerHTML += result.text;
            window.console.log(result);

            recognizer.close();
            recognizer = undefined;
          },
          function (err) {
            startRecognizeOnceAsyncButton.disabled = false;
            phraseDiv.innerHTML += err;
            window.console.log(err);

            recognizer.close();
            recognizer = undefined;
          });
      });

      if (!!window.SpeechSDK) {
        SpeechSDK = window.SpeechSDK;
        startRecognizeOnceAsyncButton.disabled = false;

        document.getElementById('content').style.display = 'block';
        document.getElementById('warning').style.display = 'none';

        // in case we have a function for getting an authorization token, call it.
        if (typeof RequestAuthorizationToken === "function") {
            RequestAuthorizationToken();
        }
      }
    });
  </script>
  <!-- </quickstartcode> -->
</body>
</html>

Vytvoření zdroje tokenu (volitelné)Create the token source (optional)

Pokud chcete webovou stránku hostovat na webovém serveru, můžete pro ukázkovou aplikaci volitelně zadat zdroj tokenu.In case you want to host the web page on a web server, you can optionally provide a token source for your demo application. Díky tomu váš klíč předplatného nikdy neopustí váš server a uživatelé budou moct využívat řečové funkce, aniž by sami museli zadávat jakýkoli autorizační kód.That way, your subscription key will never leave your server while allowing users to use speech capabilities without entering any authorization code themselves.

Vytvořte nový soubor s názvem token.php.Create a new file named token.php. V tomto příkladu předpokládáme, že váš webový server podporuje skriptovací jazyk PHP s povoleným kudrlinkou.In this example we assume your web server supports the PHP scripting language with curl enabled. Zadejte následující kód:Enter the following code:

<?php
header('Access-Control-Allow-Origin: ' . $_SERVER['SERVER_NAME']);

// Replace with your own subscription key and service region (e.g., "westus").
$subscriptionKey = 'YourSubscriptionKey';
$region = 'YourServiceRegion';

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://' . $region . '.api.cognitive.microsoft.com/sts/v1.0/issueToken');
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, '{}');
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json', 'Ocp-Apim-Subscription-Key: ' . $subscriptionKey));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
echo curl_exec($ch);
?>

Poznámka

Autorizační tokeny mají pouze omezenou dobu života.Authorization tokens only have a limited lifetime. Tento zjednodušený příklad neukazuje, jak autorizační tokeny automaticky aktualizovat.This simplified example does not show how to refresh authorization tokens automatically. Jako uživatel můžete stránku ručně znovu načíst nebo aktualizovat stisknutím klávesy F5.As a user, you can manually reload the page or hit F5 to refresh.

Místní sestavení a spuštění ukázkyBuild and run the sample locally

Pokud chcete aplikaci spustit, dvakrát klikněte na soubor index.html nebo tento soubor otevřete v oblíbeném webovém prohlížeči.To launch the app, double-click on the index.html file or open index.html with your favorite web browser. Zobrazí se jednoduché grafické uživatelské rozhraní, kde můžete zadat klíč předplatného a oblast a aktivovat rozpoznávání s využitím mikrofonu.It will present a simple GUI allowing you to enter your subscription key and region and trigger a recognition using the microphone.

Poznámka

Tato metoda nefunguje v prohlížeči Safari.This method doesn't work on the Safari browser. V prohlížeči Safari musí být Ukázková webová stránka hostovaná na webovém serveru. Safari nepovoluje webům načtených z místního souboru, aby používaly mikrofon.On Safari, the sample web page needs to be hosted on a web server; Safari doesn't allow websites loaded from a local file to use the microphone.

Sestavení a spuštění ukázky pomocí webového serveruBuild and run the sample via a web server

Pokud chcete aplikaci spustit, otevřete oblíbený webový prohlížeč a přejděte na veřejnou adresu URL, na které složku hostujete. Zadejte vaši oblast a aktivujte rozpoznávání s využitím mikrofonu.To launch your app, open your favorite web browser and point it to the public URL that you host the folder on, enter your region, and trigger a recognition using the microphone. Pokud je tak nakonfigurovaná, aplikace získá token z vašeho zdroje tokenu.If configured, it will acquire a token from your token source.

Další krokyNext steps

V rámci tohoto základního vědomí rozpoznávání řeči můžete pokračovat v zkoumání základních informací o běžných funkcích a úlohách v sadě Speech SDK.With this base knowledge of speech recognition, continue exploring the basics to learn about common functionality and tasks within the Speech SDK.

Zobrazení nebo stažení ukázek sady Speech SDK na GitHubu.View or download all Speech SDK Samples on GitHub.

Další podpora jazyků a platforemAdditional language and platform support

Pokud jste na tuto kartu klikli, pravděpodobně jste v oblíbeném programovacím jazyce nezobrazili rychlý Start.If you've clicked this tab, you probably didn't see a quickstart in your favorite programming language. Nedělejte si starosti, máme další materiály pro rychlý Start a ukázky kódu dostupné na GitHubu.Don't worry, we have additional quickstart materials and code samples available on GitHub. Pomocí tabulky Najděte správnou ukázku kombinace programovacího jazyka a platformy/OS.Use the table to find the right sample for your programming language and platform/OS combination.

JazykLanguage Další rychlé startyAdditional Quickstarts Ukázky kódůCode samples
C#C# Ze souboru, z objektu BLOBFrom file, From blob .NET Framework, .NET Core, UWP, Unity, Xamarin.NET Framework, .NET Core, UWP, Unity, Xamarin
C++C++ Ze souboru, z objektu BLOBFrom file, From blob Windows, Linux, MacOSWindows, Linux, macOS
JavaJava Ze souboru, z objektu BLOBFrom file, From blob Android, JREAndroid, JRE
JavaScriptJavaScript Prohlížeč z MIC, Node. js ze souboruBrowser from mic, Node.js from file Windows, Linux, macOSWindows, Linux, macOS
Objective-CObjective-C iOS, MacOSiOS, macOS iOS, MacOSiOS, macOS
PythonPython Ze souboru, z objektu BLOBFrom file, From blob Windows, Linux, macOSWindows, Linux, macOS
SwiftSwift iOS, MacOSiOS, macOS iOS, MacOSiOS, macOS