Snabbstart: Taligenkänning med Speech SDK för Node.jsQuickstart: Recognize speech with the Speech SDK for Node.js

I den här artikeln beskrivs hur du skapar ett Node.js-projekt med hjälp av JavaScript-bindningen i Speech SDK för Azure Cognitive Services för att transkribera tal till text.This article shows you how to create a Node.js project by using the JavaScript binding of the Speech SDK for Azure Cognitive Services to transcribe speech to text. Programmet är baserat på Speech SDK för JavaScript.The application is based on the Speech SDK for JavaScript.

FörutsättningarPrerequisites

Skapa ett nytt projektCreate a new project

Skapa en ny mapp och initiera projektet:Create a new folder and initialize the project:

npm init -f

Med det här kommandot initierar du filen package.json med standardvärden.This command initializes the package.json files with default values. Du vill förmodligen redigera den här filen senare.You'll probably want to edit this file later.

Installera Speech SDKInstall the Speech SDK

Lägg till Speech SDK i Node.js-projektet:Add the Speech SDK to your Node.js project:

npm install microsoft-cognitiveservices-speech-sdk

Med det här kommandot laddar du ned och installerar den senaste versionen av Speech SDK och eventuella nödvändiga förutsättningar från npmjs.This command downloads and installs the latest version of the Speech SDK and any required prerequisites from npmjs. SDK:t installeras i katalogen node_modules i projektmappen.The SDK installs in the node_modules directory inside your project folder.

Använda Speech SDKUse the Speech SDK

Skapa en ny fil i mappen med namnet index.js och öppna filen i en textredigerare.Create a new file in the folder, named index.js, and open this file with a text editor.

Anteckning

I Node.js har inte Speech SDK stöd för mikrofonen eller fildatatypen.In Node.js, the Speech SDK doesn't support the microphone or the File data type. Båda stöds endast på webbläsare.Both are only supported on browsers. Använd i stället Stream-gränssnittet till Speech SDK, antingen via AudioInputStream.createPushStream() eller AudioInputStream.createPullStream().Instead, use the Stream interface to the Speech SDK, either through AudioInputStream.createPushStream() or AudioInputStream.createPullStream().

I det här exemplet använder vi gränssnittet PushAudioInputStream.In this example, we use the PushAudioInputStream interface.

Lägg till följande JavaScript-kod:Add this JavaScript code:

"use strict";

// pull in the required packages.
var sdk = require("microsoft-cognitiveservices-speech-sdk");
var fs = require("fs");

// replace with your own subscription key,
// service region (e.g., "westus"), and
// the name of the file you want to run
// through the speech recognizer.
var subscriptionKey = "YourSubscriptionKey";
var serviceRegion = "YourServiceRegion"; // e.g., "westus"
var filename = "YourAudioFile.wav"; // 16000 Hz, Mono

// create the push stream we need for the speech sdk.
var pushStream = sdk.AudioInputStream.createPushStream();

// open the file and push it to the push stream.
fs.createReadStream(filename).on('data', function(arrayBuffer) {
  pushStream.write(arrayBuffer.slice());
}).on('end', function() {
  pushStream.close();
});

// we are done with the setup
console.log("Now recognizing from: " + filename);

// now create the audio-config pointing to our stream and
// the speech config specifying the language.
var audioConfig = sdk.AudioConfig.fromStreamInput(pushStream);
var speechConfig = sdk.SpeechConfig.fromSubscription(subscriptionKey, serviceRegion);

// setting the recognition language to English.
speechConfig.speechRecognitionLanguage = "en-US";

// create the speech recognizer.
var recognizer = new sdk.SpeechRecognizer(speechConfig, audioConfig);

// start the recognizer and wait for a result.
recognizer.recognizeOnceAsync(
  function (result) {
    console.log(result);

    recognizer.close();
    recognizer = undefined;
  },
  function (err) {
    console.trace("err - " + err);

    recognizer.close();
    recognizer = undefined;
  });

Kör exempletRun the sample

Om du vill öppna appen ändrar du YourSubscriptionKey, YourServiceRegion och YourAudioFile.wav till din konfiguration.To open the app, adapt YourSubscriptionKey, YourServiceRegion, and YourAudioFile.wav to your configuration. Kör den sedan med följande kommando:Then run it by calling this command:

node index.js

Då utlöses ett erkännande med hjälp av det angivna filnamnet.It triggers a recognition by using the provided filename. Utdata visas på konsolen.And it presents the output on the console.

Här visas utdata när du kör index.js efter att du har uppdaterat prenumerationsnyckeln och använder filen whatstheweatherlike.wav:This sample is the output when you run index.js after you update the subscription key and use the file whatstheweatherlike.wav:

SpeechRecognitionResult {
  "privResultId": "9E30EEBD41AC4571BB77CF9164441F46",
  "privReason": 3,
  "privText": "What's the weather like?",
  "privDuration": 15900000,
  "privOffset": 300000,
  "privErrorDetails": null,
  "privJson": {
    "RecognitionStatus": "Success",
    "DisplayText": "What's the weather like?",
    "Offset": 300000,
    "Duration": 15900000
  },
  "privProperties": null
}

Installera och använda Speech SDK med Visual Studio CodeInstall and use the Speech SDK with Visual Studio Code

Du kan också köra exemplet från Visual Studio Code.You can also run the sample from Visual Studio Code. Följ stegen nedan för att installera, öppna och köra snabbstarten:Follow these steps to install, open, and run the quickstart:

  1. Starta Visual Studio Code.Start Visual Studio Code. Välj Öppna mapp.Select Open Folder. Bläddra sedan till snabbstartsmappen.Then browse to the quickstart folder.

    Öppna mappen

  2. Öppna en terminal i Visual Studio Code.Open a terminal in Visual Studio Code.

    Terminalfönstret

  3. Kör npm för att installera beroenden.Run npm to install the dependencies.

    Installera npm

  4. Nu är du redo att öppna index.js och konfigurera en brytpunkt.Now you're ready to open index.jsand set a breakpoint.

    index.js med en brytpunkt på rad 16

  5. Om du vill börja felsöka trycker du antingen på F5 eller så väljer du Felsöka/Starta felsökning från menyn.To start debugging, either select F5 or select Debug/Start Debugging from the menu.

    Felsökningsmenyn

  6. När du kommer till en brytpunkt kan du inspektera anropsstacken och variablerna.When a breakpoint is hit, you can inspect the call stack and variables.

    Felsökare

  7. Alla utdata visas i konsolfönstret för felsökningen.Any output shows in the debug console window.

    Felsökningskonsolen

Nästa stegNext steps