Snabbstart: Installera Speech SDK

Referensdokumentation Paket (NuGet) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för C#.

Kodexempel i dokumentationen skrivs i C# 8 och körs på .NET Standard 2.0.

Plattformskrav

Speech SDK för C# är kompatibelt med Windows, Linux och macOS.

Varning

Den här artikeln refererar till CentOS, en Linux-distribution som närmar sig EOL-status (End Of Life). Överväg att använda och planera i enlighet med detta. Mer information finns i CentOS End Of Life-vägledningen.

I Windows måste du använda 64-bitars målarkitekturen. Windows 10 eller senare krävs.

Installera Microsoft Visual C++ Redistributable för Visual Studio 2015, 2017, 2019 och 2022 för din plattform. Att installera det här paketet för första gången kan kräva en omstart.

Installera Speech SDK för C#

Speech SDK för C# är tillgängligt som ett NuGet-paket och implementerar .NET Standard 2.0. Mer information finns i Microsoft.CognitiveServices.Speech.

Speech SDK för C# kan installeras från .NET CLI med hjälp av följande dotnet add kommando:

dotnet add package Microsoft.CognitiveServices.Speech

Du kan följa dessa guider för fler alternativ.

Den här guiden visar hur du installerar Speech SDK för en .NET Framework-konsolapp (Windows).

Den här guiden kräver:

Skapa ett Visual Studio-projekt och installera Speech SDK

Du måste installera NuGet-paketet för Speech SDK så att du kan referera till det i koden. För att göra det kan du först behöva skapa ett helloworld-projekt . Om du redan har ett projekt med .NET Desktop Development-arbetsbelastningen tillgänglig kan du använda det projektet och gå vidare till Använd NuGet Package Manager för att installera Speech SDK.

Skapa ett helloworld-projekt

  1. Öppna Visual Studio.

  2. Under Kom igång väljer du Skapa ett nytt projekt.

  3. I Skapa ett nytt projekt väljer du Konsolapp (.NET Framework) och sedan Nästa.

  4. I Konfigurera det nya projektet anger du helloworld för Projektnamn, väljer eller skapar katalogsökvägen i Plats och väljer sedan Skapa.

  5. I menyraden i Visual Studio väljer du Verktyg>Hämta verktyg och funktioner. Det här steget öppnar Visual Studio Installer och visar dialogrutan Ändra .

  6. Kontrollera om arbetsbelastningen för .NET-skrivbordsutveckling är tillgänglig. Om arbetsbelastningen inte är installerad väljer du den och väljer sedan Ändra för att starta installationen. Det kan ta några minuter att ladda ned och installera.

    Om .NET Desktop-utveckling redan har valts väljer du Stäng för att stänga dialogrutan.

    Skärmbild som visar aktivering av .NET-skrivbordsutveckling.

  7. Stäng Visual Studio Installer.

Installera Speech SDK med Hjälp av NuGet Package Manager

  1. Högerklicka på helloworld-projektet i Solution Explorer och välj sedan Hantera NuGet-paket för att visa NuGet Package Manager.

  2. Leta reda på listrutan Paketkälla i det övre högra hörnet och kontrollera att nuget.org är markerat.

    Skärmbild som visar NuGet Package Manager.

  3. I det övre vänstra hörnet väljer du Bläddra.

  4. I sökrutan anger du Microsoft.CognitiveServices.Speech och väljer Retur.

  5. I sökresultaten väljer du paketet Microsoft.CognitiveServices.Speech och väljer sedan Installera för att installera den senaste stabila versionen.

    Skärmbild som visar hur du installerar NuGet-paketet Microsoft.CognitiveServices.Speech.

  6. Acceptera alla avtal och licenser för att starta installationen.

    När paketet har installerats visas en bekräftelse i fönstret Package Manager Console .

Välj målarkitektur

Skapa och köra konsolprogrammet genom att skapa en plattformskonfiguration som matchar datorns arkitektur.

  1. På menyn väljer du Skapa>Configuration Manager. Dialogrutan Configuration Manager visas.

  2. I listrutan Aktiv lösningsplattform väljer du Nytt. Dialogrutan Ny lösningsplattform visas.

    Skärmbild som visar dialogrutan Configuration Manager.

  3. I listrutan Typ eller välj den nya plattformen :

    • Om du kör 64-bitars Windows väljer du x64.
    • Om du kör 32-bitars Windows väljer du x86.
  4. Välj OK och sedan Stäng.

Referensdokumentation Paket (NuGet) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för C++.

Plattformskrav

Speech SDK för C++ är kompatibelt med Windows, Linux och macOS.

I Windows måste du använda 64-bitars målarkitekturen. Windows 10 eller senare krävs.

Installera Microsoft Visual C++ Redistributable för Visual Studio 2015, 2017, 2019 och 2022 för din plattform. Att installera det här paketet för första gången kan kräva en omstart.

Installera Speech SDK för C++

Speech SDK för C++ är tillgängligt som ett NuGet-paket. Mer information finns i Microsoft.CognitiveServices.Speech.

Speech SDK för C++ kan installeras från .NET CLI med hjälp av följande dotnet add kommando:

dotnet add package Microsoft.CognitiveServices.Speech

Du kan följa dessa guider för fler alternativ.

Den här guiden visar hur du installerar Speech SDK för Linux.

Använd följande procedur för att ladda ned och installera SDK: et. Stegen omfattar nedladdning av nödvändiga bibliotek och huvudfiler som en .tar fil.

  1. Välj en katalog för Speech SDK-filerna. Ange miljövariabeln så att den SPEECHSDK_ROOT pekar på den katalogen. Den här variabeln gör det enkelt att referera till katalogen i framtida kommandon.

    Kör följande kommando för att använda katalogen speechsdk i din hemkatalog:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Skapa katalogen om den inte finns:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Ladda ned och extrahera det .tar.gz arkiv som innehåller Speech SDK-binärfilerna:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validera innehållet i toppnivåkatalogen i det extraherade paketet:

    ls -l "$SPEECHSDK_ROOT"
    

    Kataloglistan bör innehålla partnermeddelanden och licensfiler. Listan bör också innehålla en inkluderingskatalog som innehåller huvudfiler (.h) och en lib-katalog som innehåller bibliotek för arm32, arm64, x64 och x86.

    Sökväg beskrivning
    license.md Licens
    ThirdPartyNotices.md Partnermeddelanden
    REDIST.txt Omdistributionsmeddelande
    Inkluderar Nödvändiga huvudfiler för C++
    lib/arm32 Internt bibliotek för ARM32 som krävs för att länka ditt program
    lib/arm64 Internt bibliotek för ARM64 som krävs för att länka ditt program
    lib/x64 Internt bibliotek för x64 krävs för att länka ditt program
    lib/x86 Internt bibliotek för x86 krävs för att länka ditt program

Referensdokumentation Paket (Go) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för Go.

Plattformskrav

Varning

Den här artikeln refererar till CentOS, en Linux-distribution som närmar sig EOL-status (End Of Life). Överväg att använda och planera i enlighet med detta. Mer information finns i CentOS End Of Life-vägledningen.

Speech SDK för Go stöder följande distributioner i x64-arkitekturen:

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 7

Viktigt!

Använd den senaste LTS-versionen av Linux-distributionen. Om du till exempel använder Ubuntu 20.04 LTS använder du den senaste versionen av Ubuntu 20.04.X.

Speech SDK beror på följande Linux-systembibliotek:

  • Delade bibliotek i GNU C-biblioteket, inklusive POSIX Threads Programming-biblioteket, libpthreads.
  • OpenSSL-biblioteket (libssl) version 1.x och certifikat (ca-certificates).
  • Det delade biblioteket för ALSA-program (libasound).

Du bör också installera ca-certificates för att upprätta en säker websocket och undvika felet WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED .

Viktigt!

Speech SDK stöder ännu inte OpenSSL 3.0, som är standard i Ubuntu 22.04 och Debian 12.

Kör dessa kommandon:

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Installera den binära Go-versionen 1.13 eller senare.

Installera Speech SDK för Go

Använd följande procedur för att ladda ned och installera SDK: et. Stegen omfattar nedladdning av nödvändiga bibliotek och huvudfiler som en .tar fil.

  1. Välj en katalog för Speech SDK-filerna. Ange miljövariabeln så att den SPEECHSDK_ROOT pekar på den katalogen. Den här variabeln gör det enkelt att referera till katalogen i framtida kommandon.

    Kör följande kommando för att använda katalogen speechsdk i din hemkatalog:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Skapa katalogen om den inte finns:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Ladda ned och extrahera det .tar.gz arkiv som innehåller Speech SDK-binärfilerna:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validera innehållet i toppnivåkatalogen i det extraherade paketet:

    ls -l "$SPEECHSDK_ROOT"
    

    Kataloglistan bör innehålla partnermeddelanden och licensfiler. Listan bör också innehålla en inkluderingskatalog som innehåller huvudfiler (.h) och en lib-katalog som innehåller bibliotek för arm32, arm64, x64 och x86.

    Sökväg beskrivning
    license.md Licens
    ThirdPartyNotices.md Partnermeddelanden
    REDIST.txt Omdistributionsmeddelande
    Inkluderar Nödvändiga huvudfiler för C++
    lib/arm32 Internt bibliotek för ARM32 som krävs för att länka ditt program
    lib/arm64 Internt bibliotek för ARM64 som krävs för att länka ditt program
    lib/x64 Internt bibliotek för x64 krävs för att länka ditt program
    lib/x86 Internt bibliotek för x86 krävs för att länka ditt program

Konfigurera Go-miljön

Följande steg gör det möjligt för Go-miljön att hitta Speech SDK.

  1. Eftersom bindningarna förlitar sig på cgomåste du ange miljövariablerna så att Go kan hitta SDK:et.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Viktigt!

    Ersätt <architecture> med processorarkitekturen för processorn: x86, x64, arm32eller arm64.

  2. Om du vill köra program och SDK måste du tala om för operativsystemet var biblioteken finns.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Viktigt!

    Ersätt <architecture> med processorarkitekturen för processorn: x86, x64, arm32eller arm64.

Referensdokumentation | Ytterligare exempel på GitHub

I den här snabbstarten installerar du Speech SDK för Java.

Plattformskrav

Välj målmiljö:

Speech SDK för Java är kompatibelt med Windows, Linux och macOS.

I Windows måste du använda 64-bitars målarkitekturen. Windows 10 eller senare krävs.

Installera Microsoft Visual C++ Redistributable för Visual Studio 2015, 2017, 2019 och 2022 för din plattform. Att installera det här paketet för första gången kan kräva en omstart.

Speech SDK för Java stöder inte Windows på ARM64.

Installera ett Java Development Kit, till exempel Azul Zulu OpenJDK. Microsoft Build of OpenJDK eller din önskade JDK bör också fungera.

Installera Speech SDK för Java

Vissa av instruktionerna använder en specifik SDK-version, till exempel 1.24.2. Om du vill kontrollera den senaste versionen söker du på vår GitHub-lagringsplats.

Välj målmiljö:

Den här guiden visar hur du installerar Speech SDK för Java på Java Runtime.

Operativsystem som stöds

Speech SDK för Java-paketet är tillgängligt för dessa operativsystem:

Följ de här stegen för att installera Speech SDK för Java med Apache Maven:

  1. Installera Apache Maven.

  2. Öppna en kommandotolk där du vill ha det nya projektet och skapa en ny pom.xml fil.

  3. Kopiera följande XML-innehåll till pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.36.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Kör följande Maven-kommando för att installera Speech SDK och beroenden.

    mvn clean dependency:copy-dependencies
    

Referensdokumentation Paket (npm) | Ytterligare exempel på GitHub-bibliotekets källkod | |

I den här snabbstarten installerar du Speech SDK för JavaScript.

Speech SDK för JavaScript är tillgängligt som ett npm-paket. Se microsoft-cognitiveservices-speech-sdk och dess tillhörande GitHub-lagringsplats cognitive-services-speech-sdk-js.

Plattformskrav

Förstå arkitekturkonsekvenserna mellan Node.js och klientwebbläsare. Dokumentobjektmodellen (DOM) är till exempel inte tillgänglig för program på serversidan. Det Node.js filsystemet är inte tillgängligt för program på klientsidan.

Installera Speech SDK för JavaScript

Beroende på målmiljön använder du någon av följande guider:

Den här guiden visar hur du installerar Speech SDK för JavaScript för användning med Node.js.

  1. Installera Node.js.

  2. Skapa en ny katalog, kör npm initoch gå igenom anvisningarna.

  3. Kör följande npm install kommando för att installera Speech SDK för JavaScript:

    npm install microsoft-cognitiveservices-speech-sdk
    

Mer information finns i Node.js exempel.

Använda Speech SDK

  • Lägg till följande import-instruktion för att använda Speech SDK i ditt JavaScript-projekt:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Mer information om importfinns i Exportera och importera på JavaScript-webbplatsen.

Du kan också använda en kräv-instruktion:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Referensdokumentationspaket (ladda ned) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för Objective-C.

Dricks

Mer information om hur du använder Speech SDK för Swift finns i Importera Objective-C till Swift.

Installera Speech SDK för Objective-C

Speech SDK för Objective-C är tillgängligt internt som ett CocoaPod-paket för Mac x64- och ARM-baserade system.

Systemkrav för Mac:

  • En macOS-version 10.14 eller senare

MacOS CocoaPod-paketet är tillgängligt för nedladdning och användning med Xcode 9.4.1 eller senare IDE (Integrated Development Environment).

  1. Gå till Xcode-katalogen där projektfilen .xcodeproj finns.

  2. Kör pod init för att skapa en poddfil med namnet Podfile.

  3. Ersätt innehållet i Podfile med följande innehåll. target Uppdatera namnet från AppName till namnet på din app. Uppdatera plattformen eller poddversionen efter behov.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.36.0'
    end
    
  4. Kör pod install för att installera Speech SDK.

Alternativt kan du ladda ned den binära CocoaPod och extrahera innehållet. I Xcode-projektet lägger du till en referens till den extraherade mappen MicrosoftCognitiveServicesSpeech.xcframework och dess innehåll.

Kommentar

.NET-utvecklare kan skapa inbyggda macOS-program med hjälp av Xamarin.Mac-programramverket. Mer information finns i Xamarin.Mac.

Referensdokumentationspaket (ladda ned) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för Swift.

Dricks

Mer information om hur du använder Speech SDK för Swift finns i Importera Objective-C till Swift.

Installera Speech SDK för Swift

Speech SDK för Swift är tillgängligt internt som ett CocoaPod-paket för Mac x64- och ARM-baserade system.

Systemkrav för Mac:

  • En macOS-version 10.14 eller senare

MacOS CocoaPod-paketet är tillgängligt för nedladdning och användning med Xcode 9.4.1 eller senare IDE (Integrated Development Environment).

  1. Gå till Xcode-katalogen där projektfilen .xcodeproj finns.

  2. Kör pod init för att skapa en poddfil med namnet Podfile.

  3. Ersätt innehållet i Podfile med följande innehåll. target Uppdatera namnet från AppName till namnet på din app. Uppdatera plattformen eller poddversionen efter behov.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.36.0'
    end
    
  4. Kör pod install för att installera Speech SDK.

Alternativt kan du ladda ned den binära CocoaPod och extrahera innehållet. I Xcode-projektet lägger du till en referens till den extraherade mappen MicrosoftCognitiveServicesSpeech.xcframework och dess innehåll.

Kommentar

.NET-utvecklare kan skapa inbyggda macOS-program med hjälp av Xamarin.Mac-programramverket. Mer information finns i Xamarin.Mac.

Referensdokumentation Paket (PyPi) | Ytterligare exempel på GitHub |

I den här snabbstarten installerar du Speech SDK för Python.

Plattformskrav

Speech SDK för Python är kompatibelt med Windows, Linux och macOS.

I Windows måste du använda 64-bitars målarkitekturen. Windows 10 eller senare krävs.

Installera Microsoft Visual C++ Redistributable för Visual Studio 2015, 2017, 2019 och 2022 för din plattform. Att installera det här paketet för första gången kan kräva en omstart.

Viktigt!

Kontrollera att paket med samma målarkitektur är installerade. Om du till exempel installerar paketet x64 redistributable installerar du x64 Python-paketet.

Installera en version av Python från 3.7 eller senare.

  • Om du vill kontrollera installationen öppnar du en terminal och kör kommandot python --version. Om Python är korrekt installerat får du ett svar som Python 3.8.10.

  • Om du använder macOS eller Linux kan du behöva köra kommandot python3 --version i stället.

    Om du vill aktivera användning av python i stället för python3kör du alias python='python3' för att konfigurera ett alias. Snabbstartsexemplen för Speech SDK anger python användning.

Installera Speech SDK för Python

Innan du installerar Speech SDK för Python måste du uppfylla plattformskraven.

Installera från PyPI

Om du vill installera Speech SDK för Python kör du det här kommandot i ett konsolfönster:

pip install azure-cognitiveservices-speech

Uppgradera till den senaste Speech SDK

Om du vill uppgradera till den senaste Speech SDK:en kör du det här kommandot i konsolfönstret:

pip install --upgrade azure-cognitiveservices-speech

Du kan kontrollera vilken Speech SDK för Python-version som för närvarande är installerad genom att granska variabeln azure.cognitiveservices.speech.__version__ . Kör till exempel det här kommandot i ett konsolfönster:

pip list

Använda Speech SDK

Lägg till följande import-instruktion för att använda Speech SDK i python-projektet:

import azure.cognitiveservices.speech as speechsdk