Rychlý start: Instalace sady Speech SDK

Referenční dokumentace | – balíček (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro jazyk C#.

Ukázky kódu v dokumentaci jsou napsané v C# 8 a běží na .NET Standard 2.0.

Požadavky platformy

Sada Speech SDK pro C# je kompatibilní s Windows, Linuxem a macOS.

Upozornění

Tento článek odkazuje na CentOS, linuxovou distribuci, která se blíží stavu Konec životnosti (EOL). Zvažte své použití a plánování odpovídajícím způsobem. Další informace najdete v doprovodných materiálech CentOS End Of Life.

Ve Windows musíte použít 64bitovou cílovou architekturu. Vyžaduje se Windows 10 nebo novější.

Nainstalujte microsoft Distribuovatelné součásti Visual C++ pro Visual Studio 2015, 2017, 2019 a 2022 pro vaši platformu. První instalace tohoto balíčku může vyžadovat restartování.

Instalace sady Speech SDK pro jazyk C#

Sada Speech SDK pro jazyk C# je k dispozici jako balíček NuGet a implementuje .NET Standard 2.0. Další informace naleznete v tématu Microsoft.CognitiveServices.Speech.

Sadu Speech SDK pro C# je možné nainstalovat z rozhraní příkazového řádku .NET POMOCÍ následujícího dotnet add příkazu:

dotnet add package Microsoft.CognitiveServices.Speech

Další možnosti najdete v těchto průvodcích.

Tento průvodce ukazuje, jak nainstalovat sadu Speech SDK pro konzolovou aplikaci .NET Framework (Windows).

Tato příručka vyžaduje:

Vytvoření projektu sady Visual Studio a instalace sady Speech SDK

Musíte nainstalovat balíček NuGet sady Speech SDK, abyste na něj mohli odkazovat ve svém kódu. K tomu možná budete muset nejprve vytvořit projekt helloworld . Pokud už máte projekt s dostupnou úlohou vývoje desktopových aplikací .NET, můžete tento projekt použít a přeskočit k instalaci sady Speech SDK pomocí nástroje NuGet Správce balíčků.

Vytvoření projektu helloworld

  1. Otevřete sadu Visual Studio.

  2. V části Začínáme vyberte Vytvořit nový projekt.

  3. V části Vytvořit nový projekt zvolte Konzolová aplikace (.NET Framework) a pak vyberte Další.

  4. V části Konfigurace nového projektu zadejte název projektu helloworld, zvolte nebo vytvořte cestu k adresáři v umístění a pak vyberte Vytvořit.

  5. V řádku nabídek sady Visual Studio vyberte Nástroje Získat nástroje>a funkce. Tento krok se otevře Instalační program pro Visual Studio a zobrazí dialogové okno Úpravy.

  6. Zkontrolujte, jestli je k dispozici úloha vývoje desktopových aplikací .NET. Pokud úloha není nainstalovaná, vyberte ji a pak výběrem možnosti Upravit spusťte instalaci. Stažení a instalace může trvat několik minut.

    Pokud už je vybraný vývoj desktopových aplikací .NET, zavřete dialogové okno výběrem možnosti Zavřít .

    Snímek obrazovky znázorňující povolení vývoje desktopových aplikací .NET

  7. Zavřete Instalační program pro Visual Studio.

Instalace sady Speech SDK pomocí Správce balíčků NuGet

  1. V Průzkumník řešení klikněte pravým tlačítkem myši na projekt helloworld a pak vyberte Spravovat balíčky NuGet, aby se zobrazil Správce balíčků NuGet.

  2. V pravém horním rohu vyhledejte rozevírací seznam Zdroj balíčku a ujistěte se, že je vybraná nuget.org .

    Snímek obrazovky znázorňující Správce balíčků NuGet

  3. V levém horním rohu vyberte Procházet.

  4. Do vyhledávacího pole zadejte Microsoft.CognitiveServices.Speech a vyberte Enter.

  5. Ve výsledcích hledání vyberte balíček Microsoft.CognitiveServices.Speech a pak vyberte Nainstalovat a nainstalujte nejnovější stabilní verzi.

    Snímek obrazovky znázorňující instalaci balíčku NuGet Microsoft.CognitiveServices.Speech

  6. Přijměte všechny smlouvy a licence a spusťte instalaci.

    Po instalaci balíčku se v okně konzoly Správce balíčků zobrazí potvrzení.

Volba cílové architektury

Pokud chcete sestavit a spustit konzolovou aplikaci, vytvořte konfiguraci platformy, která odpovídá architektuře vašeho počítače.

  1. V nabídce vyberte Build>Configuration Manager. Zobrazí se dialogové okno Configuration Manager.

  2. V rozevíracím seznamu Aktivní platforma řešení vyberte Nový. Zobrazí se dialogové okno Nová platforma řešení.

    Snímek obrazovky s dialogovým oknem Configuration Manageru

  3. V rozevíracím seznamu Typ nebo vyberte nový rozevírací seznam platformy :

    • Pokud používáte 64bitovou verzi Windows, vyberte x64.
    • Pokud používáte 32bitovou verzi Windows, vyberte x86.
  4. Vyberte OK a pak Zavřete.

Referenční dokumentace | – balíček (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro C++.

Požadavky platformy

Sada Speech SDK pro C++ je kompatibilní s Windows, Linuxem a macOS.

Ve Windows musíte použít 64bitovou cílovou architekturu. Vyžaduje se Windows 10 nebo novější.

Nainstalujte microsoft Distribuovatelné součásti Visual C++ pro Visual Studio 2015, 2017, 2019 a 2022 pro vaši platformu. První instalace tohoto balíčku může vyžadovat restartování.

Instalace sady Speech SDK pro C++

Sada Speech SDK pro jazyk C++ je k dispozici jako balíček NuGet. Další informace naleznete v tématu Microsoft.CognitiveServices.Speech.

Sadu Speech SDK pro C++ je možné nainstalovat z rozhraní příkazového řádku .NET POMOCÍ následujícího dotnet add příkazu:

dotnet add package Microsoft.CognitiveServices.Speech

Další možnosti najdete v těchto průvodcích.

Tato příručka ukazuje, jak nainstalovat sadu Speech SDK pro Linux.

Pomocí následujícího postupu stáhněte a nainstalujte sadu SDK. Tento postup zahrnuje stažení požadovaných knihoven a souborů hlaviček jako .tar souboru.

  1. Zvolte adresář pro soubory sady Speech SDK. Nastavte proměnnou SPEECHSDK_ROOT prostředí tak, aby odkazovat na tento adresář. Tato proměnná umožňuje snadno odkazovat na adresář v budoucích příkazech.

    Pokud chcete použít speechsdk adresáře ve vašem domovském adresáři, spusťte následující příkaz:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Pokud adresář neexistuje, vytvořte ho:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Stáhněte a extrahujte archiv .tar.gz , který obsahuje binární soubory sady Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Ověřte obsah adresáře nejvyšší úrovně extrahovaného balíčku:

    ls -l "$SPEECHSDK_ROOT"
    

    Seznam adresářů by měl obsahovat oznámení o partnerovi a soubory licencí. Výpis by měl obsahovat také adresář obsahující soubory hlaviček (.h) a adresář lib , který obsahuje knihovny pro arm32, arm64, x64 a x86.

    Cesta Popis
    license.md Licence
    ThirdPartyNotices.md Oznámení o partnerech
    REDIST.txt Oznámení o redistribuci
    include Požadované soubory hlaviček pro C++
    lib/arm32 Nativní knihovna pro ARM32 potřebná k propojení aplikace
    lib/arm64 Nativní knihovna pro ARM64 požadovaná k propojení aplikace
    lib/x64 Nativní knihovna pro x64 požadovaná pro propojení vaší aplikace
    lib/x86 Nativní knihovna pro x86 požadovaná pro propojení vaší aplikace

Referenční dokumentace | – balíček (Go) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Go.

Požadavky platformy

Upozornění

Tento článek odkazuje na CentOS, linuxovou distribuci, která se blíží stavu Konec životnosti (EOL). Zvažte své použití a plánování odpovídajícím způsobem. Další informace najdete v doprovodných materiálech CentOS End Of Life.

Sada Speech SDK pro Go podporuje následující distribuce v architektuře x64:

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 7

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně POSIX Threads Programming library, libpthreads.
  • Knihovna OpenSSL (libssl) verze 1.x a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound).

Měli byste také nainstalovat ca-certificates , abyste vytvořili zabezpečený websocket a vyhnuli se WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED chybě.

Důležité

Sada Speech SDK zatím nepodporuje OpenSSL 3.0, což je výchozí nastavení v Ubuntu 22.04 a Debianu 12.

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Nainstalujte binární verzi Go 1.13 nebo novější.

Instalace sady Speech SDK pro Go

Pomocí následujícího postupu stáhněte a nainstalujte sadu SDK. Tento postup zahrnuje stažení požadovaných knihoven a souborů hlaviček jako .tar souboru.

  1. Zvolte adresář pro soubory sady Speech SDK. Nastavte proměnnou SPEECHSDK_ROOT prostředí tak, aby odkazovat na tento adresář. Tato proměnná umožňuje snadno odkazovat na adresář v budoucích příkazech.

    Pokud chcete použít speechsdk adresáře ve vašem domovském adresáři, spusťte následující příkaz:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Pokud adresář neexistuje, vytvořte ho:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Stáhněte a extrahujte archiv .tar.gz , který obsahuje binární soubory sady Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Ověřte obsah adresáře nejvyšší úrovně extrahovaného balíčku:

    ls -l "$SPEECHSDK_ROOT"
    

    Seznam adresářů by měl obsahovat oznámení o partnerovi a soubory licencí. Výpis by měl obsahovat také adresář obsahující soubory hlaviček (.h) a adresář lib , který obsahuje knihovny pro arm32, arm64, x64 a x86.

    Cesta Popis
    license.md Licence
    ThirdPartyNotices.md Oznámení o partnerech
    REDIST.txt Oznámení o redistribuci
    include Požadované soubory hlaviček pro C++
    lib/arm32 Nativní knihovna pro ARM32 potřebná k propojení aplikace
    lib/arm64 Nativní knihovna pro ARM64 požadovaná k propojení aplikace
    lib/x64 Nativní knihovna pro x64 požadovaná pro propojení vaší aplikace
    lib/x86 Nativní knihovna pro x86 požadovaná pro propojení vaší aplikace

Konfigurace prostředí Go

Následující kroky umožňují vašemu prostředí Go najít sadu Speech SDK.

  1. Vzhledem k tomu, že vazby závisejí, cgomusíte nastavit proměnné prostředí, aby Go mohl najít sadu SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Důležité

    Nahraďte <architecture> architekturou procesoru procesoru: x86, x64, arm32nebo arm64.

  2. Pokud chcete spouštět aplikace a sadu SDK, musíte operačnímu systému sdělit, kde knihovny najít.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Důležité

    Nahraďte <architecture> architekturou procesoru procesoru: x86, x64, arm32nebo arm64.

Referenční dokumentace | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Javu.

Požadavky platformy

Zvolte cílové prostředí:

Sada Speech SDK pro Javu je kompatibilní s Windows, Linuxem a macOS.

Ve Windows musíte použít 64bitovou cílovou architekturu. Vyžaduje se Windows 10 nebo novější.

Nainstalujte microsoft Distribuovatelné součásti Visual C++ pro Visual Studio 2015, 2017, 2019 a 2022 pro vaši platformu. První instalace tohoto balíčku může vyžadovat restartování.

Sada Speech SDK pro Javu nepodporuje Windows v ARM64.

Nainstalujte sadu Java Development Kit, jako je Azul Zulu OpenJDK. Měl by fungovat také microsoft build OpenJDK nebo upřednostňovaná sada JDK.

Instalace sady Speech SDK pro Javu

Některé pokyny používají konkrétní verzi sady SDK, například 1.24.2. Pokud chcete zkontrolovat nejnovější verzi, vyhledejte úložiště GitHub.

Zvolte cílové prostředí:

Tento průvodce ukazuje, jak nainstalovat sadu Speech SDK pro Javu v prostředí Java Runtime.

Podporované operační systémy

Balíček Speech SDK pro Javu je k dispozici pro tyto operační systémy:

Pokud chcete nainstalovat sadu Speech SDK pro Javu pomocí Apache Mavenu, postupujte takto:

  1. Nainstalujte Apache Maven.

  2. Otevřete příkazový řádek, na kterém chcete nový projekt, a vytvořte nový soubor pom.xml .

  3. Do pom.xml zkopírujte následující obsah XML:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.37.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Spuštěním následujícího příkazu Mavenu nainstalujte sadu Speech SDK a závislosti.

    mvn clean dependency:copy-dependencies
    

Referenční dokumentace | Balíček (npm) | Další ukázky zdrojového kódu knihovny GitHub |

V tomto rychlém startu nainstalujete sadu Speech SDK pro JavaScript.

Sada Speech SDK pro JavaScript je k dispozici jako balíček npm. Viz microsoft-cognitiveservices-speech-sdk a jeho doprovodné úložiště GitHub cognitive-services-speech-sdk-js.

Požadavky platformy

Seznamte se s důsledky architektury mezi Node.js a klientskými webovými prohlížeči. Například objektový model dokumentu (DOM) není k dispozici pro aplikace na straně serveru. Systém souborů Node.js není k dispozici pro aplikace na straně klienta.

Instalace sady Speech SDK pro JavaScript

V závislosti na cílovém prostředí použijte jednu z následujících příruček:

Tato příručka ukazuje, jak nainstalovat sadu Speech SDK pro JavaScript pro použití s Node.js.

  1. Nainstalujte Node.js.

  2. Vytvořte nový adresář, spusťte npm inita projděte si výzvy.

  3. Pokud chcete nainstalovat sadu Speech SDK pro JavaScript, spusťte následující npm install příkaz:

    npm install microsoft-cognitiveservices-speech-sdk
    

Další informace najdete v ukázkách Node.js.

Použití sady Speech SDK

  • Přidejte následující příkaz importu pro použití sady Speech SDK v projektu JavaScriptu:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Další informace o importexportu a importu na webu JavaScript.

Alternativně můžete použít příkaz require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Objective-C.

Tip

Další informace o používání sady Speech SDK pro Swift najdete v tématu Importu Objective-C do Swiftu.

Instalace sady Speech SDK pro Objective-C

Sada Speech SDK pro Objective-C je nativně dostupná jako balíček CocoaPod pro systémy Mac x64 a ARM.

Požadavky na systém pro Mac:

  • MacOS verze 10.14 nebo novější

Balíček macOS CocoaPod je k dispozici ke stažení a použití s integrovaným vývojovým prostředím (IDE) Xcode 9.4.1 nebo novějším.

  1. Přejděte do adresáře Xcode, kde se nachází váš soubor projektu .xcodeproj .

  2. Spuštěním příkazu pod init vytvořte soubor podu s názvem Podfile.

  3. Obsah souboru Podfile nahraďte následujícím obsahem. target Aktualizujte název z AppName názvu aplikace. Podle potřeby aktualizujte verzi platformy nebo podu.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. Spusťte pod install instalaci sady Speech SDK.

Případně si stáhněte binární CocoaPod a extrahujte jeho obsah. V projektu Xcode přidejte odkaz na extrahovaný soubor MicrosoftCognitiveServicesSpeech.xcframework a jeho obsah.

Poznámka:

Vývojáři .NET můžou vytvářet nativní aplikace pro macOS pomocí aplikační architektury Xamarin.Mac. Další informace najdete v Xamarin.Mac.

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Swift.

Tip

Další informace o používání sady Speech SDK pro Swift najdete v tématu Importu Objective-C do Swiftu.

Instalace sady Speech SDK pro Swift

Sada Speech SDK pro Swift je nativně dostupná jako balíček CocoaPod pro systémy Mac x64 a ARM.

Požadavky na systém pro Mac:

  • MacOS verze 10.14 nebo novější

Balíček macOS CocoaPod je k dispozici ke stažení a použití s integrovaným vývojovým prostředím (IDE) Xcode 9.4.1 nebo novějším.

  1. Přejděte do adresáře Xcode, kde se nachází váš soubor projektu .xcodeproj .

  2. Spuštěním příkazu pod init vytvořte soubor podu s názvem Podfile.

  3. Obsah souboru Podfile nahraďte následujícím obsahem. target Aktualizujte název z AppName názvu aplikace. Podle potřeby aktualizujte verzi platformy nebo podu.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. Spusťte pod install instalaci sady Speech SDK.

Případně si stáhněte binární CocoaPod a extrahujte jeho obsah. V projektu Xcode přidejte odkaz na extrahovaný soubor MicrosoftCognitiveServicesSpeech.xcframework a jeho obsah.

Poznámka:

Vývojáři .NET můžou vytvářet nativní aplikace pro macOS pomocí aplikační architektury Xamarin.Mac. Další informace najdete v Xamarin.Mac.

Referenční dokumentace | – balíček (PyPi) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Python.

Požadavky platformy

Sada Speech SDK pro Python je kompatibilní s Windows, Linuxem a macOS.

Ve Windows musíte použít 64bitovou cílovou architekturu. Vyžaduje se Windows 10 nebo novější.

Nainstalujte microsoft Distribuovatelné součásti Visual C++ pro Visual Studio 2015, 2017, 2019 a 2022 pro vaši platformu. První instalace tohoto balíčku může vyžadovat restartování.

Důležité

Ujistěte se, že jsou nainstalované balíčky stejné cílové architektury. Pokud například nainstalujete distribuovatelný balíček x64, nainstalujte balíček x64 Python.

Nainstalujte verzi Pythonu z verze 3.7 nebo novější.

  • Pokud chcete zkontrolovat instalaci, otevřete terminál a spusťte příkaz python --version. Pokud je Python správně nainstalovaný, získáte odpověď, například Python 3.8.10.

  • Pokud používáte macOS nebo Linux, možná budete muset příkaz python3 --version spustit.

    Pokud chcete místo toho povolit použití pythonpython3, spusťte alias python='python3' nastavení aliasu. Ukázky rychlého startu sady Speech SDK určují python využití.

Instalace sady Speech SDK pro Python

Před instalací sady Speech SDK pro Python se ujistěte, že splňuje požadavky na platformu.

Instalace z PyPI

Pokud chcete nainstalovat sadu Speech SDK pro Python, spusťte tento příkaz v okně konzoly:

pip install azure-cognitiveservices-speech

Upgrade na nejnovější sadu Speech SDK

Pokud chcete upgradovat na nejnovější sadu Speech SDK, spusťte tento příkaz v okně konzoly:

pip install --upgrade azure-cognitiveservices-speech

Kontrolu toho, která verze sady Speech SDK pro Python je aktuálně nainstalovaná, můžete zkontrolovat kontrolou azure.cognitiveservices.speech.__version__ proměnné. Spusťte například tento příkaz v okně konzoly:

pip list

Použití sady Speech SDK

Přidejte následující příkaz importu pro použití sady Speech SDK v projektu Pythonu:

import azure.cognitiveservices.speech as speechsdk