Speech SDK のインストール

リファレンス ドキュメントパッケージ (NuGet)GitHub のその他のサンプル

このガイドでは、C# 用の Speech SDK をインストールする方法について説明します。

ドキュメントのコード サンプルは C# 8 で記述されており、.NET Standard 2.0 で実行されます。

プラットフォームの要件

Speech SDK for C# は、Windows、Linux、macOS との互換性があります。

Windows では、x64 ターゲット アーキテクチャを使う必要があります。

お使いのプラットフォームに対応した Microsoft Visual Studio 2015、2017、2019、2022 のいずれかの Visual C++ 再頒布可能パッケージをインストールする必要があります。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK のインストール

Speech SDK for C# は NuGet パッケージとして提供されていて、.NET Standard 2.0 が実装されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C# は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK for C# は、次の Install-Package コマンドを使用してインストールできます。

Install-Package Microsoft.CognitiveServices.Speech

その他のオプションについては、以下のガイドに従ってください。

ターゲット環境を選択してください

このガイドでは、.NET Framework (Windows) コンソール アプリ用の Speech SDK をインストールする方法について説明します。

前提条件

このガイドでは、次のものが必要です。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

Speech SDK NuGet パッケージをインストールして、コード内で参照できるようにする必要があります。 そのためには、必要に応じて最初に helloworld プロジェクトを作成します。 .NET デスクトップ開発ワークロードを使用できるプロジェクトが既にある場合は、そのプロジェクトを使用し、「NuGet パッケージ マネージャーを使用して Speech SDK をインストールする」に進んでください。

helloworld プロジェクトを作成する

  1. Visual Studio 2019 を開きます。

  2. [開始] ウィンドウで、 [新しいプロジェクトの作成] を選択します。

  3. [新しいプロジェクトの作成] ウィンドウで、[コンソール アプリ (.NET Framework)] を選択してから、[次へ] を選択します。

  4. [新しいプロジェクトの構成] ウィンドウの [プロジェクト名] に「helloworld」と入力し、保存先となるディレクトリのパスを選択するか作成して、[作成] を選択します。

  5. Visual Studio のメニュー バーから、[ツール]>[ツールと機能を取得] を選択します。 この手順を実行すると、Visual Studio インストーラーが開き、[変更] ダイアログが表示されます。

  6. [.NET デスクトップ開発] ワークロードが利用できるかどうかを確認します。 このワークロードがまだインストールされていない場合は、その横にあるチェック ボックスをオンにし、[変更] を選択してインストールを開始してください。 ダウンロードとインストールに数分かかる場合があります。

    [.NET デスクトップ開発] の横のチェック ボックスが既にオンになっている場合は、[閉じる] を選択してダイアログを閉じます。

    Screenshot that shows enabling .NET desktop development.

  7. Visual Studio インストーラーを閉じます。

NuGet パッケージ マネージャーを使用して Speech SDK をインストールする

  1. ソリューション エクスプローラーで helloworld プロジェクトを右クリックし、[NuGet パッケージの管理] を選択して NuGet パッケージ マネージャーを表示します。

  2. 右上隅で [パッケージ ソース] ドロップダウン ボックスを探し、[nuget.org] が選択されていることを確認します。

    Screenshot that shows NuGet Package Manager.

  3. 左上隅で [参照] を選択します。

  4. 検索ボックスに「Microsoft.CognitiveServices.Speech」と入力し、Enter キーを押します。

  5. 検索結果から [Microsoft.CognitiveServices.Speech] パッケージを選択し、[インストール] を選択して最新の安定バージョンをインストールします。

    Screenshot that shows installing the Microsoft.CognitiveServices.Speech NuGet package.

  6. すべての契約とライセンスに同意して、インストールを開始します。

    パッケージがインストールされると、 [パッケージマネージャー コンソール] ウィンドウに確認が表示されます。

ターゲット アーキテクチャを選択する

コンソール アプリケーションをビルドして実行するには、お使いのコンピューターのアーキテクチャに合ったプラットフォーム構成を作成します。

  1. メニュー バーから、 [ビルド][構成マネージャー] の順に選択します。 [構成マネージャー] ダイアログが表示されます。

  2. [アクティブ ソリューション プラットフォーム] ドロップダウン ボックスで [新規] を選択します。 [新しいソリューション プラットフォーム] ダイアログが表示されます。

    Screenshot that shows the Configuration Manager dialog.

  3. [新しいプラットフォームを入力または選択してください] ドロップダウン ボックスで:

    • 64 ビット Windows を実行している場合、x64 を選択します。
    • 32 ビット Windows を実行している場合、x86 を選択します。
  4. [OK][閉じる] の順に選択します。

リファレンス ドキュメントパッケージ (NuGet)GitHub のその他のサンプル

このガイドでは、C++ 用の Speech SDK をインストールする方法について説明します。

プラットフォームの要件

Speech SDK for C++ は、Windows、Linux、macOS との互換性があります。

Windowsでは、x64 または x86 ターゲット アーキテクチャを使用できます。

お使いのプラットフォームに対応した Microsoft Visual Studio 2015、2017、2019、2022 のいずれかの Visual C++ 再頒布可能パッケージをインストールする必要があります。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK のインストール

Speech SDK for C++ は NuGet パッケージとして提供されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C++ は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK for C# は、次の Install-Package コマンドを使用してインストールできます。

Install-Package Microsoft.CognitiveServices.Speech

その他のオプションについては、以下のガイドに従ってください。

ターゲット環境を選択してください

このガイドでは、Linux 用 Speech SDK をインストールする方法について説明します。

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを https://aka.ms/csspeech/linuxbinary から .tar ファイルとしてダウンロードします。

  1. Speech SDK のファイル抽出先にする必要があるディレクトリを選択し、そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    たとえば、ホーム ディレクトリで speechsdk ディレクトリを使用する場合、次のようなコマンドを使用します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. ディレクトリが存在しない場合はこれを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧には、サード パーティの通知やライセンスのファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md サード パーティに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

リファレンス ドキュメントパッケージ (Go)GitHub のその他のサンプル

このガイドでは、Go 用の Speech SDK をインストールする方法について説明します。

プラットフォームの要件

Speech SDK for Go は、Linux で使用する場合、x64 アーキテクチャ上の Ubuntu 18.04/20.04/22.04Debian 9/10/11Red Hat Enterprise Linux (RHEL) 8CentOS 8 のみをサポートしています。

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。 たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

ネイティブアプリケーションの場合、音声SDK はlibMicrosoft.CognitiveServices.Speech.core.soに依存します。 ターゲットアーキテクチャ (x86、x64) がアプリケーションと一致していることを確認します。 Linux のバージョンによっては、より多くの依存関係が必要になる場合があります。

  • GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)
  • OpenSSL ライブラリ (libssl) バージョン 1.x
  • ALSA アプリケーションの共有ライブラリ (libasound)
sudo apt-get update
sudo apt-get install build-essential libssl-dev libasound2 wget

重要

Ubuntu 22.04 では、libssl1.1バイナリ パッケージ (libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb など) として、またはソースからコンパイルしてインストールしてください。 Speech SDK では OpenSSL 3.0 (Ubuntu 22.04 の既定) はサポートされていません。

Ubuntu 22.04 への libssl1.1 のインストールの例を以下に示します。

wget http://security.ubuntu.com/ubuntu/pool/main/o/openssl/libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb
sudo dpkg -i libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb

Go バイナリ バージョン 1.13 以降をインストールする必要があります。

Speech SDK のインストール

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを https://aka.ms/csspeech/linuxbinary から .tar ファイルとしてダウンロードします。

  1. Speech SDK のファイル抽出先にする必要があるディレクトリを選択し、そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    たとえば、ホーム ディレクトリで speechsdk ディレクトリを使用する場合、次のようなコマンドを使用します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. ディレクトリが存在しない場合はこれを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧には、サード パーティの通知やライセンスのファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md サード パーティに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

Go 環境を構成する

次の手順を実行して、Speech SDK を検索するための Go 環境を有効にします。 両方の手順で、<architecture> を CPU のプロセッサ アーキテクチャに置き換えます。 これは x86x64arm32arm64 のいずれかになります。

  1. バインドは cgo に依存するため、Go によって SDK が検出されるように環境変数を設定する必要があります。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    
  2. アプリケーションと SDK を実行するには、ライブラリがある場所をオペレーティング システムに示す必要があります。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

リファレンス ドキュメント | GitHub のその他のサンプル

このガイドでは、Java 用 Speech SDK をインストールする方法について説明します。

プラットフォームの要件

ターゲット環境を選択してください

Speech SDK for Java は、Windows、Linux、macOS との互換性があります。

Windows では、x64 ターゲット アーキテクチャを使う必要があります。

お使いのプラットフォームに対応した Microsoft Visual Studio 2015、2017、2019、2022 のいずれかの Visual C++ 再頒布可能パッケージをインストールする必要があります。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Azul Zulu OpenJDK などの Java Development Kit をインストールする必要があります。 Microsoft Build of OpenJDK またはお好みの JDK も機能する必要があります。

Speech SDK のインストール

一部の手順では、1.22.0 などの特定の SDK バージョンを使用します。 GitHub リポジトリを検索して、最新バージョンを確認できます。

ターゲット環境を選択してください

このガイドでは、Java Runtime で Java 用の Speech SDK をインストールする方法について説明します。

Note

Speech SDK for Java は Maven セントラル リポジトリにはありません。 Gradle または pom.xml 依存関係ファイルを使用している場合、https://azureai.azureedge.net/maven/ を指すカスタム リポジトリを追加する必要があります。 (パッケージ名については、以下を参照してください)。

サポートされるオペレーティング システム

以下のオペレーティング システム用の Speech SDK for Java パッケージを入手できます。

Apache Maven を使用して Speech SDK for Java をインストールするには、次の手順に従います。

  1. Apache Maven をインストールします。
  2. 新しいプロジェクトを作成するコマンド プロンプトを開き、新しい pom.xml ファイルを作成します。
  3. 次の XML の内容を pom.xml にコピーします。
    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <repositories>
            <repository>
            <id>maven-cognitiveservices-speech</id>
            <name>Microsoft Cognitive Services Speech Maven Repository</name>
            <url>https://azureai.azureedge.net/maven/</url>
            </repository>
        </repositories>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.22.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 次の Maven コマンドを実行して、Speech SDK と依存関係をインストールします。
    mvn clean dependency:copy-dependencies
    

リファレンスドキュメントパッケージ (npm)GitHub のその他のサンプルライブラリのソース コード

このガイドでは、JavaScript 用の Speech SDK をインストールする方法について説明します。

JavaScript 用 Speech SDK は、npm パッケージとして使用できます。 microsoft-cognitiveservices-speech-sdk とそれに付随する GitHub リポジトリ cognitive-services-speech-sdk-js を参照してください。

プラットフォームの要件

必ず、Node.js とクライアント Web ブラウザー間のさまざまなアーキテクチャ上の影響を考慮してください。 たとえば、ドキュメント オブジェクト モデル (DOM) は、Node.js ファイル システムがクライアント側アプリケーションで使用できないのと同様に、サーバー側アプリケーションでは使用できません。

Speech SDK のインストール

ターゲット環境に応じて、次のガイドのいずれかを使用します。

ターゲット環境を選択してください

このガイドでは、Node.js で使用する JavaScript 用の Speech SDK をインストールする方法について説明します。 ご自身で取り組むためにパッケージ名のみを知りたい方は、既存のプロジェクトから npm install microsoft-cognitiveservices-speech-sdk を実行してください。

前提条件

このクイックスタートには、Node.js が必要です。

npm プロジェクトを作成する

新しいディレクトリを作成して npm init を実行し、そのプロンプトに従います。

Speech SDK パッケージを追加する

npm install microsoft-cognitiveservices-speech-sdk を実行します。

このガイドでは、Node.js で使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

  1. Node.js をインストールします。

  2. 新しいディレクトリを作成して npm init を実行し、そのプロンプトに従います。

  3. JavaScript 用 Speech SDK をインストールするには、次の npm install コマンドを実行します。

    npm install microsoft-cognitiveservices-speech-sdk
    

詳細については、Node.js サンプルを参照してください。

Speech SDK を使用する

JavaScript プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

import * as sdk from "microsoft-cognitiveservices-speech-sdk";

import の詳細については、JavaScript Web サイトの「エクスポートとインポート」を参照してください。

または、次のように require ステートメントを使用することもできます。

const sdk = require("microsoft-cognitiveservices-speech-sdk");

require の詳細については、Node.js web サイトの「require とは」を参照してください。

リファレンス ドキュメントパッケージ (ダウンロード)GitHub のその他のサンプル

このガイドでは、Objective-C 用の Speech SDK をインストールする方法について説明します。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」を参照してください。

Speech SDK のインストール

Speech SDK for Objective-C は、Mac x64 および ARM ベースのシリコン用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

  1. .xcodeproj プロジェクト ファイルがある Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次に置き換えます。 target の名前を "AppName" からアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードし、解凍して内容を抽出することもできます。 Xcode プロジェクトで、抽出した "MicrosoftCognitiveServicesSpeech.xcframework" フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーション フレームワークを使用してネイティブ macOS アプリケーションをビルドできます。 詳細については、Xamarin.Mac に関するページを参照してください。

リファレンス ドキュメントパッケージ (ダウンロード)GitHub のその他のサンプル

このガイドでは、Swift 用の Speech SDK をインストールする方法について説明します。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」を参照してください。

Speech SDK のインストール

Speech SDK for Swift は、Mac x64 および ARM ベースのシリコン用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

  1. .xcodeproj プロジェクト ファイルがある Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次に置き換えます。 target の名前を "AppName" からアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードし、解凍して内容を抽出することもできます。 Xcode プロジェクトで、抽出した "MicrosoftCognitiveServicesSpeech.xcframework" フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーション フレームワークを使用してネイティブ macOS アプリケーションをビルドできます。 詳細については、Xamarin.Mac に関するページを参照してください。

リファレンス ドキュメントパッケージ (PyPi)GitHub のその他のサンプル

このガイドでは、Python 用 Speech SDK をインストールする方法について説明します。

プラットフォームの要件

Speech SDK for Python は、Windows、Linux、macOS との互換性があります。

Windowsでは、x64 または x86 ターゲット アーキテクチャを使用できます。

お使いのプラットフォームに対応した Microsoft Visual Studio 2015、2017、2019、2022 のいずれかの Visual C++ 再頒布可能パッケージをインストールする必要があります。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Python の 3.7 から 3.10 までのバージョンをインストールします。 インストールを確認するには、ターミナルを開いてコマンド python --version を実行します。 適切にインストールされた場合、"Python 3.8.2" のような応答が返されます。

重要

プラットフォーム (x64 または x86) が同じパッケージをインストールするようにしてください。 たとえば、x64 の再頒布可能パッケージをインストールした場合は、x64 Python パッケージをインストールする必要があります。

Speech SDK のインストール

Speech SDK for Python をインストールする前に、プラットフォーム要件を満たしていることを確認してください。

ツールまたは IDE を選択する

PyPI からインストールする

Speech SDK for Python をインストールするには、ターミナルで次のコマンドを実行します。

pip install azure-cognitiveservices-speech

最新の Speech SDK にアップグレードする

最新の Speech SDK にアップグレードするには、ターミナルで次のコマンドを実行します。

pip install --upgrade azure-cognitiveservices-speech

azure.cognitiveservices.speech.__version__ 変数を調べることで、現在インストールされている Speech SDK for Python のバージョンを確認できます。 たとえば、ターミナルで次のコマンドを実行します。

pip list

Speech SDK を使用する

Python プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

import azure.cognitiveservices.speech as speechsdk

次のステップ