クイック スタート: Speech SDK のインストール

リファレンス ドキュメント | パッケージ (NuGet) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for C# をインストールします。

ドキュメントのコード サンプルは C# 8 で記述されており、.NET Standard 2.0 で実行されます。

プラットフォームの要件

Speech SDK for C# は、Windows、Linux、macOS との互換性があります。

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。 適宜、使用と計画を検討してください。 詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for C# をインストールする

Speech SDK for C# は NuGet パッケージとして提供されていて、.NET Standard 2.0 が実装されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C# は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

その他のオプションについては、次のガイドに従うことができます。

このガイドでは、.NET Framework (Windows) コンソール アプリ用の Speech SDK をインストールする方法について説明します。

このガイドでは、次のものが必要です。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

Speech SDK NuGet パッケージをインストールして、コード内で参照できるようにする必要があります。 そのためには、必要に応じて最初に helloworld プロジェクトを作成します。 .NET デスクトップ開発ワークロードを使用できるプロジェクトが既にある場合は、そのプロジェクトを使用し、「NuGet パッケージ マネージャーを使用して Speech SDK をインストールする」に進んでください。

helloworld プロジェクトを作成する

  1. Visual Studio を開きます。

  2. [開始する] の下で [新しいプロジェクトの作成] を選択します。

  3. [新しいプロジェクトの作成] で、 [コンソール アプリ (.NET Framework)] を選択してから、 [次へ] を選択します。

  4. [新しいプロジェクトの構成] で、[プロジェクト名] に「helloworld」と入力し、[場所] でディレクトリのパスを選択するか作成して、[作成] を選択します。

  5. Visual Studio のメニュー バーから、[ツール]>[ツールと機能を取得] を選択します。 この手順を実行すると、Visual Studio インストーラーが開き、[変更] ダイアログ ボックスが表示されます。

  6. [.NET デスクトップ開発] ワークロードが利用できるかどうかを確認します。 このワークロードがまだインストールされていない場合は、ワークロードを選択し、[変更] を選択してインストールを開始します。 ダウンロードとインストールに数分かかる場合があります。

    [.NET デスクトップ開発] が既にオンになっている場合は、[閉じる] を選択してダイアログ ボックスを閉じます。

    .NET デスクトップ開発の有効化を示すスクリーンショット。

  7. Visual Studio インストーラーを閉じます。

NuGet パッケージ マネージャーを使用して Speech SDK をインストールする

  1. ソリューション エクスプローラーで helloworld プロジェクトを右クリックし、[NuGet パッケージの管理] を選択して NuGet パッケージ マネージャーを表示します。

  2. 右上隅で [パッケージ ソース] ドロップダウン ボックスを探し、[nuget.org] が選択されていることを確認します。

    NuGet パッケージ マネージャーを示すスクリーンショット。

  3. 左上隅で [参照] を選択します。

  4. 検索ボックスに「Microsoft.CognitiveServices.Speech」と入力し、Enter キーを押します。

  5. 検索結果から [Microsoft.CognitiveServices.Speech] パッケージを選択し、[インストール] を選択して最新の安定バージョンをインストールします。

    Microsoft.CognitiveServices.Speech NuGet パッケージのインストールを示すスクリーンショット。

  6. すべての契約とライセンスに同意して、インストールを開始します。

    パッケージがインストールされると、 [パッケージマネージャー コンソール] ウィンドウに確認が表示されます。

ターゲット アーキテクチャを選択する

コンソール アプリケーションをビルドして実行するには、お使いのコンピューターのアーキテクチャに合ったプラットフォーム構成を作成します。

  1. メニューから、[ビルド]>[構成マネージャー] の順に選択します。 [構成マネージャー] ダイアログ ボックスが表示されます。

  2. [アクティブ ソリューション プラットフォーム] ドロップダウン ボックスで [新規] を選択します。 [新しいソリューション プラットフォーム] ダイアログ ボックスが表示されます。

    [構成マネージャー] ダイアログ ボックスを示すスクリーンショット。

  3. [新しいプラットフォームを入力または選択してください] ドロップダウン ボックスで:

    • 64 ビット Windows を実行している場合、x64 を選択します。
    • 32 ビット Windows を実行している場合、x86 を選択します。
  4. [OK][閉じる] の順に選択します。

リファレンス ドキュメント | パッケージ (NuGet) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for C++ をインストールします。

プラットフォームの要件

Speech SDK for C++ は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for C++ をインストールする

Speech SDK for C++ は NuGet パッケージとして提供されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C++ は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

その他のオプションについては、次のガイドに従うことができます。

このガイドでは、Linux 用 Speech SDK をインストールする方法について説明します。

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを .tar ファイルとしてダウンロードします

  1. Speech SDK ファイルのディレクトリを選択します。 そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    ホーム ディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 存在しない場合はディレクトリを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧にパートナー通知やライセンス ファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md パートナー通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

リファレンス ドキュメント | パッケージ (Go) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Go をインストールします。

プラットフォームの要件

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。 適宜、使用と計画を検討してください。 詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Speech SDK for Go では、x64 アーキテクチャの次のディストリビューションがサポートされています。

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。 たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システム ライブラリに依存します:

  • GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
  • OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
  • ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次の コマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Go バイナリ バージョン 1.13 以降をインストールします。

Speech SDK for Go をインストールする

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを .tar ファイルとしてダウンロードします

  1. Speech SDK ファイルのディレクトリを選択します。 そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    ホーム ディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 存在しない場合はディレクトリを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧にパートナー通知やライセンス ファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md パートナー通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

Go 環境を構成する

次の手順を実行して、Speech SDK を検索するための Go 環境を有効にします。

  1. バインドは cgo に依存するため、Go によって SDK が検出されるように環境変数を設定する必要があります。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    重要

    <architecture> を CPU のプロセッサ アーキテクチャ x86x64arm32、または arm64 に置き換えます。

  2. アプリケーションと SDK を実行するには、ライブラリがある場所をオペレーティング システムに示す必要があります。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    重要

    <architecture> を CPU のプロセッサ アーキテクチャ x86x64arm32、または arm64 に置き換えます。

リファレンス ドキュメント | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Java をインストールします。

プラットフォームの要件

ターゲット環境を選択してください。

Speech SDK for Java は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for Java は、ARM64 上の Windows をサポートしていません。

Azul Zulu OpenJDK などの Java Development Kit をインストールします。 Microsoft Build of OpenJDK またはお好みの JDK も機能する必要があります。

Speech SDK for Java をインストールする

一部の手順では、1.24.2 などの特定の SDK バージョンを使用します。 最新バージョンを確認するには、GitHub リポジトリを検索します。

ターゲット環境を選択してください。

このガイドでは、Java Runtime で Java 用の Speech SDK をインストールする方法について説明します。

サポートされるオペレーティング システム

以下のオペレーティング システム用の Speech SDK for Java パッケージを入手できます。

Apache Maven を使用して Speech SDK for Java をインストールするには、次の手順に従います。

  1. Apache Maven をインストールします。

  2. 新しいプロジェクトの配置場所のコマンド プロンプトを開き、新しい pom.xml ファイルを作成します。

  3. 次の XML の内容を pom.xml にコピーします。

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.37.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 次の Maven コマンドを実行して、Speech SDK と依存関係をインストールします。

    mvn clean dependency:copy-dependencies
    

リファレンスドキュメント | パッケージ (npm) | GitHub のその他のサンプル | ライブラリのソース コード

このクイックスタートでは、Speech SDK for JavaScript をインストールします。

JavaScript 用 Speech SDK は、npm パッケージとして使用できます。 microsoft-cognitiveservices-speech-sdk とそれに付随する GitHub リポジトリ cognitive-services-speech-sdk-js を参照してください。

プラットフォームの要件

Node.js とクライアント Web ブラウザー間のアーキテクチャ上の影響について理解します。 たとえば、ドキュメント オブジェクト モデル (DOM) はサーバー側アプリケーションでは使用できません。 Node.js ファイル システムはクライアント側アプリケーションでは使用できません。

Speech SDK for JavaScript をインストールする

ターゲット環境に応じて、次のガイドのいずれかを使用します。

このガイドでは、Node.js で使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

  1. Node.js をインストールします。

  2. 新しいディレクトリを作成して npm init を実行し、そのプロンプトに従います。

  3. JavaScript 用 Speech SDK をインストールするには、次の npm install コマンドを実行します。

    npm install microsoft-cognitiveservices-speech-sdk
    

詳細については、Node.js サンプルを参照してください。

Speech SDK を使用する

  • JavaScript プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

import の詳細については、JavaScript Web サイトの「エクスポートとインポート」を参照してください。

または、次のように require ステートメントを使用することもできます。

const sdk = require("microsoft-cognitiveservices-speech-sdk");

リファレンス ドキュメント | パッケージ (ダウンロード) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Objective-C をインストールします。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Objective-C をインストールする

Speech SDK for Objective-C は、Mac x64 および ARM ベース システム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

  1. .xcodeproj プロジェクト ファイルがある Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次の内容に置き換えます。 target の名前を AppName からアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーション フレームワークを使用してネイティブ macOS アプリケーションをビルドできます。 詳細については、Xamarin.Mac に関するページを参照してください。

リファレンス ドキュメント | パッケージ (ダウンロード) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Swift をインストールします。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Swift をインストールする

Speech SDK for Swift は、Mac x64 および ARM ベースのシステム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

  1. .xcodeproj プロジェクト ファイルがある Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次の内容に置き換えます。 target の名前を AppName からアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーション フレームワークを使用してネイティブ macOS アプリケーションをビルドできます。 詳細については、Xamarin.Mac に関するページを参照してください。

リファレンス ドキュメント | パッケージ (PyPi) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Python をインストールします。

プラットフォームの要件

Speech SDK for Python は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

重要

ターゲットアーキテクチャ が同じパッケージをインストールするようにしてください。 たとえば、x64 の再頒布可能パッケージをインストールした場合、x64 Python パッケージをインストールします。

Python の 3.7 以降のバージョンをインストールします。

  • インストールを確認するには、ターミナルを開いてコマンド python --version を実行します。 Python が正しくインストールされた場合、次のような応答が返されます: Python 3.8.10

  • macOS または Linux を使用している場合は、代わりにコマンド python3 --version を実行する必要があります。

    python3の代わりにpythonを使用できるようにするには、実行alias python='python3'して別名を設定します。 Azure Cognitive Service for Speech SDK のクイックスタート サンプルでは、pythonの使用法を指定 します。

Speech SDK for Python をインストールする

Speech SDK for Python をインストールする前に、プラットフォーム要件を満たしていることを確認してください。

PyPI からインストールする

Speech SDK for Python をインストールするには、コンソール ウィンドウで次のコマンドを実行します。

pip install azure-cognitiveservices-speech

最新の Speech SDK にアップグレードする

最新の Speech SDK にアップグレードするには、コンソール ウィンドウで次のコマンドを実行します。

pip install --upgrade azure-cognitiveservices-speech

azure.cognitiveservices.speech.__version__ 変数を調べることで、現在インストールされている Speech SDK for Python のバージョンを確認できます。 たとえば、コンソール ウィンドウで次のコマンドを実行します。

pip list

Speech SDK を使用する

Python プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

import azure.cognitiveservices.speech as speechsdk