クイックスタート: 開発環境を設定する

ターゲット環境を選択してください

このガイドでは、.NET Framework (Windows) 用の Speech SDK をインストールする方法について説明します。 このパッケージ名の使用を自分で開始する場合は、NuGet コンソールで Install-Package Microsoft.CognitiveServices.Speech を実行します。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

前提条件

このクイック スタートでは以下が必要です。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

Speech SDK NuGet パッケージをインストールして、コード内で参照できるようにする必要があります。 そのためには、必要に応じて最初に helloworld プロジェクトを作成します。 .NET デスクトップ開発ワークロードを使用できるプロジェクトが既にある場合は、そのプロジェクトを使用し、「NuGet パッケージ マネージャーを使用して Speech SDK をインストールする」に進んでください。

helloworld プロジェクトを作成する

  1. Visual Studio 2019 を開きます。

  2. [開始] ウィンドウで、 [新しいプロジェクトの作成] を選択します。

  3. [新しいプロジェクトの作成] ウィンドウで、[コンソール アプリ (.NET Framework)] を選択してから、[次へ] を選択します。

  4. [新しいプロジェクトの構成] ウィンドウの [プロジェクト名] に「helloworld」と入力し、保存先となるディレクトリのパスを選択するか作成して、[作成] を選択します。

  5. Visual Studio のメニュー バーから、[ツール]>[ツールと機能を取得] を選択します。 この手順を実行すると、Visual Studio インストーラーが開き、[変更] ダイアログが表示されます。

  6. [.NET デスクトップ開発] ワークロードが利用できるかどうかを確認します。 このワークロードがまだインストールされていない場合は、その横にあるチェック ボックスをオンにし、[変更] を選択してインストールを開始してください。 ダウンロードとインストールに数分かかる場合があります。

    [.NET デスクトップ開発] の横のチェック ボックスが既にオンになっている場合は、[閉じる] を選択してダイアログを閉じます。

    Screenshot that shows enabling .NET desktop development.

  7. Visual Studio インストーラーを閉じます。

NuGet パッケージ マネージャーを使用して Speech SDK をインストールする

  1. ソリューション エクスプローラーで helloworld プロジェクトを右クリックし、[NuGet パッケージの管理] を選択して NuGet パッケージ マネージャーを表示します。

  2. 右上隅で [パッケージ ソース] ドロップダウン ボックスを探し、[nuget.org] が選択されていることを確認します。

    Screenshot that shows NuGet Package Manager.

  3. 左上隅で [参照] を選択します。

  4. 検索ボックスに「Microsoft.CognitiveServices.Speech」と入力し、Enter キーを押します。

  5. 検索結果から [Microsoft.CognitiveServices.Speech] パッケージを選択し、[インストール] を選択して最新の安定バージョンをインストールします。

    Screenshot that shows installing the Microsoft.CognitiveServices.Speech NuGet package.

  6. すべての契約とライセンスに同意して、インストールを開始します。

    パッケージがインストールされると、 [パッケージマネージャー コンソール] ウィンドウに確認が表示されます。

ターゲット アーキテクチャを選択する

コンソール アプリケーションをビルドして実行するには、お使いのコンピューターのアーキテクチャに合ったプラットフォーム構成を作成します。

  1. メニュー バーから、 [ビルド][構成マネージャー] の順に選択します。 [構成マネージャー] ダイアログが表示されます。

  2. [アクティブ ソリューション プラットフォーム] ドロップダウン ボックスで [新規] を選択します。 [新しいソリューション プラットフォーム] ダイアログが表示されます。

    Screenshot that shows the Configuration Manager dialog.

  3. [新しいプラットフォームを入力または選択してください] ドロップダウン ボックスで:

    • 64 ビット Windows を実行している場合、x64 を選択します。
    • 32 ビット Windows を実行している場合、x86 を選択します。
  4. [OK][閉じる] の順に選択します。

次のステップ

ターゲット環境を選択してください

このガイドでは、Linux 用 Speech SDK をインストールする方法について説明します。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

システム要件

Linux については、システム要件とセットアップ手順に関する記事を参照してください。

Speech SDK のインストール

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを https://aka.ms/csspeech/linuxbinary から .tar ファイルとしてダウンロードします。

  1. Speech SDK のファイル抽出先にする必要があるディレクトリを選択し、そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    たとえば、ホーム ディレクトリで speechsdk ディレクトリを使用する場合、次のようなコマンドを使用します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. ディレクトリが存在しない場合はこれを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧には、サード パーティの通知やライセンスのファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md サード パーティに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

次のステップ

ターゲット環境を選択してください

このガイドでは、Java 用 Speech SDK をインストールする方法について説明します。 このパッケージ名の使用を自分で開始する場合、Java SDK は Maven Central Repository で使用できません。 Gradle または pom.xml 依存関係ファイルを使用している場合、https://azureai.azureedge.net/maven/ を指すカスタム リポジトリを追加する必要があります。 (パッケージ名については、以下を参照してください)。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

サポートされるオペレーティング システム

以下のオペレーティング システム用の Java Speech SDK パッケージを入手できます。

前提条件

Gradle の構成

Gradle の構成には、カスタム リポジトリと、依存関係拡張子 .jar への明示的な参照の両方が必要です。

// build.gradle

repositories {
    maven {
        url "https://azureai.azureedge.net/maven/"
    }
}

dependencies {
    implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.21.0", ext: "jar"
}

Eclipse プロジェクトを作成して Speech SDK をインストールする

  1. Eclipse を起動します。

  2. Eclipse Launcher の[ワークスペース] ボックスに、新しいワークスペース ディレクトリの名前を入力します。 次に [Launch] を選択します。

    Screenshot of Eclipse Launcher.

  3. しばらくすると、Eclipse IDE のメイン ウィンドウが表示されます。 ウェルカム画面が表示される場合は画面を閉じます。

  4. Eclipse メニュー バーで [ファイル]>[新規]>[プロジェクト] を選択して、新しいプロジェクトを作成します。

  5. [新しいプロジェクト] ダイアログ ボックスが表示されます。 [Java プロジェクト] を選択し、[次へ] を選択します。

    Screenshot of the New Project dialog, with Java Project highlighted.

  6. 新規 Java プロジェクト ウィザードが開始されます。 [プロジェクト名] フィールドに「quickstart」と入力します。 実行環境として [JavaSE-1.8] を選択します。 [完了] を選択します。

    Screenshot of the New Java Project wizard, with selections for creating a Java project.

  7. [Open Associated Perspective?]\(パースペクティブを開きますか?) というウィンドウが表示される場合は、 [Open Perspective]\(パースペクティブを開く) を選択します。

  8. パッケージ エクスプローラーquickstart プロジェクトを右クリックします。 ショートカット メニューで [構成]>[Maven プロジェクトへ変換] を選択します。

    Screenshot of Package Explorer and the commands for converting to a Maven project.

  9. [Create new POM] ウィンドウが表示されます。 [グループ ID] フィールドに「com.microsoft.cognitiveservices.speech.samples」と入力します。 [アーティファクト ID] フィールドに「quickstart」と入力します。 [完了] を選択します。

    Screenshot of the window for creating a new POM.

  10. pom.xml ファイルを開き、編集します。

    • ファイルの最後にある、終了タグ </project> の前に、Speech SDK 用の Maven リポジトリへの参照を含む repositories 要素を作成します。

      <repositories>
        <repository>
          <id>maven-cognitiveservices-speech</id>
          <name>Microsoft Cognitive Services Speech Maven Repository</name>
          <url>https://csspeechstorage.blob.core.windows.net/maven/</url>
        </repository>
      </repositories>
      
    • 依存関係として Speech SDK バージョン 1.21.0 を指定した dependencies 要素を追加します。

      <dependencies>
        <dependency>
          <groupId>com.microsoft.cognitiveservices.speech</groupId>
          <artifactId>client-sdk</artifactId>
          <version>1.21.0</version>
        </dependency>
      </dependencies>
      
    • 変更を保存します。

次のステップ

このガイドでは、Python 用 Speech SDK をインストールする方法について説明します。 このパッケージ名の使用を自分で開始する場合は、pip install azure-cognitiveservices-speech を実行します。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

サポートされるオペレーティング システム

以下のオペレーティング システム用の Python Speech SDK パッケージを入手できます。

前提条件

Python Speech SDK をインストールする前に、以下の前提条件を確認してください。

  • Windows では、プラットフォームに対応した Microsoft Visual Studio 2015、2017、2019、2022 のいずれかの Visual C++ 再頒布可能パッケージをインストールする必要があります。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

  • Linux については、システム要件とセットアップ手順に関する記事を参照してください。

  • Python の 3.7 から 3.10 のうちのいずれかのバージョンをインストールします。 macOS での Python の最低バージョンは 3.7 です。 Windows へのインストール プロセスでは、[Add Python to your PATH](Python をパスに追加する) を選択します。 インストールを確認するには、ターミナルを開いてコマンド python --version を実行します。 適切にインストールされた場合、"Python 3.8.8" のような応答が返されます。

重要

プラットフォーム (x64 または x86) が同じパッケージをインストールするようにしてください。 たとえば、x64 の再頒布可能パッケージをインストールした場合は、x64 の Python パッケージをインストールする必要があります。

PyPI から Speech SDK をインストールする

Python Speech SDK は、Python パッケージ インデックス (PyPI) モジュールとして入手できます。 詳細については、azure-cognitiveservices-speech に関するページを参照してください。 Python音声SDK は、Windows、Linux および macOS と互換性があります。 Python の 3.7 から 3.10 までのバージョンをインストールします。

Python Speech SDK をインストールする前に、システム要件と前提条件を満たしていることを確認してください。

Speech SDK をインストールするには、ターミナルで次のコマンドを実行します。

pip install azure-cognitiveservices-speech

macOS を使用していて、インストールの問題が発生した場合は、まず次のコマンドを実行することが必要な場合があります。

python3 -m pip install --upgrade pip

これで、Speech SDK を Python プロジェクトにインポートできます。

import azure.cognitiveservices.speech as speechsdk

Visual Studio Code を使用して Speech SDK をインストールする

Python Speech SDK をインストールする前に、前記のシステム要件と前提条件の一覧を満たしていることを確認してください。

  1. Visual Studio Code をダウンロードして、インストールします。

  2. Visual Studio Code を実行して、次のように Python 拡張機能をインストールします。

    1. [ファイル]>[基本設定]>[拡張機能] の順に選択します。
    2. Python」を検索し、Microsoft が公開している [Python extension for Visual Studio Code](Visual Studio Code 用の Python 拡張機能) を見つけて [Install](インストール) を選択します。

    Screenshot that shows selections for installing the Python extension.

  3. [Terminal](ターミナル)>[New terminal](新しいターミナル) を選択して、Visual Studio Code 内でターミナルを開きます。

  4. ターミナル プロンプトで python -m pip install azure-cognitiveservices-speech コマンドを実行して、Speech SDK Python パッケージをインストールします。

Visual Studio Code および Python の詳細については、Visual Studio Code のドキュメントおよび Visual Studio Code での Python のチュートリアルに関するページをご覧ください。

サポートと更新プログラム

Python Speech SDK パッケージの更新プログラムは PyPI を通じて配布され、リリース ノートで発表されます。

最新の Speech SDK にアップグレードするには、ターミナルで次のコマンドを実行します。

pip install --upgrade azure-cognitiveservices-speech

azure.cognitiveservices.speech.__version__ 変数を調べることで、現在インストールされている Python Speech SDK のバージョンを確認できます。 たとえば、ターミナルで次のコマンドを実行します。

pip list

問題があるか、機能が欠落している場合は、「サポート オプションとヘルプ オプション」を参照してください。

次の手順

このガイドでは、Linux 上の Go 用 Speech SDK をインストールする方法について説明します。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

システム要件

Speech SDK for Go をインストールする前に、次が必要です。

Speech SDK のインストール

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップでは、必須のライブラリとヘッダー ファイルを https://aka.ms/csspeech/linuxbinary から .tar ファイルとしてダウンロードします。

  1. Speech SDK のファイル抽出先にする必要があるディレクトリを選択し、そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    たとえば、ホーム ディレクトリで speechsdk ディレクトリを使用する場合、次のようなコマンドを使用します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. ディレクトリが存在しない場合はこれを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧には、サード パーティの通知やライセンスのファイルが含まれているはずです。 また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

    パス 説明
    license.md ライセンス
    ThirdPartyNotices.md サード パーティに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ
    lib/x86 アプリケーションをリンクするために必要な x86 のネイティブ ライブラリ

Go 環境を構成する

次の手順を実行して、Speech SDK を検索するための Go 環境を有効にします。 両方の手順で、<architecture> を CPU のプロセッサ アーキテクチャに置き換えます。 これは x86x64arm32arm64 のいずれかになります。

  1. バインドは cgo に依存するため、Go によって SDK が検出されるように環境変数を設定する必要があります。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    
  2. アプリケーションと SDK を実行するには、ライブラリがある場所をオペレーティング システムに示す必要があります。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

次のステップ


ターゲット環境を選択してください

このガイドでは、Web ページで使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

重要

Azure Cognitive Services Speech SDK のいずれかをダウンロードした時点で、同 SDK のライセンス条件に同意したものと見なされます。 詳細については、次を参照してください。

フォルダーを作成します

新しい空のフォルダーを作成します。 Web サーバーでサンプルをホストする場合は、Web サーバーがフォルダーにアクセスできることを確認します。

JavaScript 用 Speech SDK を新しいフォルダーに解凍する

Speech SDK を .zip パッケージとしてダウンロードし、新しく作成したフォルダーに解凍します。 次の 5 つのファイルが解凍されます。

  • microsoft.cognitiveservices.speech.sdk.bundle.js: 人間が判読できるバージョンの Speech SDK。
  • microsoft.cognitiveservices.speech.sdk.bundle.js.map: SDK コードのデバッグに使用するマップ ファイル。
  • microsoft.cognitiveservices.speech.sdk.bundle.d.ts: TypeScript で使用するオブジェクト定義。
  • microsoft.cognitiveservices.speech.sdk.bundle-min.js: 縮小バージョンの Speech SDK。
  • speech-processor.js: 一部のブラウザーにおけるパフォーマンスを向上するコード。

index.html ページを作成する

フォルダーに index.html という名前の新しいファイルを作成し、テキスト エディターでこのファイルを開きます。

次の手順