Speech SDK のインストール - Azure AI services

リファレンスドキュメント | パッケージ (NuGet) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for C# をインストールします。

ドキュメントのコードサンプルは C# 8 で記述されており、.NET Standard 2.0 で実行されます。

プラットフォームの要件

Speech SDK for C# は、Windows、Linux、macOS との互換性があります。

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Windows では、64 ビットターゲットアーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for C# では、x64、ARM32 (Debian/Ubuntu)、ARM64 (Debian/Ubuntu) アーキテクチャでのみ次のディストリビューションがサポートされています。

Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システムライブラリに依存します：

GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次のコマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Alpine Linux で Speech SDK を使用するには、glibc プログラムの実行に関する Alpine Linux Wiki で説明されているように、Debian chroot 環境を作成します。その後、こちらの Debian の手順に従います。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

次のように開発ツールとライブラリをインストールします。

sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget

重要

RHEL または CentOS 7 の場合、「Speech SDK 用に RHEL/CentOS 7 を構成する」の手順に従います。
RHEL の場合、Linux の OpenSSL を構成する方法に関する記事の手順に従います。

Speech SDK for C# をインストールする

Speech SDK for C# は NuGet パッケージとして提供されていて、.NET Standard 2.0 が実装されています。詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

ターミナル
PowerShell

Speech SDK for C# は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK for C# は、次の Install-Package コマンドを使用してインストールできます。

Install-Package Microsoft.CognitiveServices.Speech

その他のオプションについては、次のガイドに従うことができます。

このガイドでは、.NET Framework (Windows) コンソールアプリ用の Speech SDK をインストールする方法について説明します。

このガイドでは、次のものが必要です。

Visual Studio 2019 の Visual C++ 再頒布可能パッケージ (Windows プラットフォーム用)。初めてインストールする場合、再起動が必要になる場合があります。
Visual Studio。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

Speech SDK NuGet パッケージをインストールして、コード内で参照できるようにする必要があります。そのためには、必要に応じて最初に helloworld プロジェクトを作成します。 .NET デスクトップ開発ワークロードを使用できるプロジェクトが既にある場合は、そのプロジェクトを使用し、「NuGet パッケージマネージャーを使用して Speech SDK をインストールする」に進んでください。

helloworld プロジェクトを作成する

Visual Studio を開きます。
[開始する] の下で [新しいプロジェクトの作成] を選択します。
[新しいプロジェクトの作成] で、 [コンソールアプリ (.NET Framework)] を選択してから、 [次へ] を選択します。
[新しいプロジェクトの構成] で、[プロジェクト名] に「helloworld」と入力し、[場所] でディレクトリのパスを選択するか作成して、[作成] を選択します。
Visual Studio のメニューバーから、[ツール]>[ツールと機能を取得] を選択します。この手順を実行すると、Visual Studio インストーラーが開き、[変更] ダイアログボックスが表示されます。
[.NET デスクトップ開発] ワークロードが利用できるかどうかを確認します。このワークロードがまだインストールされていない場合は、ワークロードを選択し、[変更] を選択してインストールを開始します。ダウンロードとインストールに数分かかる場合があります。

[.NET デスクトップ開発] が既にオンになっている場合は、[閉じる] を選択してダイアログボックスを閉じます。
Visual Studio インストーラーを閉じます。

NuGet パッケージマネージャーを使用して Speech SDK をインストールする

ソリューションエクスプローラーで helloworld プロジェクトを右クリックし、[NuGet パッケージの管理] を選択して NuGet パッケージマネージャーを表示します。
右上隅で [パッケージソース] ドロップダウンボックスを探し、[nuget.org] が選択されていることを確認します。
左上隅で [参照] を選択します。
検索ボックスに「Microsoft.CognitiveServices.Speech」と入力し、Enter キーを押します。
検索結果から [Microsoft.CognitiveServices.Speech] パッケージを選択し、[インストール] を選択して最新の安定バージョンをインストールします。
すべての契約とライセンスに同意して、インストールを開始します。

パッケージがインストールされると、 [パッケージマネージャーコンソール] ウィンドウに確認が表示されます。

ターゲットアーキテクチャを選択する

コンソールアプリケーションをビルドして実行するには、お使いのコンピューターのアーキテクチャに合ったプラットフォーム構成を作成します。

メニューから、[ビルド]>[構成マネージャー] の順に選択します。 [構成マネージャー] ダイアログボックスが表示されます。
[アクティブソリューションプラットフォーム] ドロップダウンボックスで [新規] を選択します。 [新しいソリューションプラットフォーム] ダイアログボックスが表示されます。
[新しいプラットフォームを入力または選択してください] ドロップダウンボックスで:
- 64 ビット Windows を実行している場合、x64 を選択します。
- 32 ビット Windows を実行している場合、x86 を選択します。
[OK]、[閉じる] の順に選択します。

このガイドでは、ユニバーサル Windows プラットフォーム (UWP) プロジェクトを作成し、C# 用の Speech SDK をインストールする方法について説明します。ユニバーサル Windows プラットフォームを使用すると、PC、Xbox、Surface Hub、その他のデバイスなど、Windows 10 をサポートする任意のデバイスで動作するアプリを開発できます。

このガイドでは、次のものが必要です。

Visual Studio 2019 の Visual C++ 再頒布可能パッケージ (Windows プラットフォーム用)。このファイルを初めてインストールする場合、再起動が必要になる場合があります。
Visual Studio。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

UWP 開発向けに Visual Studio プロジェクトを作成するには、次のことを行う必要があります。

Visual Studio の開発オプションを設定する。
プロジェクトを作成してターゲットアーキテクチャを選択する。
オーディオキャプチャを設定する。
Speech SDK をインストールする。

Visual Studio の開発オプションを設定する

UWP 開発向けに Visual Studio を正しく設定します。

Visual Studio を開いてスタートウィンドウを表示します。
[コードなしで続行] を選択して Visual Studio IDE に移動します。
Visual Studio のメニューバーから、[ツール]>[ツールと機能を取得] の順に選択して Visual Studio インストーラーを開き、[変更中] ダイアログボックスを表示します。
[ワークロード] タブで、[ユニバーサル Windows プラットフォーム開発] ワークロードを見つけます。そのワークロードの横のチェックボックスが既にオンになっている場合は、[変更中] ダイアログボックスを閉じて、Visual Studio インストーラーを閉じます。この手順の残りの部分をスキップします。
[ユニバーサル Windows プラットフォーム開発] をオンにし、[変更] を選択します。
[開始する前] ダイアログで [続行] を選択し、UWP 開発ワークロードをインストールします。新しい機能のインストールにはしばらく時間がかかります。
Visual Studio インストーラーを閉じます。

プロジェクトを作成する

次に、以下のようにプロジェクトを作成してターゲットアーキテクチャを選択します。

Visual Studio メニューバーで、 [ファイル]>[新規]>[プロジェクト] の順に選択して [新しいプロジェクトの作成] ウィンドウを表示します。
[空白のアプリ (ユニバーサル Windows)] を探して選択します。このプロジェクトタイプの C# バージョンを必ず選択してください。Visual Basic ではありません。
[次へ] を選択します。
[新しいプロジェクトの構成] ダイアログボックスの [プロジェクト名] に「helloworld」と入力します。
[場所] で、ご自分のプロジェクトの保存先フォルダーに移動して選択するか、フォルダーを作成します。
［作成］ を選択します
[新しいユニバーサル Windows プラットフォームプロジェクト] ウィンドウの [最小バージョン] (2 番目のドロップダウンボックス) で、[Windows 10 Fall Creators Update (10.0; Build 16299)] を選択します。この要件は、Speech SDK の最小の要件です。
[ターゲットのバージョン] (1 番目のドロップダウンボックス) で、[最小バージョン] の値と同じかそれより大きい値を選択します。
[OK] を選択します。 Visual Studio IDE に戻ります。このとき、新しいプロジェクトが作成されて [ソリューションエクスプローラー] ペインに表示された状態になっています。
ターゲットプラットフォームアーキテクチャを選択します。 Visual Studio ツールバーの [ソリューションプラットフォーム] ドロップダウンボックスを見つけます。見つからない場合は、[表示]>[ツールバー]>[標準] を選択すると、[ソリューションプラットフォーム] を含むツールバーが表示されます。

64 ビット Windows を実行している場合は、ドロップダウンボックスで [x64] を選択します。 64 ビット Windows でも 32 ビットアプリケーションを実行できるため、必要に応じて [x86] を選択してもかまいません。

Note

Speech SDK は、すべての Intel 互換プロセッサをサポートしていますが、ARM プロセッサの場合は x64 バージョンのみです。

オーディオキャプチャを設定する

プロジェクトでオーディオ入力をキャプチャできるようにします。

ソリューションエクスプローラーで [Package.appxmanifest] を選択してパッケージアプリケーションマニフェストを開きます。
[機能] タブを選択し、[マイク] 機能を選択します。
メニューバーで [ファイル]>[Package.appxmanifest の保存] を選択して変更内容を保存します。

Speech SDK for UWP をインストールする

最後に、Speech SDK NuGet パッケージをインストールし、自分のプロジェクト内の Speech SDK を参照します。

ソリューションエクスプローラーでソリューションを右クリックし、[ソリューションの NuGet パッケージの管理] を選択して [NuGet - ソリューション] ウィンドウに移動します。
[参照] を選択します。 [パッケージソース] で nuget.org を選択します。
検索ボックスに「Microsoft.CognitiveServices.Speech」と入力します。このパッケージが検索結果に表示されたら、それを選択します。
検索結果の横のパッケージ状態ウィンドウで、自分の helloworld プロジェクトを選択します。
[インストール] を選択します。
[変更のプレビュー] ダイアログボックスで [適用] を選択します。
[ライセンスへの同意] ダイアログボックスでライセンスを確認し、[同意する] を選択します。パッケージのインストールが開始されます。

インストールが完了すると、Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld と同様のメッセージが [出力] ペインに表示されます。

このガイドでは、Xamarin Forms プロジェクトを作成し、Speech SDK をインストールする方法について説明します。 Xamarin は、.NET を使用して iOS、Android、および Windows 用の最新の高パフォーマンスアプリケーションを構築するオープンソースプラットフォームです。

Xamarin 開発の場合、Speech SDK では、次がサポートされています。

Windows Desktop x86 および x64
ユニバーサル Windows プラットフォーム x86、x64、ARM/ARM64
Android x86、ARM32/64
iOS x64 シミュレーターおよび ARM64

このガイドでは、次のものが必要です。

Visual Studio 2019 の Visual C++ 再頒布可能パッケージ (Windows プラットフォーム用)。初めてインストールする場合、再起動が必要になる場合があります。
Visual Studio 2019。

Visual Studio プロジェクトを作成して Speech SDK をインストールする

.NET および Xamarin を使用したクロスプラットフォームモバイルアプリ開発用の Visual Studio プロジェクトを作成するには、次のことを行う必要があります。

Visual Studio の開発オプションを設定する。
プロジェクトを作成してターゲットアーキテクチャを選択する。
Speech SDK をインストールする。

Visual Studio の開発オプションを設定する

.NET を使用したクロスプラットフォームモバイル開発向けに Visual Studio が正しく設定されていることを確認します。

Visual Studio 2019 を開きます。次に、[コードなしで続行] を選択します。
Visual Studio のメニューから、[ツール]>[ツールと機能を取得] の順に選択して Visual Studio インストーラーを開き、[変更中] ダイアログボックスを表示します。
[ワークロード] タブで、[.NET によるモバイル開発] ワークロードを見つけます。そのワークロードの横のチェックボックスが既にオンになっている場合は、[変更中] ダイアログボックスを閉じて、Visual Studio インストーラーを閉じます。この手順の残りの部分をスキップします。
[.NET によるモバイル開発] をオンにしてから、[変更] を選択します。
[開始する前] ダイアログボックスで [続行] を選択し、.NET によるモバイル開発用ワークロードをインストールします。新しい機能のインストールにはしばらく時間がかかります。
Visual Studio インストーラーを閉じます。

プロジェクトを作成する

次に、以下のようにプロジェクトを作成してターゲットアーキテクチャを選択します。

Visual Studio メニューバーで、 [ファイル]>[新規]>[プロジェクト] の順に選択して [新しいプロジェクトの作成] ウィンドウを表示します。
[モバイルアプリ (Xamarin Forms)] を見つけて選択します。
[次へ] を選択します。
[新しいプロジェクトの構成] ダイアログボックスの [プロジェクト名] に「helloworld」と入力します。
[場所] で、ご自分のプロジェクトの保存先フォルダーに移動して選択するか、フォルダーを作成します。
［作成］ を選択します
[新しいクロスプラットフォームアプリ] ウィンドウで、空のテンプレートを選択した後、[Android]、[iOS]、および [Windows (UWP)] を選択します。 ［作成］ を選択します
[OK] を選択します。 Visual Studio IDE に戻ります。このとき、新しいプロジェクトが作成され、[ソリューションエクスプローラー] ウィンドウに表示された状態になっています。
ターゲットプラットフォームアーキテクチャとスタートアッププロジェクトを選択します。 Visual Studio ツールバーの [ソリューションプラットフォーム] ドロップダウンボックスを見つけます。見つからない場合は、[表示]>[ツールバー]>[標準] を選択すると、[ソリューションプラットフォーム] を含むツールバーが表示されます。

64 ビット Windows を実行している場合は、ドロップダウンボックスで [x64] を選択します。 64 ビット Windows では 32 ビットアプリケーションも実行できるため、必要に応じて [x86] を選択してもかまいません。
[スタートアッププロジェクト] ドロップダウンボックスで、helloworld.UWP (ユニバーサル Windows) を選択します。

Speech SDK for Xamarin をインストールする

Speech SDK NuGet パッケージをインストールし、自分のプロジェクト内で Speech SDK を参照します。

ソリューションエクスプローラーで、対象のソリューションを右クリックします。 [ソリューションの NuGet パッケージの管理] を選択して、 [NuGet - ソリューション] ウィンドウに移動します。
[参照] を選択します。
[パッケージソース] で nuget.org を選択します。
検索ボックスに「Microsoft.CognitiveServices.Speech」と入力します。このパッケージが検索結果に表示されたらそれを選択します。

注意

Microsoft.CognitiveServices.Speech NuGet 内の iOS ライブラリでは、ビットコードが有効になっていません。ビットコードが有効になっているライブラリがアプリケーションで必要な場合は、特に iOS プロジェクト用に Microsoft.CognitiveServices.Speech.Xamarin.iOS NuGet を使用してください。
検索結果の横のパッケージ状態ウィンドウで、すべてのプロジェクトを選択します。
インストールを選択します。
[変更のプレビュー] ダイアログボックスで [OK] を選択します。
[ライセンスへの同意] ダイアログボックスでライセンスを確認し、[同意する] を選択します。すべてのプロジェクトに Speech SDK パッケージ参照をインストールします。

インストールが正常に完了すると、helloworld.iOS に対して次の警告が表示される場合があります。この警告は既知の問題であり、アプリの機能に影響を与えることはありません。
```
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
```

これで Speech SDK がインストールされました。前のステップで作成した helloworld プロジェクトを削除または再利用できるようになりました。

リファレンスドキュメント | パッケージ (NuGet) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for C++ をインストールします。

プラットフォームの要件

Speech SDK for C++ は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビットターゲットアーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

注意

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Speech SDK for C++ では、x86 (Debian/Ubuntu)、x64、ARM32 (Debian/Ubuntu)、ARM64 (Debian/Ubuntu) アーキテクチャでのみ次のディストリビューションがサポートされています。

Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システムライブラリに依存します：

GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次のコマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Alpine Linux で Speech SDK を使用するには、glibc プログラムの実行に関する Alpine Linux Wiki で説明されているように、Debian chroot 環境を作成します。その後、こちらの Debian の手順に従います。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

次のように開発ツールとライブラリをインストールします。

sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget

重要

RHEL または CentOS 7 の場合、「Speech SDK 用に RHEL/CentOS 7 を構成する」の手順に従います。
RHEL の場合、Linux の OpenSSL を構成する方法に関する記事の手順に従います。

Speech SDK for C++ をインストールする

Speech SDK for C++ は NuGet パッケージとして提供されています。詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

ターミナル
PowerShell

Speech SDK for C++ は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK for C++ は、次の Install-Package コマンドを使用してインストールできます。

Install-Package Microsoft.CognitiveServices.Speech

その他のオプションについては、次のガイドに従うことができます。

このガイドでは、Linux 用 Speech SDK をインストールする方法について説明します。

次の手順に従って、SDK をダウンロードしてインストールします。これらのステップでは、必須のライブラリとヘッダーファイルを .tar ファイルとしてダウンロードします。

Speech SDK ファイルのディレクトリを選択します。そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

ホームディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
存在しない場合はディレクトリを作成します。
```
mkdir -p "$SPEECHSDK_ROOT"
```

Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"

展開されたパッケージの最上位ディレクトリの内容を検証します。

ls -l "$SPEECHSDK_ROOT"

ディレクトリの一覧にパートナー通知やライセンスファイルが含まれているはずです。また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

パス	説明
license.md	ライセンス
ThirdPartyNotices.md	パートナー通知
REDIST.txt	再配布に関する通知
include	C++ に必要なヘッダーファイル
lib/arm32	アプリケーションをリンクするために必要な ARM32 のネイティブライブラリ
lib/arm64	アプリケーションをリンクするために必要な ARM64 のネイティブライブラリ
lib/x64	アプリケーションをリンクするために必要な x64 のネイティブライブラリ
lib/x86	アプリケーションをリンクするために必要な x86 のネイティブライブラリ

このガイドでは、macOS 10.14 以降に C++ 用の Speech SDK をインストールする方法について説明します。これらのステップでは、必須のライブラリとヘッダーファイルを .zip ファイルとしてダウンロードします。

Speech SDK ファイルのディレクトリを選択します。そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

ホームディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
存在しない場合はディレクトリを作成します。
```
mkdir -p "$SPEECHSDK_ROOT"
```

Speech SDK XCFramework を含む .zip アーカイブをダウンロードして抽出します。

wget -O SpeechSDK-macOS.zip https://aka.ms/csspeech/macosbinary
unzip SpeechSDK-macOS.zip -d "$SPEECHSDK_ROOT"

展開されたパッケージの最上位ディレクトリの内容を検証します。
```
ls -l "$SPEECHSDK_ROOT"
```
ディレクトリの一覧にパートナー通知やライセンスファイル、および MicrosoftCognitiveServicesSpeech.xcframework ディレクトリが含まれているはずです。

このガイドでは、Windows デスクトップオペレーティングシステムに C++ 用の Speech SDK をインストールする方法について説明します。

このセットアップガイドには、次のものが必要です。

Visual Studio の Microsoft Visual C++ 再頒布可能パッケージ (Windows プラットフォーム用)。初めてインストールする場合、再起動が必要になる場合があります。
Visual Studio。

Visual Studio でプロジェクトを作成して Speech SDK をインストールする

C++ デスクトップ開発向けの Visual Studio プロジェクトを作成するには、次の作業が必要です。

Visual Studio の開発オプションを設定する。
プロジェクトを作成します。
ターゲットアーキテクチャを選択する。
Speech SDK をインストールする。

Visual Studio の開発オプションを設定する

最初に、C++ デスクトップ開発向けに Visual Studio を正しく設定します。

Visual Studio 2019 を開いてスタートウィンドウを表示します。
[コードなしで続行] を選択して Visual Studio IDE に移動します。
Visual Studio のメニューバーから、[ツール]>[ツールと機能を取得] の順に選択して Visual Studio インストーラーを開き、[変更中] ダイアログボックスを表示します。
[ワークロード] タブの [Windows] で [C++ によるデスクトップ開発] ワークロードを見つけます。そのワークロードがまだオンになっていない場合は、オンにします。
[個別のコンポーネント] タブで [NuGet パッケージマネージャー] を見つけます。既に選択されていない場合は、選択します。
[閉じる] または [変更] のいずれかを選択します。インストールする機能を選択したかどうかによってボタン名が異なります。

[変更] を選択すると、インストールが開始されます。このプロセスには、しばらく時間がかかることがあります。
Visual Studio インストーラーを閉じます。

プロジェクトを作成する

次に、以下のようにプロジェクトを作成してターゲットアーキテクチャを選択します。

Visual Studio メニューから、[ファイル]>[新規]>[プロジェクト] の順に選択して [新しいプロジェクトの作成] ウィンドウを表示します。
[コンソールアプリ] を見つけて選択します。このプロジェクトタイプの、C# や Visual Basic ではなく、C++ バージョンを必ず選択します。
[次へ] を選択します。
[新しいプロジェクトの構成] ダイアログボックスの [プロジェクト名] に「helloworld」と入力します。
[場所] で、プロジェクトの保存先フォルダーに移動して選択するか、保存先フォルダーを作成します。次に [作成] を選択します。
ターゲットプラットフォームアーキテクチャを選択します。 Visual Studio ツールバーの [ソリューションプラットフォーム] ドロップダウンボックスを見つけます。見つからない場合は、[表示]>[ツールバー]>[標準] を選択すると、[ソリューションプラットフォーム] を含むツールバーが表示されます。

64 ビット Windows を実行している場合は、ドロップダウンボックスで [x64] を選択します。 64 ビット Windows でも 32 ビットアプリケーションを実行できるため、必要に応じて [x86] を選択してもかまいません。

Visual Studio を使用して Speech SDK をインストールする

最後に、Speech SDK NuGet パッケージをインストールし、自分のプロジェクト内の Speech SDK を参照します。

ソリューションエクスプローラーでソリューションを右クリックしてから、[ソリューションの NuGet パッケージの管理] を選択して [NuGet - ソリューション] ウィンドウに移動します。
[参照] を選択します。
[パッケージソース] で nuget.org を選択します。
検索ボックスに「Microsoft.CognitiveServices.Speech」と入力します。このパッケージが検索結果に表示されたら、それを選択します。
検索結果の横のパッケージ状態ウィンドウで、自分の helloworld プロジェクトを選択します。
[インストール] を選択します。
[変更のプレビュー] ダイアログボックスで [OK] を選択します。
[ライセンスへの同意] ダイアログボックスでライセンスを確認し、[同意する] を選択します。パッケージのインストールが開始されます。インストールが完了すると、Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld と同様のメッセージが [出力] ペインに表示されます。

リファレンスドキュメント | パッケージ (Go) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Go をインストールします。

プラットフォームの要件

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Speech SDK for Go では、x64 アーキテクチャの次のディストリビューションがサポートされています。

Ubuntu 18.04/20.04
Debian 9/10/11
Red Hat Enterprise Linux (RHEL) 8
CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システムライブラリに依存します：

GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次のコマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Alpine Linux で Speech SDK を使用するには、glibc プログラムの実行に関する Alpine Linux Wiki で説明されているように、Debian chroot 環境を作成します。その後、こちらの Debian の手順に従います。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

次のように開発ツールとライブラリをインストールします。

sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget

重要

RHEL または CentOS 7 の場合、「Speech SDK 用に RHEL/CentOS 7 を構成する」の手順に従います。
RHEL の場合、Linux の OpenSSL を構成する方法に関する記事の手順に従います。

Go バイナリバージョン 1.13 以降をインストールします。

Speech SDK for Go をインストールする

次の手順に従って、SDK をダウンロードしてインストールします。これらのステップでは、必須のライブラリとヘッダーファイルを .tar ファイルとしてダウンロードします。

Speech SDK ファイルのディレクトリを選択します。そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

ホームディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
存在しない場合はディレクトリを作成します。
```
mkdir -p "$SPEECHSDK_ROOT"
```

Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして抽出します。

wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"

展開されたパッケージの最上位ディレクトリの内容を検証します。

ls -l "$SPEECHSDK_ROOT"

ディレクトリの一覧にパートナー通知やライセンスファイルが含まれているはずです。また、この一覧には、ヘッダー (.h) ファイルが入っている include ディレクトリと、arm32、arm64、x64、および x86 用のライブラリが入っている lib ディレクトリも含まれている必要があります。

パス	説明
license.md	ライセンス
ThirdPartyNotices.md	パートナー通知
REDIST.txt	再配布に関する通知
include	C++ に必要なヘッダーファイル
lib/arm32	アプリケーションをリンクするために必要な ARM32 のネイティブライブラリ
lib/arm64	アプリケーションをリンクするために必要な ARM64 のネイティブライブラリ
lib/x64	アプリケーションをリンクするために必要な x64 のネイティブライブラリ
lib/x86	アプリケーションをリンクするために必要な x86 のネイティブライブラリ

Go 環境を構成する

次の手順を実行して、Speech SDK を検索するための Go 環境を有効にします。

バインドは cgo に依存するため、Go によって SDK が検出されるように環境変数を設定する必要があります。
```
export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
```
重要

<architecture> を CPU のプロセッサアーキテクチャ x86、x64、arm32、または arm64 に置き換えます。
アプリケーションと SDK を実行するには、ライブラリがある場所をオペレーティングシステムに示す必要があります。
```
export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
```
重要

<architecture> を CPU のプロセッサアーキテクチャ x86、x64、arm32、または arm64 に置き換えます。

リファレンスドキュメント | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Java をインストールします。

プラットフォームの要件

ターゲット環境を選択してください。

Java ランタイム
Android

Speech SDK for Java は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビットターゲットアーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for Java は、ARM64 上の Windows をサポートしていません。

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Speech SDK for Java では、x64、ARM32 (Debian/Ubuntu)、ARM64 (Debian/Ubuntu) アーキテクチャの次のディストリビューションがサポートされています。

Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システムライブラリに依存します：

GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次のコマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Alpine Linux で Speech SDK を使用するには、glibc プログラムの実行に関する Alpine Linux Wiki で説明されているように、Debian chroot 環境を作成します。その後、こちらの Debian の手順に従います。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

次のように開発ツールとライブラリをインストールします。

sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget

重要

RHEL または CentOS 7 の場合、「Speech SDK 用に RHEL/CentOS 7 を構成する」の手順に従います。
RHEL の場合、Linux の OpenSSL を構成する方法に関する記事の手順に従います。

Azul Zulu OpenJDK などの Java Development Kit をインストールします。 Microsoft Build of OpenJDK またはお好みの JDK も機能する必要があります。

Speech SDK for Java をインストールする

一部の手順では、1.24.2 などの特定の SDK バージョンを使用します。最新バージョンを確認するには、GitHub リポジトリを検索します。

ターゲット環境を選択してください。

Java ランタイム
Android

このガイドでは、Java Runtime で Java 用の Speech SDK をインストールする方法について説明します。

サポートされるオペレーティングシステム

以下のオペレーティングシステム用の Speech SDK for Java パッケージを入手できます。

Windows: 64 ビットのみ。
Mac: macOS X バージョン 10.14 以降。
Linux: サポートされている Linux ディストリビューションとターゲットアーキテクチャの一覧を参照してください。

Apache Maven を使用して Speech SDK for Java をインストールするには、次の手順に従います。

Apache Maven をインストールします。
新しいプロジェクトの配置場所のコマンドプロンプトを開き、新しい pom.xml ファイルを作成します。

次の XML の内容を pom.xml にコピーします。

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
    <artifactId>quickstart-eclipse</artifactId>
    <version>1.0.0-SNAPSHOT</version>
    <build>
        <sourceDirectory>src</sourceDirectory>
        <plugins>
        <plugin>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>3.7.0</version>
            <configuration>
            <source>1.8</source>
            <target>1.8</target>
            </configuration>
        </plugin>
        </plugins>
    </build>
    <dependencies>
        <dependency>
        <groupId>com.microsoft.cognitiveservices.speech</groupId>
        <artifactId>client-sdk</artifactId>
        <version>1.37.0</version>
        </dependency>
    </dependencies>
</project>

次の Maven コマンドを実行して、Speech SDK と依存関係をインストールします。
```
mvn clean dependency:copy-dependencies
```

Eclipse プロジェクトを作成して Speech SDK をインストールする

Eclipse Java IDE をインストールします。この IDE を使用するには、Java が既にインストールされている必要があります。
Eclipse を起動します。
Eclipse Launcher の[ワークスペース] ボックスに、新しいワークスペースディレクトリの名前を入力します。次に [Launch] を選択します。
しばらくすると、Eclipse IDE のメインウィンドウが表示されます。 ウェルカム画面が表示される場合は画面を閉じます。
Eclipse メニューから [ファイル]>[新規]>[プロジェクト] を選択します。
[新しいプロジェクト] ダイアログボックスが表示されます。 [Java プロジェクト] を選択し、[次へ] を選択します。
新規 Java プロジェクト ウィザードが開始されます。 [プロジェクト名] フィールドに「quickstart」と入力します。実行環境として [JavaSE-1.8] を選択します。 [完了] を選択します。
[Open Associated Perspective?]\(パースペクティブを開きますか?) というウィンドウが表示される場合は、 [Open Perspective]\(パースペクティブを開く) を選択します。
パッケージエクスプローラーで quickstart プロジェクトを右クリックします。コンテキストメニューから、[構成]、[Maven プロジェクトへ変換] の順に選択します。
[Create new POM] ウィンドウが表示されます。 [グループ ID] フィールドに「com.microsoft.cognitiveservices.speech.samples」と入力します。 [アーティファクト ID] フィールドに「quickstart」と入力します。 [完了] を選択します。
pom.xml ファイルを開き、編集します。
1. ファイルの末尾、閉じタグ </project> の前に、Speech SDK を依存関係として dependencies 要素を追加します。
```
<dependencies>
  <dependency>
    <groupId>com.microsoft.cognitiveservices.speech</groupId>
    <artifactId>client-sdk</artifactId>
    <version>1.37.0</version>
  </dependency>
</dependencies>
```
1. 変更を保存します。

Gradle の構成

Gradle の構成では、依存関係の拡張子である .jar を明示的に参照する必要があります。

// build.gradle

dependencies {
    implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.37.0", ext: "jar"
}

リファレンスドキュメント | パッケージ (npm) | GitHub のその他のサンプル | ライブラリのソースコード

このクイックスタートでは、Speech SDK for JavaScript をインストールします。

JavaScript 用 Speech SDK は、npm パッケージとして使用できます。 microsoft-cognitiveservices-speech-sdk とそれに付随する GitHub リポジトリ cognitive-services-speech-sdk-js を参照してください。

プラットフォームの要件

Node.js とクライアント Web ブラウザー間のアーキテクチャ上の影響について理解します。たとえば、ドキュメントオブジェクトモデル (DOM) はサーバー側アプリケーションでは使用できません。 Node.js ファイルシステムはクライアント側アプリケーションでは使用できません。

Speech SDK for JavaScript をインストールする

ターゲット環境に応じて、次のガイドのいずれかを使用します。

Node.js
ブラウザーベース

このガイドでは、Node.js で使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

Node.js をインストールします。
新しいディレクトリを作成して npm init を実行し、そのプロンプトに従います。
JavaScript 用 Speech SDK をインストールするには、次の npm install コマンドを実行します。
```
npm install microsoft-cognitiveservices-speech-sdk
```

詳細については、Node.js サンプルを参照してください。

このガイドでは、Web ページで使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

フォルダーに解凍する

新しい空のフォルダーを作成します。 Web サーバーでサンプルをホストする場合は、Web サーバーがフォルダーにアクセスできることを確認します。
Speech SDK を .zip パッケージとしてダウンロードし、新しく作成したフォルダーに解凍します。次のファイルが解凍されます。
- microsoft.cognitiveservices.speech.sdk.bundle.js: 人間が判読できるバージョンの Speech SDK。
- microsoft.cognitiveservices.speech.sdk.bundle.js.map: SDK コードのデバッグに使用するマップファイル。
- microsoft.cognitiveservices.speech.sdk.bundle.d.ts: TypeScript で使用するオブジェクト定義。
- microsoft.cognitiveservices.speech.sdk.bundle-min.js: 縮小バージョンの Speech SDK。
- speech-processor.js: 一部のブラウザーにおけるパフォーマンスを向上するコード。
フォルダーに index.html という名前の新しいファイルを作成し、テキストエディターでこのファイルを開きます。

HTML スクリプトタグ

Speech SDK for JavaScript から microsoft.cognitiveservices.speech.sdk.bundle.js ファイルをダウンロードして抽出します。それを、HTML ファイルがアクセスできるフォルダーに配置します。

<script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>;

ヒント

Web ブラウザーを対象としていて、<script> タグを使用する場合は、sdk プレフィックスは必要ありません。 sdk プレフィックスは、require モジュールに名前を付けるために使用される別名です。

または、HTML <head> 要素に <script> タグを直接含めることもできます。この場合、JSDeliv に依存します。

<script src="https://cdn.jsdelivr.net/npm/microsoft-cognitiveservices-speech-sdk@latest/distrib/browser/microsoft.cognitiveservices.speech.sdk.bundle-min.js">
</script>

詳細については、ブラウザーベースのサンプルを参照してください。

Speech SDK を使用する

JavaScript プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。
```
import * as sdk from "microsoft-cognitiveservices-speech-sdk";
```

import の詳細については、JavaScript Web サイトの「エクスポートとインポート」を参照してください。

または、次のように require ステートメントを使用することもできます。

const sdk = require("microsoft-cognitiveservices-speech-sdk");

リファレンスドキュメント | パッケージ (ダウンロード) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Objective-C をインストールします。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Objective-C は、Mac x64 および ARM ベースシステム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

.xcodeproj プロジェクトファイルがある Xcode ディレクトリに移動します。
pod init を実行して、Podfile という名前のポッドファイルを作成します。
Podfile の内容を次の内容に置き換えます。 target の名前を AppName からアプリの名前に更新します。必要に応じて、プラットフォームまたはポッドのバージョンを更新します。
```
platform :osx, 10.14
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
end
```
pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーションフレームワークを使用してネイティブ macOS アプリケーションをビルドできます。詳細については、Xamarin.Mac に関するページを参照してください。

Speech SDK for Objective-C は、CocoaPod パッケージとしてネイティブに使用できます。

iOS のシステム要件:

macOS version 10.14以降
対象 iOS 9.3以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

.xcodeproj プロジェクトファイルがある Xcode ディレクトリに移動します。
pod init を実行して、Podfile という名前のポッドファイルを作成します。
Podfile の内容を次の内容に置き換えます。 target の名前を AppName からアプリの名前に更新します。必要に応じて、プラットフォームまたはポッドのバージョンを更新します。
```
platform :ios, '9.3'
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.37.0'
end
```
pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.iOS アプリケーションフレームワークを使用してネイティブの iOS アプリケーションをビルドできます。詳細については、Xamarin.iOS に関するページを参照してください。

リファレンスドキュメント | パッケージ (ダウンロード) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Swift をインストールします。

ヒント

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Swift をインストールする

Mac
iOS

Speech SDK for Swift は、Mac x64 および ARM ベースのシステム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

macOS version 10.14以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

.xcodeproj プロジェクトファイルがある Xcode ディレクトリに移動します。
pod init を実行して、Podfile という名前のポッドファイルを作成します。
Podfile の内容を次の内容に置き換えます。 target の名前を AppName からアプリの名前に更新します。必要に応じて、プラットフォームまたはポッドのバージョンを更新します。
```
platform :osx, 10.14
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
end
```
pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.Mac アプリケーションフレームワークを使用してネイティブ macOS アプリケーションをビルドできます。詳細については、Xamarin.Mac に関するページを参照してください。

Speech SDK for Swift は、CocoaPod パッケージとしてネイティブに使用できます。

iOS のシステム要件:

macOS version 10.14以降
対象 iOS 9.3以降

macOS CocoaPod パッケージは、Xcode 9.4.1 以降の統合開発環境 (IDE) と共にダウンロードして使用することができます。

.xcodeproj プロジェクトファイルがある Xcode ディレクトリに移動します。
pod init を実行して、Podfile という名前のポッドファイルを作成します。
Podfile の内容を次に置き換えます。 target の名前を AppName からアプリの名前に更新します。必要に応じて、プラットフォームまたはポッドのバージョンを更新します。
```
platform :ios, '9.3'
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.37.0'
end
```
pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクトで、抽出した MicrosoftCognitiveServicesSpeech.xcframework フォルダーおよびその内容への参照を追加します。

Note

.NET 開発者は、Xamarin.iOS アプリケーションフレームワークを使用してネイティブの iOS アプリケーションをビルドできます。詳細については、Xamarin.iOS に関するページを参照してください。

リファレンスドキュメント | パッケージ (PyPi) | GitHub のその他のサンプル

このクイックスタートでは、Speech SDK for Python をインストールします。

プラットフォームの要件

Speech SDK for Python は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビットターゲットアーキテクチャを使う必要があります。 Windows 10 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

重要

ターゲットアーキテクチャが同じパッケージをインストールするようにしてください。たとえば、x64 の再頒布可能パッケージをインストールした場合、x64 Python パッケージをインストールします。

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

Speech SDK for Python では、x64 および ARM64 アーキテクチャの次のディストリビューションがサポートされています。

Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 8
CentOS 7

重要

Linux ディストリビューションの最新の LTS リリースを使用してください。たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システムライブラリに依存します：

GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ libpthreads など)。
OpenSSL ライブラリ (libssl) バージョン 1.x と証明書 (ca-certificates)。
ALSA アプリケーションの共有ライブラリ (libasound)。

また、セキュリティで保護された Websocket を確立し、WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED エラーを回避するために、ca-certificates もインストールする必要があります。

重要

Speech SDK では、Ubuntu 22.04 と Debian 12のデフォルトである OpenSSL 3.0 はまだサポートされていません。

次のコマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Alpine Linux で Speech SDK を使用するには、glibc プログラムの実行に関する Alpine Linux Wiki で説明されているように、Debian chroot 環境を作成します。その後、こちらの Debian の手順に従います。

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

注意事項

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。適宜、使用と計画を検討してください。詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

次のように開発ツールとライブラリをインストールします。

sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget

重要

RHEL または CentOS 7 の場合、「Speech SDK 用に RHEL/CentOS 7 を構成する」の手順に従います。
RHEL の場合、Linux の OpenSSL を構成する方法に関する記事の手順に従います。

Python の 3.7 以降のバージョンをインストールします。

インストールを確認するには、ターミナルを開いてコマンド python --version を実行します。 Python が正しくインストールされた場合、次のような応答が返されます: Python 3.8.10
macOS または Linux を使用している場合は、代わりにコマンド python3 --version を実行する必要があります。

python3の代わりにpythonを使用できるようにするには、実行alias python='python3'して別名を設定します。 Azure Cognitive Service for Speech SDK のクイックスタートサンプルでは、pythonの使用法を指定します。

Speech SDK for Python をインストールする

Speech SDK for Python をインストールする前に、プラットフォーム要件を満たしていることを確認してください。

PyPI
VS Code

PyPI からインストールする

Speech SDK for Python をインストールするには、コンソールウィンドウで次のコマンドを実行します。

pip install azure-cognitiveservices-speech

Visual Studio Code を使用して Speech SDK をインストールする

Speech SDK for Python をインストールするには:

Visual Studio Code をダウンロードして、インストールします。
Visual Studio Code を実行して、次のように Python 拡張機能をインストールします。
1. [ファイル]>[基本設定]>[拡張機能] の順に選択します。
2. 「Python」を検索し、Microsoft が公開している [Python extension for Visual Studio Code](Visual Studio Code 用の Python 拡張機能) を見つけて [Install](インストール) を選択します。
[Terminal](ターミナル)>[New terminal](新しいターミナル) を選択して、Visual Studio Code 内でターミナルを開きます。
ターミナルプロンプトで次のコマンドを実行して、Speech SDK for Python パッケージをインストールします。
```
python -m pip install azure-cognitiveservices-speech
```

Visual Studio Code および Python の詳細については、「Visual Studio Code」および「VS Code の Python の概要」をご覧ください。

Speech SDK を使用する

Python プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

import azure.cognitiveservices.speech as speechsdk

クイック スタート: Speech SDK のインストール

プラットフォームの要件

Speech SDK for C# をインストールする

Visual Studio プロジェクトを作成して Speech SDK をインストールする

helloworld プロジェクトを作成する

NuGet パッケージ マネージャーを使用して Speech SDK をインストールする

ターゲット アーキテクチャを選択する

プラットフォームの要件

Speech SDK for C++ をインストールする

プラットフォームの要件

Speech SDK for Go をインストールする

Go 環境を構成する

プラットフォームの要件

Speech SDK for Java をインストールする

サポートされるオペレーティング システム

プラットフォームの要件

Speech SDK for JavaScript をインストールする

Speech SDK を使用する

Speech SDK for Objective-C をインストールする

Speech SDK for Swift をインストールする

プラットフォームの要件

Speech SDK for Python をインストールする

PyPI からインストールする

最新の Speech SDK にアップグレードする

Speech SDK を使用する

関連するコンテンツ

その他のリソース

クイックスタート: Speech SDK のインストール

NuGet パッケージマネージャーを使用して Speech SDK をインストールする

ターゲットアーキテクチャを選択する

サポートされるオペレーティングシステム