Speech サービス コンテナーをインストールして実行する (プレビュー)Install and run Speech service containers (Preview)

コンテナーを使用すると、独自の環境で一部の Speech サービス API を実行できます。Containers enable you to run some of the Speech service APIs in your own environment. コンテナーは、特定のセキュリティ要件とデータ ガバナンス要件に適しています。Containers are great for specific security and data governance requirements. この記事では、Speech コンテナーをダウンロード、インストール、実行する方法について説明します。In this article you'll learn how to download, install, and run a Speech container.

Speech コンテナーでは、堅牢なクラウド機能とエッジの局所性の両方のために最適化された音声アプリケーション アーキテクチャを構築できます。Speech containers enable customers to build a speech application architecture that is optimized for both robust cloud capabilities and edge locality. 4 つの異なるコンテナーを利用できます。There are four different containers available. 2 つの標準コンテナーは、音声テキスト変換テキスト読み上げです。The two standard containers are Speech-to-text and Text-to-speech. 2 つのカスタム コンテナーは、カスタム音声変換カスタム テキスト読み上げです。The two custom containers are Custom Speech-to-text and Custom Text-to-speech.


現在のところ、音声コンテナーはすべて、パブリック "ゲート付き" プレビューの一部として提供されています。All speech containers are currently offered as part of a Public "Gated" Preview. 音声コンテナーが一般公開 (GA) になるときは告知があります。An announcement will be made when speech containers progress to General Availability (GA).

FunctionFunction [機能]Features 最新Latest
音声テキスト変換Speech-to-text 連続するリアルタイムの音声またはバッチ音声録音を、中間結果を含むテキストに文字起こしします。Transcribes continuous real-time speech or batch audio recordings into text with intermediate results.
カスタム音声変換Custom Speech-to-text Custom Speech ポータルのカスタム モデルを利用し、連続するリアルタイムの音声またはバッチ音声録音を、中間結果を含むテキストに文字起こしします。Using a custom model from the Custom Speech portal, transcribes continuous real-time speech or batch audio recordings into text with intermediate results.
テキスト読み上げText-to-speech テキストを、プレーンテキストの入力または音声合成マークアップ言語 (SSML) を含む自然な音声に変換します。Converts text to natural-sounding speech with plain text input or Speech Synthesis Markup Language (SSML).
カスタム テキスト読み上げCustom Text-to-speech Custom Voice ポータルのカスタム モデルを利用し、テキストを、プレーンテキストの入力または音声合成マークアップ言語 (SSML) を含む自然な音声に変換します。Using a custom model from the Custom Voice portal, converts text to natural-sounding speech with plain text input or Speech Synthesis Markup Language (SSML).

Azure サブスクリプションをお持ちでない場合は、開始する前に 無料アカウント を作成してください。If you don't have an Azure subscription, create a free account before you begin.


Speech コンテナーを使用する前の前提条件は次のとおりです。The following prerequisites before using Speech containers:

必須Required 目的Purpose
Docker エンジンDocker Engine ホスト コンピューターに Docker エンジンをインストールしておく必要があります。You need the Docker Engine installed on a host computer. Docker には、macOSWindowsLinux 上で Docker 環境の構成を行うパッケージが用意されています。Docker provides packages that configure the Docker environment on macOS, Windows, and Linux. Docker やコンテナーの基礎に関する入門情報については、「Docker overview」(Docker の概要) を参照してください。For a primer on Docker and container basics, see the Docker overview.

コンテナーが Azure に接続して課金データを送信できるように、Docker を構成する必要があります。Docker must be configured to allow the containers to connect with and send billing data to Azure.

Windows では、Linux コンテナーをサポートするように Docker を構成することも必要です。On Windows, Docker must also be configured to support Linux containers.

Docker に関する知識Familiarity with Docker レジストリ、リポジトリ、コンテナー、コンテナー イメージなど、Docker の概念の基本的な理解に加えて、基本的な docker コマンドの知識が必要です。You should have a basic understanding of Docker concepts, like registries, repositories, containers, and container images, as well as knowledge of basic docker commands.
Speech リソースSpeech resource これらのコンテナーを使用するためには、以下が必要です。In order to use these containers, you must have:

関連付けられている API キーとエンドポイント URI を取得するための Azure Speech リソース。An Azure Speech resource to get the associated API key and endpoint URI. どちらの値も、Azure portal の Speech の [概要] ページと [キー] ページで確認できます。Both values are available on the Azure portal's Speech Overview and Keys pages. コンテナーを起動するには、両方が必要です。They are both required to start the container.

{API_KEY} : [キー] ページにある 2 つの利用可能なリソース キーのどちらか{API_KEY}: One of the two available resource keys on the Keys page

{ENDPOINT_URI} : [概要] ページに提示されているエンドポイント{ENDPOINT_URI}: The endpoint as provided on the Overview page

コンテナー レジストリへのアクセスの要求Request access to the container registry

コンテナーへのアクセスを要求するには、Cognitive Services Speech コンテナー要求フォームに記入して送信します。Fill out and submit the Cognitive Services Speech Containers Request form to request access to the container.

このフォームでは、ユーザー、会社、コンテナーを使用するユーザー シナリオに関する情報が要求されます。The form requests information about you, your company, and the user scenario for which you'll use the container. フォームを送信すると、Azure Cognitive Services チームがそれをレビューして、プライベート コンテナー レジストリにアクセスするための条件を満たしていることを確認します。After you've submitted the form, the Azure Cognitive Services team reviews it to ensure that you meet the criteria for access to the private container registry.


フォームでは、Microsoft アカウント (MSA) または Azure Active Directory (Azure AD) アカウントに関連付けられたメール アドレスを使用する必要があります。You must use an email address that's associated with either a Microsoft Account (MSA) or Azure Active Directory (Azure AD) account in the form.

要求が承認されると、資格情報を取得してプライベート コンテナー レジストリにアクセスする方法を説明する手順が記載されたメールを受け取ります。If your request is approved, you'll receive an email with instructions that describe how to obtain your credentials and access the private container registry.

Docker CLI を使用してプライベート コンテナー レジストリを認証するUse the Docker CLI to authenticate the private container registry

Cognitive Services コンテナーのプライベート コンテナー レジストリはいくつかの方法で認証できますが、コマンド ラインからの推奨される方法は、Docker CLI を使用することです。You can authenticate with the private container registry for Cognitive Services Containers in any of several ways, but the recommended method from the command line is to use the Docker CLI.

次の例のように docker login コマンドを使用し、Cognitive Services コンテナーのプライベート コンテナー レジストリである containerpreview.azurecr.io にログインします。Use the docker login command, as shown in the following example, to log in to containerpreview.azurecr.io, the private container registry for Cognitive Services Containers. <username><password> を、Azure Cognitive Services チームから受け取った資格情報に指定されているユーザー名とパスワードにそれぞれ置き換えます。Replace <username> with the user name and <password> with the password that's provided in the credentials you received from the Azure Cognitive Services team.

docker login containerpreview.azurecr.io -u <username> -p <password>

テキスト ファイルで資格情報をセキュリティ保護した場合は、次の例に示すように、cat コマンドを使用して、そのテキスト ファイルの内容を docker login コマンドに連結することができます。If you've secured your credentials in a text file, you can concatenate the contents of that text file, by using the cat command, to the docker login command, as shown in the following example. <passwordFile> を、パスワードを含むテキスト ファイルのパスと名前に置き換え、 <username> を資格情報に指定されているユーザー名に置き換えます。Replace <passwordFile> with the path and name of the text file that contains the password and <username> with the user name that's provided in your credentials.

cat <passwordFile> | docker login containerpreview.azurecr.io -u <username> --password-stdin

必須パラメーターの収集Gathering required parameters

すべての Cognitive Services のコンテナーに対して必須である、3 つの主要なパラメーターがあります。There are three primary parameters for all Cognitive Services' containers that are required. エンドユーザー使用許諾契約書 (EULA) は、accept の値と共に提示される必要があります。The end-user license agreement (EULA) must be present with a value of accept. さらに、エンドポイント URL と API キーの両方が必要です。Additionally, both an Endpoint URL and API Key are needed.


エンドポイント URI の値は、Azure portal で、対応する Cognitive Service リソースの [概要] ページで入手できます。The Endpoint URI value is available on the Azure portal Overview page of the corresponding Cognitive Service resource. [概要] ページに移動してエンドポイントの上にマウス ポインターを移動すると、Copy to clipboard アイコンが表示されます。Navigate to the Overview page, hover over the Endpoint, and a Copy to clipboard icon will appear. 必要に応じてコピーして使用します。Copy and use where needed.

後で使用するためにエンドポイント URI を収集する

キー {API_KEY}Keys {API_KEY}

このキーはコンテナーを起動するために使用され、Azure portal で、対応する Cognitive Service リソースの [キー] ページで入手できます。This key is used to start the container, and is available on the Azure portal's Keys page of the corresponding Cognitive Service resource. [キー] ページに移動し、Copy to clipboard アイコンをクリックします。Navigate to the Keys page, and click on the Copy to clipboard icon.

後で使用するために 2 つのキーのどちらかを入手する


これらのサブスクリプション キーは、Cognitive Service API にアクセスするために使用されます。These subscription keys are used to access your Cognitive Service API. キーを共有しないでください。Do not share your keys. Azure Key Vault を使用するなどして、安全に保管してください。Store them securely, for example, using Azure Key Vault. これらのキーを定期的に再生成することもお勧めします。We also recommend regenerating these keys regularly. API 呼び出しを行うために必要なキーは 1 つだけです。Only one key is necessary to make an API call. 最初のキーを再生成するときに、2 番目のキーを使用してサービスに継続的にアクセスすることができます。When regenerating the first key, you can use the second key for continued access to the service.

ホスト コンピューターThe host computer

ホストとは、Docker コンテナーを実行する x64 ベースのコンピューターのことです。The host is a x64-based computer that runs the Docker container. お客様のオンプレミス上のコンピューターを使用できるほか、次のような Azure 内の Docker ホスティング サービスを使用することもできます。It can be a computer on your premises or a Docker hosting service in Azure, such as:

Advanced Vector Extension のサポートAdvanced Vector Extension support

ホストとは、Docker コンテナーを実行するコンピューターのことです。The host is the computer that runs the docker container. ホストは、高度なベクター拡張機能 (AVX2) を サポートしている必要がありますThe host must support Advanced Vector Extensions (AVX2). 次のコマンドを使用して、Linux ホストでの AVX2 サポートを確認できます。You can check for AVX2 support on Linux hosts with the following command:

grep -q avx2 /proc/cpuinfo && echo AVX2 supported || echo No AVX2 support detected


AVX2 をサポートするにはホスト コンピューターが必須です。The host computer is required to support AVX2. AVX2 サポートがないと、コンテナーは正しく機能しませんThe container will not function correctly without AVX2 support.

コンテナーの要件と推奨事項Container requirements and recommendations

次の表に、各 Speech コンテナーに割り当てるリソースの最小値と推奨値を示します。The following table describes the minimum and recommended allocation of resources for each Speech container.

コンテナーContainer 最小値Minimum 推奨Recommended
音声テキスト変換Speech-to-text 2 コア、2 GB のメモリ2 core, 2-GB memory 4 コア、4 GB メモリ4 core, 4-GB memory
  • 各コアは少なくとも 2.6 ギガヘルツ (GHz) 以上にする必要があります。Each core must be at least 2.6 gigahertz (GHz) or faster.

コアとメモリは、docker run コマンドの一部として使用される --cpus--memory の設定に対応します。Core and memory correspond to the --cpus and --memory settings, which are used as part of the docker run command.


最小および推奨値は、Docker の制限に基づくもので、ホスト マシンのリソースに基づくものではありませんThe minimum and recommended are based off of Docker limits, not the host machine resources. たとえば、音声テキスト変換コンテナーは、大規模な言語モデルの一部をメモリ マップするため、ファイル全体がメモリに収まるようにすることを "お勧めします"。これには、追加で 4 から 6 GB が必要です。For example, speech-to-text containers memory map portions of a large language model, and it is recommended that the entire file fits in memory, which is an additional 4-6 GB. また、モデルがメモリにページングされているため、どちらかのコンテナーの最初の実行に時間がかかる場合があります。Also, the first run of either container may take longer, since models are being paged into memory.

docker pull によるコンテナー イメージの取得Get the container image with docker pull

Speech のコンテナー イメージは、次のコンテナー レジストリで入手できます。Container images for Speech are available in the following Container Registry.

コンテナーContainer リポジトリRepository
音声テキスト変換Speech-to-text containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text:latest


docker images コマンドを使用して、ダウンロードしたコンテナー イメージを一覧表示できます。You can use the docker images command to list your downloaded container images. たとえば、次のコマンドは、ダウンロードした各コンテナー イメージの ID、リポジトリ、およびタグが表として書式設定されて表示されます。For example, the following command lists the ID, repository, and tag of each downloaded container image, formatted as a table:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

Speech コンテナー用の docker pullDocker pull for the Speech containers

Speech-to-text コンテナー用の docker pullDocker pull for the Speech-to-text container

Container Preview レジストリからコンテナー イメージをダウンロードするには、docker pull コマンドを使用します。Use the docker pull command to download a container image from Container Preview registry.

docker pull containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text:latest


latest タグにより、en-US ロケールがプルされます。The latest tag pulls the en-US locale. 追加のロケールについては、「音声テキスト変換ロケール」を参照してください。For additional locales see Speech-to-text locales.

音声テキスト変換ロケールSpeech-to-text locales

latest を除くすべてのタグは、次の形式であり、大文字と小文字が区別されます。All tags, except for latest are in the following format and are case-sensitive:


次のタグは、この形式の例です。The following tag is an example of the format:


音声テキスト変換コンテナーのサポートされている全ロケールについては、「音声テキスト変換イメージ タグ」を参照してください。For all of the supported locales of the speech-to-text container, please see Speech-to-text image tags.

コンテナーを使用する方法How to use the container

コンテナーをホスト コンピューター上に用意できたら、次の手順を使用してコンテナーを操作します。Once the container is on the host computer, use the following process to work with the container.

  1. 必要な課金設定を使用してコンテナーを実行します。Run the container, with the required billing settings. docker run コマンドの他のもご覧いただけます。More examples of the docker run command are available.
  2. コンテナーの予測エンドポイントに対するクエリを実行しますQuery the container's prediction endpoint.

docker run によるコンテナーの実行Run the container with docker run

コンテナーを実行するには、docker run コマンドを使用します。Use the docker run command to run the container. {Endpoint_URI}{API_Key} の値を取得する方法の詳細については、「必須パラメーターの収集」を参照してください。Refer to gathering required parameters for details on how to get the {Endpoint_URI} and {API_Key} values. docker run コマンドの追加も利用できます。Additional examples of the docker run command are also available.

Speech-to-text コンテナーを実行するには、次の docker run コマンドを実行します。To run the Speech-to-text container, execute the following docker run command.

docker run --rm -it -p 5000:5000 --memory 4g --cpus 4 \
containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \

このコマンドは、次の操作を行います。This command:

  • コンテナー イメージから Speech-to-text コンテナーを実行しますRuns a Speech-to-text container from the container image.
  • 4 つの CPU コアと 4 ギガバイト (GB) のメモリを割り当てます。Allocates 4 CPU cores and 4 gigabytes (GB) of memory.
  • TCP ポート 5000 を公開し、コンテナーに pseudo-TTY を割り当てます。Exposes TCP port 5000 and allocates a pseudo-TTY for the container.
  • コンテナーの終了後にそれを自動的に削除します。Automatically removes the container after it exits. ホスト コンピューター上のコンテナー イメージは引き続き利用できます。The container image is still available on the host computer.


コンテナーを実行するには、EulaBillingApiKey の各オプションを指定する必要があります。そうしないと、コンテナーが起動しません。The Eula, Billing, and ApiKey options must be specified to run the container; otherwise, the container won't start. 詳細については、「課金」を参照してください。For more information, see Billing.

コンテナーの予測エンドポイントに対するクエリの実行Query the container's prediction endpoint

ContainersContainers SDK ホスト URLSDK Host URL ProtocolProtocol
音声変換およびカスタム音声変換Speech-to-text and Custom Speech-to-text ws://localhost:5000 WSWS
テキスト読み上げおよびカスタム テキスト読み上げText-to-speech and Custom Text-to-speech http://localhost:5000 HTTPHTTP

WSS プロトコルと HTTPS プロトコルを使用する方法については、コンテナー セキュリティに関するセクションを参照してください。For more information on using WSS and HTTPS protocols, see container security.

音声変換またはカスタム音声変換Speech-to-text or Custom Speech-to-text

コンテナーは、websocket ベースのクエリ エンドポイント API シリーズを提供します。これには、Speech SDK を介してアクセスします。The container provides websocket-based query endpoint APIs, that are accessed through the Speech SDK. 既定では、Speech SDK は、オンラインの音声サービスを使用します。By default, the Speech SDK uses online speech services. コンテナーを使用するには、初期化方法を変更する必要があります。To use the container, you need to change the initialization method.


Speech SDK とコンテナーを使用する場合、Azure Speech リソースのサブスクリプション キーまたは認証ベアラー トークンを提供する必要はありません。When using the Speech SDK with containers, you do not need to provide the Azure Speech resource subscription key or an authentication bearer token.

次の例を参照してください。See the examples below.

この Azure クラウド初期化呼び出しを使用する方法をChange from using this Azure-cloud initialization call:

var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");

次のようにコンテナー ホストを使用する呼び出しに変更します。to this call using the container host:

var config = SpeechConfig.FromHost(
    new Uri("ws://localhost:5000"));

テキスト読み上げまたはカスタム テキスト読み上げText-to-speech or Custom Text-to-speech

コンテナーには、REST ベースのエンドポイント API が用意されています。The container provides REST-based endpoint APIs. 各種のプラットフォーム、フレームワーク、言語向けに、多数のサンプル ソース コード プロジェクトが提供されています。There are many sample source code projects for platform, framework, and language variations available.

"標準のテキスト読み上げ" コンテナーでは、ダウンロードしたイメージ タグのロケールと音声を使用することになります。With the Standard Text-to-speech container, you should rely on the locale and voice of the image tag you downloaded. たとえば、latest タグをダウンロードした場合、既定のロケールは en-US で、音声は JessaRUS になります。For example, if you downloaded the latest tag the default locale is en-US and the JessaRUS voice. そのうえで、{VOICE_NAME} 引数は en-US-JessaRUS となります。The {VOICE_NAME} argument would then be en-US-JessaRUS. 次のサンプル SSML をご覧ください。See the example SSML below:

<speak version="1.0" xml:lang="en-US">
    <voice name="en-US-JessaRUS">
        This text will get converted into synthesized speech.

ただし、"カスタムのテキスト読み上げ" では、カスタム音声ポータルから音声やモデルを取得する必要があります。However, for Custom Text-to-speech you'll need to obtain the Voice / model from the custom voice portal. カスタム モデル名は、音声名と同義です。The custom model name is synonymous with the voice name. [トレーニング] ページに移動し、{VOICE_NAME} 引数として使用する音声やモデルをコピーします。Navigate to the Training page, and copy the Voice / model to use as the {VOICE_NAME} argument.

カスタム音声モデル - 音声名

次のサンプル SSML をご覧ください。See the example SSML below:

<speak version="1.0" xml:lang="en-US">
    <voice name="custom-voice-model">
        This text will get converted into synthesized speech.

いくつかのヘッダーとデータ ペイロードを指定して、HTTP POST 要求を作成してみましょう。Let's construct an HTTP POST request, providing a few headers and a data payload. {VOICE_NAME} プレースホルダーは、実際の値に置き換えてください。Replace the {VOICE_NAME} placeholder with your own value.

curl -s -v -X POST http://localhost:5000/speech/synthesize/cognitiveservices/v1 \
 -H 'Accept: audio/*' \
 -H 'Content-Type: application/ssml+xml' \
 -H 'X-Microsoft-OutputFormat: riff-16khz-16bit-mono-pcm' \
 -d '<speak version="1.0" xml:lang="en-US"><voice name="{VOICE_NAME}">This is a test, only a test.</voice></speak>'

このコマンドは、次の操作を行います。This command:

  • speech/synthesize/cognitiveservices/v1 エンドポイントの HTTP POST 要求を作成します。Constructs an HTTP POST request for the speech/synthesize/cognitiveservices/v1 endpoint.
  • audio/*Accept ヘッダーを指定します。Specifies an Accept header of audio/*
  • application/ssml+xmlContent-Type ヘッダーを指定します。詳細については、要求本文を参照してください。Specifies a Content-Type header of application/ssml+xml, for more information, see request body.
  • riff-16khz-16bit-mono-pcmX-Microsoft-OutputFormat ヘッダーを指定します。その他のオプションについては、「オーディオ出力」を参照してください。Specifies a X-Microsoft-OutputFormat header of riff-16khz-16bit-mono-pcm, for more options see audio output.
  • {VOICE_NAME} が指定された音声合成マークアップ言語 (SSML) 要求をエンドポイントに送信します。Sends the Speech Synthesis Markup Language (SSML) request given the {VOICE_NAME} to the endpoint.

同じホスト上で複数のコンテナーを実行するRun multiple containers on the same host

公開されているポートを使って複数のコンテナーを実行する予定の場合、必ず各コンテナーを別の公開されているポートで実行してください。If you intend to run multiple containers with exposed ports, make sure to run each container with a different exposed port. たとえば、最初のコンテナーをポート 5000 上で、2 番目のコンテナーを 5001 上で実行します。For example, run the first container on port 5000 and the second container on port 5001.

このコンテナーと、別の Azure Cognitive Services コンテナーを HOST 上で同時に実行することができます。You can have this container and a different Azure Cognitive Services container running on the HOST together. 同じ Cognitive Services コンテナーの複数のコンテナーを実行することもできます。You also can have multiple containers of the same Cognitive Services container running.

コンテナーが実行されていることを検証するValidate that a container is running

コンテナーが実行されていることを検証する方法は複数あります。There are several ways to validate that the container is running. 問題になっているコンテナーの "外部 IP" アドレスと公開ポートを特定し、任意の Web ブラウザーを開きます。Locate the External IP address and exposed port of the container in question, and open your favorite web browser. 以下に示した各種の要求 URL を使用して、コンテナーが実行中であることを確認します。Use the various request URLs below to validate the container is running. 以下に示した例の要求 URL は http://localhost:5000 ですが、実際のコンテナーは異なる可能性があります。The example request URLs listed below are http://localhost:5000, but your specific container may vary. ベースとなるのは実際のコンテナーの "外部 IP" アドレスと公開ポートであることに注意してください。Keep in mind that you're to rely on your container's External IP address and exposed port.

要求 URLRequest URL 目的Purpose
http://localhost:5000/ コンテナーには、ホーム ページが用意されています。The container provides a home page.
http://localhost:5000/status HTTP GET で要求され、エンドポイント クエリを発生させずにコンテナーが実行されていることを検証します。Requested with an HTTP GET, to validate that the container is running without causing an endpoint query. この要求は Kubernetes の liveness probe と readiness probe に対して使用できます。This request can be used for Kubernetes liveness and readiness probes.
http://localhost:5000/swagger コンテナーには、エンドポイントの完全なドキュメント一式と、 [Try it out](試してみる) の機能が用意されています。The container provides a full set of documentation for the endpoints and a Try it out feature. この機能を使用すると、コードを一切記述することなく、お客様の設定を Web ベースの HTML フォームに入力したりクエリを実行したりできます。With this feature, you can enter your settings into a web-based HTML form and make the query without having to write any code. クエリから戻った後、HTTP ヘッダーと HTTP 本文の必要な形式を示すサンプル CURL コマンドが得られます。After the query returns, an example CURL command is provided to demonstrate the HTTP headers and body format that's required.

コンテナーのホーム ページ

コンテナーの停止Stop the container

コンテナーをシャットダウンするには、コンテナーが実行されているコマンドライン環境で、Ctrl + C キーを押します。To shut down the container, in the command-line environment where the container is running, select Ctrl+C.


コンテナーを起動または実行するとき、問題が発生することがあります。When starting or running the container, you may experience issues. 出力マウントを使用し、ログ記録を有効にします。Use an output mount and enable logging. これにより、問題の解決時に役立つログ ファイルをコンテナーで生成できます。Doing so will allow the container to generate log files that are helpful when troubleshooting issues.


トラブルシューティング情報とガイダンスの詳細については、「Cognitive Services コンテナーについてよくあるご質問 (FAQ)」を参照してください。For more troubleshooting information and guidance, see Cognitive Services containers frequently asked questions (FAQ).


Speech コンテナーは、Azure アカウントの Speech リソースを使用して、Azure に課金情報を送信します。The Speech containers send billing information to Azure, using a Speech resource on your Azure account.

コンテナーへのクエリは、<ApiKey> に使用される Azure リソースの価格レベルで課金されます。Queries to the container are billed at the pricing tier of the Azure resource that's used for the <ApiKey>.

Azure Cognitive Services コンテナーは、計測のために課金エンドポイントに接続していないと、実行のライセンスが許可されません。Azure Cognitive Services containers aren't licensed to run without being connected to the billing endpoint for metering. お客様は、コンテナーが常に課金エンドポイントに課金情報を伝えられるようにする必要があります。You must enable the containers to communicate billing information with the billing endpoint at all times. Cognitive Services コンテナーによって、お客様のデータ (解析対象の画像やテキストなど) が Microsoft に送信されることはありません。Cognitive Services containers don't send customer data, such as the image or text that's being analyzed, to Microsoft.

Azure に接続するConnect to Azure

コンテナーには、実行する課金引数の値が必要です。The container needs the billing argument values to run. これらの値により、コンテナーは課金エンドポイントに接続することができます。These values allow the container to connect to the billing endpoint. コンテナーから、約 10 ~ 15 分ごとに使用状況が報告されます。The container reports usage about every 10 to 15 minutes. 許可された時間枠内でコンテナーが Azure に接続しなかった場合、コンテナーは引き続き実行されますが、課金エンドポイントが復元されるまでクエリには対応しません。If the container doesn't connect to Azure within the allowed time window, the container continues to run but doesn't serve queries until the billing endpoint is restored. 接続は、10 ~15 分の同じ時間間隔で、10 回試行されます。The connection is attempted 10 times at the same time interval of 10 to 15 minutes. 10 回以内に課金エンドポイントに接続できなかった場合は、コンテナーの実行が停止されます。If it can't connect to the billing endpoint within the 10 tries, the container stops running.

課金引数Billing arguments

docker run コマンドでコンテナーを起動するには、次の 3 つのオプションすべてに有効な値を指定する必要があります。For the docker run command to start the container, all three of the following options must be specified with valid values:

オプションOption [説明]Description
ApiKey 課金情報を追跡するために使用される Cognitive Services リソースの API キー。The API key of the Cognitive Services resource that's used to track billing information.
このオプションの値には、Billing に指定されたプロビジョニング済みのリソースの API キーが設定されている必要があります。The value of this option must be set to an API key for the provisioned resource that's specified in Billing.
Billing 課金情報を追跡するために使用される Cognitive Services リソースのエンドポイント。The endpoint of the Cognitive Services resource that's used to track billing information.
このオプションの値には、プロビジョニング済みの Azure リソースのエンドポイント URI が設定されている必要があります。The value of this option must be set to the endpoint URI of a provisioned Azure resource.
Eula お客様がコンテナーのライセンスに同意したことを示します。Indicates that you accepted the license for the container.
このオプションの値は accept に設定する必要があります。The value of this option must be set to accept.

これらのオプションの詳細については、「コンテナーの構成」を参照してください。For more information about these options, see Configure containers.

ブログ記事Blog posts

開発者向けサンプルDeveloper samples

開発者向けサンプルは、GitHub リポジトリから入手できます。Developer samples are available at our GitHub repository.

ウェビナーの閲覧View webinar

ウェビナーに参加して、以下について学習します。Join the webinar to learn about:

  • Docker を使用して任意のマシンに Cognitive Services をデプロイする方法How to deploy Cognitive Services to any machine using Docker
  • Cognitive Services を AKS にデプロイする方法How to deploy Cognitive Services to AKS


この記事では、Speech コンテナーの概念とそのダウンロード、インストール、および実行のワークフローについて学習しました。In this article, you learned concepts and workflow for downloading, installing, and running Speech containers. 要約すると:In summary:

  • Speech は、Docker 用に 4 つの Linux コンテナーを提供し、さまざまな機能をカプセル化します。Speech provides four Linux containers for Docker, encapsulating various capabilities:
    • 音声テキスト変換Speech-to-text
    • カスタム音声変換Custom Speech-to-text
    • テキスト読み上げText-to-speech
    • カスタム テキスト読み上げCustom Text-to-speech
  • コンテナー イメージは、Azure のコンテナー レジストリからダウンロードされます。Container images are downloaded from the container registry in Azure.
  • コンテナー イメージを Docker で実行します。Container images run in Docker.
  • REST API または SDK を使用して、コンテナーのホスト URI を指定することによって、Speech コンテナーの操作を呼び出すことができます。You can use either the REST API or SDK to call operations in Speech containers by specifying the host URI of the container.
  • コンテナーをインスタンス化するときは、課金情報を指定するように要求されます。You're required to provide billing information when instantiating a container.


Cognitive Services コンテナーは、計測のために Azure に接続していないと、実行のライセンスが許可されません。Cognitive Services containers are not licensed to run without being connected to Azure for metering. お客様は、コンテナーが常に計測サービスに課金情報を伝えられるようにする必要があります。Customers need to enable the containers to communicate billing information with the metering service at all times. Cognitive Services コンテナーが、顧客データ (解析対象の画像やテキストなど) を Microsoft に送信することはありません。Cognitive Services containers do not send customer data (e.g., the image or text that is being analyzed) to Microsoft.

次のステップNext steps