Text-to-Speech REST API

Speech Service では、一連の REST API を使用して、テキストを合成音声に変換したり、リージョンでサポートされている音声の一覧を取得したりできます。 利用可能な各エンドポイントは、リージョンに関連付けられています。 使用を検討しているエンドポイント/リージョンのサブスクリプション キーが必要です。

Text-to-Speech REST API ではニューラルテキスト読み上げ音声がサポートされ、それによってロケールで識別される特定の言語と方言がサポートされています。

  • 音声の全一覧については、言語のサポートに関するページを参照してください。
  • リージョン別の提供状況については、リージョンに関するページを参照してください。

重要

コストは、事前構築済みのニューラル音声 (価格ページでは "ニューラル" で示されています) とカスタム ニューラル音声 (価格ページでは "カスタム ニューラル" で示されています) によって異なります。 詳細については、価格に関するページをご覧ください。

この API を使用する前に、次の点を理解しておいてください。

  • Text-to-Speech REST API には、Authorization ヘッダーが必要です。 つまり、このサービスにアクセスするためには、トークンの交換が済んでいる必要があります。 詳細については、認証に関するページをご覧ください。

ヒント

Azure Government と Azure China のエンドポイントについては、こちらの記事を参照してください。

認証

各要求には Authorization ヘッダーが必要です。 次の表は、各サービスでサポートされているヘッダーを示したものです。

サポートされている Authorization ヘッダー 音声テキスト変換 テキスト読み上げ
Ocp-Apim-Subscription-Key はい はい
Authorization: Bearer はい はい

Ocp-Apim-Subscription-Key ヘッダーを使用する場合、指定する必要があるのはサブスクリプション キーだけです。 次に例を示します。

'Ocp-Apim-Subscription-Key': 'YOUR_SUBSCRIPTION_KEY'

Authorization: Bearer ヘッダーを使用する場合は、issueToken エンドポイントに対して要求を実行する必要があります。 この要求では、サブスクリプション キーを、10 分間有効なアクセス トークンと交換します。 以降のいくつかのセクションでは、トークンの取得方法と使用方法について説明します。

アクセス トークンを取得する方法

アクセス トークンを取得するには、Ocp-Apim-Subscription-Key とサブスクリプション キーを使用して、issueToken エンドポイントに対して要求を実行する必要があります。

issueToken エンドポイントの形式は次のとおりです。

https://<REGION_IDENTIFIER>.api.cognitive.microsoft.com/sts/v1.0/issueToken

次の表に示す、ご利用のサブスクリプションのリージョンと一致する識別子で <REGION_IDENTIFIER> を置き換えてください。

[地理的な場所] リージョン リージョン識別子
アメリカ 米国中部 centralus
アメリカ 米国東部 eastus
アメリカ 米国東部 2 eastus2
アメリカ 米国中北部 northcentralus
米国 米国中南部 southcentralus
アメリカ 米国中西部 westcentralus
アメリカ 米国西部 westus
アメリカ 米国西部 2 westus2
米国 カナダ中部 canadacentral
米国 Brazil South brazilsouth
アジア太平洋 東アジア eastasia
アジア太平洋 東南アジア southeastasia
アジア太平洋 オーストラリア東部 australiaeast
アジア太平洋 インド中部 centralindia
アジア太平洋 東日本 japaneast
アジア太平洋 西日本 japanwest
アジア太平洋 韓国中部 koreacentral
ヨーロッパ 北ヨーロッパ northeurope
ヨーロッパ 西ヨーロッパ westeurope
ヨーロッパ フランス中部 francecentral
ヨーロッパ スイス北部 switzerlandnorth
ヨーロッパ 英国南部 uksouth

アクセス トークン要求の作成にあたっては、以下のサンプルを使用してください。

HTTP のサンプル

この例は、トークンを取得するための単純な HTTP 要求です。 YOUR_SUBSCRIPTION_KEY は、お使いの Speech Service のサブスクリプション キーに置き換えてください。 お使いのサブスクリプションが米国西部リージョンにない場合は、Host ヘッダーをご自身のリージョンのホスト名に置き換えます。

POST /sts/v1.0/issueToken HTTP/1.1
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY
Host: westus.api.cognitive.microsoft.com
Content-type: application/x-www-form-urlencoded
Content-Length: 0

応答の本文には、JSON Web トークン (JWT) 形式のアクセス トークンが格納されます。

PowerShell のサンプル

この例は、アクセス トークンを取得するための単純な PowerShell スクリプトです。 YOUR_SUBSCRIPTION_KEY は、お使いの Speech Service のサブスクリプション キーに置き換えてください。 必ず、実際のサブスクリプションに合ったリージョンの正しいエンドポイントを使用してください。 この例では現在、米国西部に設定されています。

$FetchTokenHeader = @{
  'Content-type'='application/x-www-form-urlencoded';
  'Content-Length'= '0';
  'Ocp-Apim-Subscription-Key' = 'YOUR_SUBSCRIPTION_KEY'
}

$OAuthToken = Invoke-RestMethod -Method POST -Uri https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken
 -Headers $FetchTokenHeader

# show the token received
$OAuthToken

cURL のサンプル

cURL は Linux (および Windows Subsystem for Linux) で使用できるコマンドライン ツールです。 この cURL コマンドは、アクセス トークンを取得する方法を示しています。 YOUR_SUBSCRIPTION_KEY は、お使いの Speech Service のサブスクリプション キーに置き換えてください。 必ず、実際のサブスクリプションに合ったリージョンの正しいエンドポイントを使用してください。 この例では現在、米国西部に設定されています。

curl -v -X POST \
 "https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken" \
 -H "Content-type: application/x-www-form-urlencoded" \
 -H "Content-Length: 0" \
 -H "Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY"

C# のサンプル

この C# クラスは、アクセス トークンを取得する方法を示しています。 クラスをインスタンス化するときに、お使いの Speech Service のサブスクリプション キーを渡す必要があります。 お使いのサブスクリプションが米国西部リージョンにない場合は、実際のサブスクリプションのリージョンに合わせて FetchTokenUri の値を変更してください。

public class Authentication
{
    public static readonly string FetchTokenUri =
        "https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken";
    private string subscriptionKey;
    private string token;

    public Authentication(string subscriptionKey)
    {
        this.subscriptionKey = subscriptionKey;
        this.token = FetchTokenAsync(FetchTokenUri, subscriptionKey).Result;
    }

    public string GetAccessToken()
    {
        return this.token;
    }

    private async Task<string> FetchTokenAsync(string fetchUri, string subscriptionKey)
    {
        using (var client = new HttpClient())
        {
            client.DefaultRequestHeaders.Add("Ocp-Apim-Subscription-Key", subscriptionKey);
            UriBuilder uriBuilder = new UriBuilder(fetchUri);

            var result = await client.PostAsync(uriBuilder.Uri.AbsoluteUri, null);
            Console.WriteLine("Token Uri: {0}", uriBuilder.Uri.AbsoluteUri);
            return await result.Content.ReadAsStringAsync();
        }
    }
}

Python のサンプル

# Request module must be installed.
# Run pip install requests if necessary.
import requests

subscription_key = 'REPLACE_WITH_YOUR_KEY'


def get_token(subscription_key):
    fetch_token_url = 'https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken'
    headers = {
        'Ocp-Apim-Subscription-Key': subscription_key
    }
    response = requests.post(fetch_token_url, headers=headers)
    access_token = str(response.text)
    print(access_token)

アクセス トークンを使用する方法

このサービスには、アクセス トークンを Authorization: Bearer <TOKEN> ヘッダーとして送信する必要があります。 各アクセス トークンは 10 分間有効です。 新しいトークンはいつでも取得できますが、ネットワークのトラフィックと待ち時間を最小限に抑えるために、同じトークンを 9 分間使用することをお勧めします。

次の例では、短いオーディオ用の音声テキスト変換 REST API への HTTP 要求を示します。

POST /cognitiveservices/v1 HTTP/1.1
Authorization: Bearer YOUR_ACCESS_TOKEN
Host: westus.stt.speech.microsoft.com
Content-type: application/ssml+xml
Content-Length: 199
Connection: Keep-Alive

// Message body here...

音声の一覧を取得する

voices/list エンドポイントでは、特定のリージョン/エンドポイントの音声の完全な一覧を取得できます。

リージョンとエンドポイント

リージョン エンドポイント
オーストラリア東部 https://australiaeast.tts.speech.microsoft.com/cognitiveservices/voices/list
ブラジル南部 https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/voices/list
カナダ中部 https://canadacentral.tts.speech.microsoft.com/cognitiveservices/voices/list
米国中部 https://centralus.tts.speech.microsoft.com/cognitiveservices/voices/list
東アジア https://eastasia.tts.speech.microsoft.com/cognitiveservices/voices/list
米国東部 https://eastus.tts.speech.microsoft.com/cognitiveservices/voices/list
米国東部 2 https://eastus2.tts.speech.microsoft.com/cognitiveservices/voices/list
フランス中部 https://francecentral.tts.speech.microsoft.com/cognitiveservices/voices/list
インド中部 https://centralindia.tts.speech.microsoft.com/cognitiveservices/voices/list
東日本 https://japaneast.tts.speech.microsoft.com/cognitiveservices/voices/list
韓国中部 https://koreacentral.tts.speech.microsoft.com/cognitiveservices/voices/list
米国中北部 https://northcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
北ヨーロッパ https://northeurope.tts.speech.microsoft.com/cognitiveservices/voices/list
南アフリカ北部 https://southafricanorth.tts.speech.microsoft.com/cognitiveservices/voices/list
米国中南部 https://southcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
東南アジア https://southeastasia.tts.speech.microsoft.com/cognitiveservices/voices/list
英国南部 https://uksouth.tts.speech.microsoft.com/cognitiveservices/voices/list
米国中西部 https://westcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
西ヨーロッパ https://westeurope.tts.speech.microsoft.com/cognitiveservices/voices/list
米国西部 https://westus.tts.speech.microsoft.com/cognitiveservices/voices/list
米国西部 2 https://westus2.tts.speech.microsoft.com/cognitiveservices/voices/list

ヒント

プレビュー段階の音声は 3 つのリージョン (米国東部、西ヨーロッパ、東南アジア) でのみ使用できます。

要求ヘッダー

この表は、テキスト読み上げ要求の必須のヘッダーと省略可能なヘッダーの一覧です。

ヘッダー 説明 必須/省略可能
Ocp-Apim-Subscription-Key 音声サービスのサブスクリプション キー。 このヘッダーと Authorization のどちらかが必須となります。
Authorization 単語 Bearer が前に付いた認証トークン。 詳細については、認証に関するページをご覧ください。 このヘッダーと Ocp-Apim-Subscription-Key のどちらかが必須となります。

要求本文

このエンドポイントへの GET 要求の本文は不要です。

要求のサンプル

この要求には Authorization ヘッダーのみが必要です。

GET /cognitiveservices/voices/list HTTP/1.1

Host: westus.tts.speech.microsoft.com
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY

応答のサンプル

この応答は、応答の構造を説明するために切り詰められています。

Note

利用可能な音声はリージョン/エンドポイントによって異なります。

[

    {
    "Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyNeural)",
    "DisplayName": "Jenny",
    "LocalName": "Jenny",
    "ShortName": "en-US-JennyNeural",
    "Gender": "Female",
    "Locale": "en-US",
    "StyleList": [
      "chat",
      "customerservice",
      "newscast-casual",
      "assistant",
    ],
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

    ...

     {
    "Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyMultilingualNeural)",
    "ShortName": "en-US-JennyMultilingualNeural",
    "DisplayName": "Jenny Multilingual",
    "LocalName": "Jenny Multilingual",
    "Gender": "Female",
    "Locale": "en-US",
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "SecondaryLocaleList": [
        "de-DE",
        "en-AU",
        "en-CA",
        "en-GB",
        "es-ES",
        "es-MX",
        "fr-CA",
        "fr-FR",
        "it-IT",
        "ja-JP",
        "ko-KR",
        "pt-BR",
        "zh-CN"
      ],
    "Status": "Preview"
    },
    
  ...
    
    {
    "Name": "Microsoft Server Speech Text to Speech Voice (ga-IE, OrlaNeural)",
    "DisplayName": "Orla",
    "LocalName": "Orla",
    "ShortName": "ga-IE-OrlaNeural",
    "Gender": "Female",
    "Locale": "ga-IE",
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

  ...

   {
    "Name": "Microsoft Server Speech Text to Speech Voice (zh-CN, YunxiNeural)",
    "DisplayName": "Yunxi",
    "LocalName": "云希",
    "ShortName": "zh-CN-YunxiNeural",
    "Gender": "Male",
    "Locale": "zh-CN",
    "StyleList": [
      "Calm",
      "Fearful",
      "Cheerful",
      "Disgruntled",
      "Serious",
      "Angry",
      "Sad",
      "Depressed",
      "Embarrassed"
    ],
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

    ...

]

HTTP 状態コード

各応答の HTTP 状態コードは、成功または一般的なエラーを示します。

HTTP 状態コード 説明 考えられる理由
200 [OK] 要求は成功しました。
400 正しくない要求 必須パラメーターが指定されていない、空、または null です。 または、必須またはオプションのパラメーターに渡された値が無効です。 よくある問題はヘッダーが長すぎることです。
401 権限がありません 要求が承認されていません。 サブスクリプション キーまたはトークンが有効であり、正しいリージョンにあることを確認してください。
429 要求が多すぎます 使用中のサブスクリプションで許可されている要求のクォータまたは速度を超えています。
502 無効なゲートウェイ ネットワークまたはサーバー側の問題です。 無効なヘッダーを示す場合もあります。

テキストを音声に変換する

v1 エンドポイントでは、v1 を使用してテキストを音声に変換することができます。

リージョンとエンドポイント

この REST API を使用したテキスト読み上げは、以下のリージョンでサポートされます。 必ず、ご利用のサブスクリプションのリージョンと一致するエンドポイントを選択してください。

あらかじめ構築されたニューラル音声

このテーブルを使用して、リージョンまたはエンドポイントごとのニューラル音声の可用性を判断します。

リージョン エンドポイント
オーストラリア東部 https://australiaeast.tts.speech.microsoft.com/cognitiveservices/v1
ブラジル南部 https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/v1
カナダ中部 https://canadacentral.tts.speech.microsoft.com/cognitiveservices/v1
米国中部 https://centralus.tts.speech.microsoft.com/cognitiveservices/v1
東アジア https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1
米国東部 https://eastus.tts.speech.microsoft.com/cognitiveservices/v1
米国東部 2 https://eastus2.tts.speech.microsoft.com/cognitiveservices/v1
フランス中部 https://francecentral.tts.speech.microsoft.com/cognitiveservices/v1
インド中部 https://centralindia.tts.speech.microsoft.com/cognitiveservices/v1
東日本 https://japaneast.tts.speech.microsoft.com/cognitiveservices/v1
西日本 https://japanwest.tts.speech.microsoft.com/cognitiveservices/v1
韓国中部 https://koreacentral.tts.speech.microsoft.com/cognitiveservices/v1
米国中北部 https://northcentralus.tts.speech.microsoft.com/cognitiveservices/v1
北ヨーロッパ https://northeurope.tts.speech.microsoft.com/cognitiveservices/v1
米国中南部 https://southcentralus.tts.speech.microsoft.com/cognitiveservices/v1
東南アジア https://southeastasia.tts.speech.microsoft.com/cognitiveservices/v1
英国南部 https://uksouth.tts.speech.microsoft.com/cognitiveservices/v1
米国中西部 https://westcentralus.tts.speech.microsoft.com/cognitiveservices/v1
西ヨーロッパ https://westeurope.tts.speech.microsoft.com/cognitiveservices/v1
米国西部 https://westus.tts.speech.microsoft.com/cognitiveservices/v1
米国西部 2 https://westus2.tts.speech.microsoft.com/cognitiveservices/v1

ヒント

プレビュー段階の音声は 3 つのリージョン (米国東部、西ヨーロッパ、東南アジア) でのみ使用できます。

カスタム ニューラル音声

カスタム ニューラル音声フォントを作成した場合は、作成したエンドポイントを使用します。 また、以下の一覧に示したエンドポイントを使用して、{deploymentId} をニューラル音声モデル用のデプロイ ID に置き換えます。

リージョン エンドポイント
オーストラリア東部 https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
ブラジル南部 https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
カナダ中部 https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中部 https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東アジア https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国東部 https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国東部 2 https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
フランス中部 https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
インド中部 https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東日本 https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
西日本 https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
韓国中部 https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中北部 https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
北ヨーロッパ https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中南部 https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東南アジア https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
英国南部 https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
西ヨーロッパ https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中西部 https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国西部 https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国西部 2 https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}

Note

上記のリージョンは、ニューラル音声モデルのホスティングとリアルタイム合成に利用できます。 カスタム ニューラル音声のトレーニングが利用できるのは、米国東部、東南アジア、英国南部の 3 つのリージョンのみとなります。 ただし、3 つのリージョンのニューラル音声モデルは、前述した他の異なるリージョンへとユーザーが簡単にコピーできます。

Long Audio API

Long Audio API は、一意のエンドポイントを持つ複数のリージョンで使用できます。

リージョン エンドポイント
オーストラリア東部 https://australiaeast.customvoice.api.speech.microsoft.com
米国東部 https://eastus.customvoice.api.speech.microsoft.com
インド中部 https://centralindia.customvoice.api.speech.microsoft.com
米国中南部 https://southcentralus.customvoice.api.speech.microsoft.com
東南アジア https://southeastasia.customvoice.api.speech.microsoft.com
英国南部 https://uksouth.customvoice.api.speech.microsoft.com
西ヨーロッパ https://westeurope.customvoice.api.speech.microsoft.com

要求ヘッダー

この表は、テキスト読み上げ要求の必須のヘッダーと省略可能なヘッダーの一覧です。

Header 説明 必須/省略可能
Authorization 単語 Bearer が前に付いた認証トークン。 詳細については、認証に関するページをご覧ください。 必須
Content-Type 指定したテキストのコンテンツ タイプを指定します。 指定できる値は application/ssml+xml です。 必須
X-Microsoft-OutputFormat オーディオ出力形式を指定します。 指定できる値の全一覧については、オーディオ出力に関するセクションを参照してください。 必須
User-Agent アプリケーション名です。 指定する値は 255 文字未満にする必要があります。 必須

オーディオ出力

以下に示したのは、それぞれの要求の X-Microsoft-OutputFormat ヘッダーで送信することができるオーディオ形式の一覧です。 それぞれビットレートとエンコードの種類が含まれています。 Speech Service では、24 kHz、16 kHz、および 8 kHz のオーディオ出力がサポートされます。

raw-16khz-16bit-mono-pcm            riff-16khz-16bit-mono-pcm
raw-24khz-16bit-mono-pcm            riff-24khz-16bit-mono-pcm
raw-48khz-16bit-mono-pcm            riff-48khz-16bit-mono-pcm
raw-8khz-8bit-mono-mulaw            riff-8khz-8bit-mono-mulaw
raw-8khz-8bit-mono-alaw             riff-8khz-8bit-mono-alaw
audio-16khz-32kbitrate-mono-mp3     audio-16khz-64kbitrate-mono-mp3
audio-16khz-128kbitrate-mono-mp3    audio-24khz-48kbitrate-mono-mp3
audio-24khz-96kbitrate-mono-mp3     audio-24khz-160kbitrate-mono-mp3
audio-48khz-96kbitrate-mono-mp3     audio-48khz-192kbitrate-mono-mp3
raw-16khz-16bit-mono-truesilk       raw-24khz-16bit-mono-truesilk
webm-16khz-16bit-mono-opus          webm-24khz-16bit-mono-opus
ogg-16khz-16bit-mono-opus           ogg-24khz-16bit-mono-opus
ogg-48khz-16bit-mono-opus

Note

選択した音声と出力形式のビット レートが異なる場合、オーディオは必要に応じて再サンプリングされます。 ogg-24khz-16bit-mono-opus は OPUS コーデックでデコードできます

要求本文

POST 要求の本文はPOST として送信されます。 SSML では、テキスト読み上げサービスによって返される合成音声の声と言語を選択できます。 サポートされている声の全一覧については、言語のサポートに関するページを参照してください。

Note

カスタム ニューラル音声を使用する場合は、プレーン テキスト (ASCII または UTF-8) として要求の本文を送信できます。

要求のサンプル

この HTTP 要求は、SSML を使用して音声と言語を指定します。 本文が長すぎて、生成されるオーディオが 10 分を超える場合は、10 分に切り捨てられます。 つまり、オーディオの長さが 10 分を超えることはできません。

POST /cognitiveservices/v1 HTTP/1.1

X-Microsoft-OutputFormat: raw-24khz-16bit-mono-pcm
Content-Type: application/ssml+xml
Host: westus.tts.speech.microsoft.com
Content-Length: 225
Authorization: Bearer [Base64 access_token]

<speak version='1.0' xml:lang='en-US'><voice xml:lang='en-US' xml:gender='Male'
    name='en-US-ChristopherNeural'>
        Microsoft Speech Service Text-to-Speech API
</voice></speak>

HTTP 状態コード

各応答の HTTP 状態コードは、成功または一般的なエラーを示します。

HTTP 状態コード 説明 考えられる理由
200 [OK] 要求は成功しました。応答本文はオーディオ ファイルです。
400 正しくない要求 必須パラメーターが指定されていない、空、または null です。 または、必須またはオプションのパラメーターに渡された値が無効です。 よくある問題はヘッダーが長すぎることです。
401 権限がありません 要求が承認されていません。 サブスクリプション キーまたはトークンが有効であり、正しいリージョンにあることを確認してください。
415 サポートされていないメディアの種類です 間違った Content-Type が提供された可能性があります。 Content-Typeapplication/ssml+xml に設定する必要があります。
429 要求が多すぎます 使用中のサブスクリプションで許可されている要求のクォータまたは速度を超えています。
502 無効なゲートウェイ ネットワークまたはサーバー側の問題です。 無効なヘッダーを示す場合もあります。

HTTP ステータスが 200 OK の場合、応答の本文には要求された形式のオーディオ ファイルが含まれています。 このファイルは、転送と同時に再生することも、バッファーまたはファイルに保存することもできます。

次のステップ