واجهة برمجة تطبيق REST لتحويل النص إلى كلام

تتيح لك خدمة "الكلام" تحويل النص إلى كلام مركبوالحصول على قائمة بالأصوات المدعومة لمنطقة ما باستخدام واجهة برمجة تطبيقات REST. في هذه المقالة، ستتعرف على خيارات التخويل وخيارات الاستعلام وكيفية هيكلة الطلب وكيفية تفسير الاستجابة.

تدعم واجهة برمجة تطبيقات REST لتحويل النص إلى كلام الأصوات العصبية لتحويل النص إلى كلام، والتي تدعم لغات ولهجات محددة يتم تحديدها بواسطة الإعدادات المحلية. ترتبط كل نقطة نهاية متاحة بمنطقة. مطلوب مفتاح اشتراك لنقطة النهاية أو المنطقة التي تخطط لاستخدامها. فيما يلي روابط لمزيد من المعلومات:

هام

تختلف التكاليف للأصوات العصبية المعدة مسبقا (تسمى Neural في صفحة التسعير) والأصوات العصبية المخصصة (تسمى Custom Neural في صفحة التسعير). لمزيد من المعلومات، راجع تسعير خدمة الكلام.

قبل استخدام واجهة برمجة تطبيقات REST لتحويل النص إلى كلام، افهم أنك بحاجة إلى إكمال تبادل الرموز المميزة كجزء من المصادقة للوصول إلى الخدمة.

المصادقة

يتطلب كل طلب رأس تفويض. يوضح هذا الجدول الرؤوس المدعومة لكل ميزة:

رأس التفويض المعتمد تحويل الكلام إلى نص تحويل النص إلى كلام
Ocp-Apim-Subscription-Key نعم نعم
Authorization: Bearer نعم نعم

عند استخدام الرأس Ocp-Apim-Subscription-Key ، لن يطلب منك سوى تقديم مفتاح الاشتراك. على سبيل المثال:

'Ocp-Apim-Subscription-Key': 'YOUR_SUBSCRIPTION_KEY'

عند استخدام الرأس Authorization: Bearer ، سيطلب منك تقديم طلب إلى issueToken نقطة النهاية. في هذا الطلب، يمكنك استبدال مفتاح الاشتراك برمز وصول صالح لمدة 10 دقائق.

كيفية الحصول على رمز وصول مميز

للحصول على رمز مميز للوصول، تحتاج إلى تقديم طلب إلى issueToken نقطة النهاية باستخدام Ocp-Apim-Subscription-Key مفتاح الاشتراك الخاص بك.

تحتوي issueToken نقطة النهاية على هذا التنسيق:

https://<REGION_IDENTIFIER>.api.cognitive.microsoft.com/sts/v1.0/issueToken

استبدل <REGION_IDENTIFIER> بالمعرف الذي يطابق منطقة اشتراكك من هذا الجدول:

الجغرافيا المنطقة معرف المنطقة
أفريقيا شمال جنوب أفريقيا southafricanorth
آسيا الباسيفيك شرق آسيا eastasia
آسيا الباسيفيك جنوب شرق آسيا southeastasia
آسيا الباسيفيك شرق أستراليا australiaeast
آسيا الباسيفيك وسط الهند centralindia
آسيا الباسيفيك شرق اليابان japaneast
آسيا الباسيفيك غرب اليابان japanwest
آسيا الباسيفيك وسط كوريا koreacentral
كندا كندا الوسطى canadacentral
أوروبا شمال أوروبا northeurope
أوروبا غرب أوروبا westeurope
أوروبا فرنسا الوسطى francecentral
أوروبا وسط غرب ألمانيا germanywestcentral
أوروبا شرق النرويج norwayeast
أوروبا شمال سويسرا switzerlandnorth
أوروبا غرب سويسرا switzerlandwest
أوروبا جنوب المملكة المتحدة uksouth
الشرق الأوسط شمال الإمارات العربية المتحدة uaenorth
أمريكا الجنوبية جنوب البرازيل brazilsouth
الولايات المتحدة وسط الولايات المتحدة centralus
الولايات المتحدة شرق الولايات المتحدة eastus
الولايات المتحدة East US 2 eastus2
الولايات المتحدة North Central US northcentralus
الولايات المتحدة جنوب وسط الولايات المتحدة southcentralus
الولايات المتحدة غرب وسط الولايات المتحدة westcentralus
الولايات المتحدة غرب الولايات المتحدة westus
الولايات المتحدة منطقة غرب الولايات المتحدة الأمريكية 2 westus2
الولايات المتحدة غرب الولايات المتحدة الأمريكية 3 westus3

استخدم النماذج التالية لإنشاء طلب رمز الوصول المميز الخاص بك.

نموذج HTTP

هذا المثال هو طلب HTTP بسيط للحصول على رمز مميز. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". إذا لم يكن اشتراكك في منطقة غرب الولايات المتحدة، فاستبدل Host الرأس باسم مضيف منطقتك.

POST /sts/v1.0/issueToken HTTP/1.1
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY
Host: westus.api.cognitive.microsoft.com
Content-type: application/x-www-form-urlencoded
Content-Length: 0

يحتوي نص الاستجابة على رمز الوصول المميز بتنسيق JSON Web Token (JWT).

نموذج PowerShell

هذا المثال عبارة عن برنامج نصي PowerShell بسيط للحصول على رمز مميز للوصول. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". تأكد من استخدام نقطة النهاية الصحيحة للمنطقة التي تطابق اشتراكك. تم تعيين هذا المثال حاليا إلى غرب الولايات المتحدة.

$FetchTokenHeader = @{
  'Content-type'='application/x-www-form-urlencoded';
  'Content-Length'= '0';
  'Ocp-Apim-Subscription-Key' = 'YOUR_SUBSCRIPTION_KEY'
}

$OAuthToken = Invoke-RestMethod -Method POST -Uri https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken
 -Headers $FetchTokenHeader

# show the token received
$OAuthToken

نموذج cURL

cURL هي أداة سطر أوامر متوفرة في Linux (وفي نظام Windows الفرعي لـ Linux‬). يوضح أمر cURL هذا كيفية الحصول على رمز مميز للوصول. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". تأكد من استخدام نقطة النهاية الصحيحة للمنطقة التي تطابق اشتراكك. تم تعيين هذا المثال حاليا إلى غرب الولايات المتحدة.

curl -v -X POST \
 "https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken" \
 -H "Content-type: application/x-www-form-urlencoded" \
 -H "Content-Length: 0" \
 -H "Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY"

عينة C#‎

توضح فئة C # هذه كيفية الحصول على رمز مميز للوصول. قم بتمرير مفتاح الاشتراك لخدمة Speech عند إنشاء مثيل للفصل. إذا لم يكن اشتراكك في منطقة غرب الولايات المتحدة، فقم بتغيير القيمة FetchTokenUri لمطابقة المنطقة لاشتراكك.

public class Authentication
{
    public static readonly string FetchTokenUri =
        "https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken";
    private string subscriptionKey;
    private string token;

    public Authentication(string subscriptionKey)
    {
        this.subscriptionKey = subscriptionKey;
        this.token = FetchTokenAsync(FetchTokenUri, subscriptionKey).Result;
    }

    public string GetAccessToken()
    {
        return this.token;
    }

    private async Task<string> FetchTokenAsync(string fetchUri, string subscriptionKey)
    {
        using (var client = new HttpClient())
        {
            client.DefaultRequestHeaders.Add("Ocp-Apim-Subscription-Key", subscriptionKey);
            UriBuilder uriBuilder = new UriBuilder(fetchUri);

            var result = await client.PostAsync(uriBuilder.Uri.AbsoluteUri, null);
            Console.WriteLine("Token Uri: {0}", uriBuilder.Uri.AbsoluteUri);
            return await result.Content.ReadAsStringAsync();
        }
    }
}

عينة Python

# Request module must be installed.
# Run pip install requests if necessary.
import requests

subscription_key = 'REPLACE_WITH_YOUR_KEY'


def get_token(subscription_key):
    fetch_token_url = 'https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken'
    headers = {
        'Ocp-Apim-Subscription-Key': subscription_key
    }
    response = requests.post(fetch_token_url, headers=headers)
    access_token = str(response.text)
    print(access_token)

كيفية استخدام رمز وصول مميز

يجب إرسال رمز الوصول المميز إلى الخدمة كرأس Authorization: Bearer <TOKEN> . كل رمز وصول صالح لمدة 10 دقائق. يمكنك الحصول على رمز مميز جديد في أي وقت، ولكن لتقليل حركة مرور الشبكة وزمن الوصول إلى الحد الأدنى، نوصي باستخدام نفس الرمز المميز لمدة تسع دقائق.

فيما يلي نموذج لطلب HTTP إلى واجهة برمجة تطبيقات REST لتحويل الكلام إلى نص للحصول على صوت قصير:

POST /cognitiveservices/v1 HTTP/1.1
Authorization: Bearer YOUR_ACCESS_TOKEN
Host: westus.stt.speech.microsoft.com
Content-type: application/ssml+xml
Content-Length: 199
Connection: Keep-Alive

// Message body here...

الحصول على قائمة بالأصوات

يمكنك استخدام voices/list نقطة النهاية للحصول على قائمة كاملة بالأصوات لمنطقة أو نقطة نهاية معينة:

المنطقة نقطة النهاية
شرق أستراليا https://australiaeast.tts.speech.microsoft.com/cognitiveservices/voices/list
جنوب البرازيل https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/voices/list
كندا الوسطى https://canadacentral.tts.speech.microsoft.com/cognitiveservices/voices/list
وسط الولايات المتحدة https://centralus.tts.speech.microsoft.com/cognitiveservices/voices/list
منطقة شرق الصين 2 https://chinaeast2.tts.speech.azure.cn/cognitiveservices/voices/list
منطقة شمال الصين 2 https://chinanorth2.tts.speech.azure.cn/cognitiveservices/voices/list
شرق آسيا https://eastasia.tts.speech.microsoft.com/cognitiveservices/voices/list
شرق الولايات المتحدة https://eastus.tts.speech.microsoft.com/cognitiveservices/voices/list
East US 2 https://eastus2.tts.speech.microsoft.com/cognitiveservices/voices/list
فرنسا الوسطى https://francecentral.tts.speech.microsoft.com/cognitiveservices/voices/list
وسط غرب ألمانيا https://germanywestcentral.tts.speech.microsoft.com/cognitiveservices/voices/list
وسط الهند https://centralindia.tts.speech.microsoft.com/cognitiveservices/voices/list
شرق اليابان https://japaneast.tts.speech.microsoft.com/cognitiveservices/voices/list
غرب اليابان https://japanwest.tts.speech.microsoft.com/cognitiveservices/voices/list
جيو الهند الغربية https://jioindiawest.tts.speech.microsoft.com/cognitiveservices/voices/list
وسط كوريا https://koreacentral.tts.speech.microsoft.com/cognitiveservices/voices/list
شمال وسط الولايات المتحدة https://northcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
شمال أوروبا https://northeurope.tts.speech.microsoft.com/cognitiveservices/voices/list
شرق النرويج https://norwayeast.tts.speech.microsoft.com/cognitiveservices/voices/list
جنوب وسط الولايات المتحدة https://southcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
جنوب شرق آسيا https://southeastasia.tts.speech.microsoft.com/cognitiveservices/voices/list
شمال سويسرا https://switzerlandnorth.tts.speech.microsoft.com/cognitiveservices/voices/list
غرب سويسرا https://switzerlandwest.tts.speech.microsoft.com/cognitiveservices/voices/list
US Gov – أريزونا https://usgovarizona.tts.speech.azure.us/cognitiveservices/voices/list
ولاية فرجينيا الأمريكية https://usgovvirginia.tts.speech.azure.us/cognitiveservices/voices/list
جنوب المملكة المتحدة https://uksouth.tts.speech.microsoft.com/cognitiveservices/voices/list
غرب وسط الولايات المتحدة https://westcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list
غرب أوروبا https://westeurope.tts.speech.microsoft.com/cognitiveservices/voices/list
غرب الولايات المتحدة https://westus.tts.speech.microsoft.com/cognitiveservices/voices/list
منطقة غرب الولايات المتحدة الأمريكية 2 https://westus2.tts.speech.microsoft.com/cognitiveservices/voices/list
West US 3 https://westus3.tts.speech.microsoft.com/cognitiveservices/voices/list

تلميح

تتوفر الأصوات في المعاينة في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وأوروبا الغربية وجنوب شرق آسيا.

طلبات رؤوس

يسرد هذا الجدول الرؤوس المطلوبة والاختيارية لطلبات تحويل النص إلى كلام:

الرأس الوصف مطلوب أو اختياري
Ocp-Apim-Subscription-Key مفتاح الاشتراك في خدمة الكلام. إما هذا الرأس أو Authorization مطلوب.
Authorization رمز تفويض مسبوق بكلمة Bearer. لمزيد من المعلومات، راجع المصادقة. إما هذا الرأس أو Ocp-Apim-Subscription-Key مطلوب.

نص الطلب

لا يلزم وجود نص أساسي للطلبات GET إلى نقطة النهاية هذه.

طلب عينة

يتطلب هذا الطلب رأس تفويض فقط:

GET /cognitiveservices/voices/list HTTP/1.1

Host: westus.tts.speech.microsoft.com
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY

استجابة العينة

وقد تم اقتطاع هذه الاستجابة لتوضيح هيكل الاستجابة.

ملاحظة

يختلف توفر الصوت حسب المنطقة أو نقطة النهاية.

[

    {
    "Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyNeural)",
    "DisplayName": "Jenny",
    "LocalName": "Jenny",
    "ShortName": "en-US-JennyNeural",
    "Gender": "Female",
    "Locale": "en-US",
    "StyleList": [
      "chat",
      "customerservice",
      "newscast-casual",
      "assistant",
    ],
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

    ...

     {
    "Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyMultilingualNeural)",
    "ShortName": "en-US-JennyMultilingualNeural",
    "DisplayName": "Jenny Multilingual",
    "LocalName": "Jenny Multilingual",
    "Gender": "Female",
    "Locale": "en-US",
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "SecondaryLocaleList": [
        "de-DE",
        "en-AU",
        "en-CA",
        "en-GB",
        "es-ES",
        "es-MX",
        "fr-CA",
        "fr-FR",
        "it-IT",
        "ja-JP",
        "ko-KR",
        "pt-BR",
        "zh-CN"
      ],
    "Status": "Preview"
    },
    
  ...
    
    {
    "Name": "Microsoft Server Speech Text to Speech Voice (ga-IE, OrlaNeural)",
    "DisplayName": "Orla",
    "LocalName": "Orla",
    "ShortName": "ga-IE-OrlaNeural",
    "Gender": "Female",
    "Locale": "ga-IE",
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

  ...

   {
    "Name": "Microsoft Server Speech Text to Speech Voice (zh-CN, YunxiNeural)",
    "DisplayName": "Yunxi",
    "LocalName": "云希",
    "ShortName": "zh-CN-YunxiNeural",
    "Gender": "Male",
    "Locale": "zh-CN",
    "StyleList": [
      "Calm",
      "Fearful",
      "Cheerful",
      "Disgruntled",
      "Serious",
      "Angry",
      "Sad",
      "Depressed",
      "Embarrassed"
    ],
    "SampleRateHertz": "24000",
    "VoiceType": "Neural",
    "Status": "GA"
  },

    ...

]

تعليمة برمجية حالة HTTP

يشير رمز حالة HTTP لكل استجابة إلى النجاح أو الأخطاء الشائعة.

رمز حالة HTTP الوصف السبب المحتمل
200 موافق الطلب ناجح.
400 طلب غير صالح معلمة مطلوبة مفقودة أو فارغة أو خالية. أو، القيمة التي تم تمريرها إلى معلمة مطلوبة أو اختيارية غير صالحة. السبب الشائع هو رأس طويل جدا.
401 غير مصرح به الطلب غير مصرح به. تأكد من أن مفتاح الاشتراك أو الرمز المميز صالح وفي المنطقة الصحيحة.
429 عدد كبير جدًا من الطلبات لقد تجاوزت الحصة النسبية أو معدل الطلبات المسموح بها لاشتراكك.
502 مدخل خطأ هناك مشكلة في الشبكة أو الخادم. قد تشير هذه الحالة أيضا إلى رؤوس غير صالحة.

تحويل النص إلى كلام

v1 تسمح لك نقطة النهاية بتحويل النص إلى كلام باستخدام لغة ترميز توليف الكلام (SSML).

المناطق ونقاط النهاية

يتم دعم هذه المناطق لتحويل النص إلى كلام من خلال واجهة برمجة تطبيقات REST. تأكد من تحديد نقطة النهاية التي تطابق منطقة اشتراكك.

أصوات عصبية مسبقة الصنع

استخدم هذا الجدول لتحديد مدى توفر الأصوات العصبية حسب المنطقة أو نقطة النهاية:

المنطقة نقطة النهاية
شرق أستراليا https://australiaeast.tts.speech.microsoft.com/cognitiveservices/v1
جنوب البرازيل https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/v1
كندا الوسطى https://canadacentral.tts.speech.microsoft.com/cognitiveservices/v1
وسط الولايات المتحدة https://centralus.tts.speech.microsoft.com/cognitiveservices/v1
منطقة شرق الصين 2 https://chinaeast2.tts.speech.azure.cn/cognitiveservices/v1
منطقة شمال الصين 2 https://chinanorth2.tts.speech.azure.cn/cognitiveservices/v1
شرق آسيا https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1
شرق الولايات المتحدة https://eastus.tts.speech.microsoft.com/cognitiveservices/v1
East US 2 https://eastus2.tts.speech.microsoft.com/cognitiveservices/v1
فرنسا الوسطى https://francecentral.tts.speech.microsoft.com/cognitiveservices/v1
وسط غرب ألمانيا https://germanywestcentral.tts.speech.microsoft.com/cognitiveservices/v1
وسط الهند https://centralindia.tts.speech.microsoft.com/cognitiveservices/v1
شرق اليابان https://japaneast.tts.speech.microsoft.com/cognitiveservices/v1
غرب اليابان https://japanwest.tts.speech.microsoft.com/cognitiveservices/v1
جيو الهند الغربية https://jioindiawest.tts.speech.microsoft.com/cognitiveservices/v1
وسط كوريا https://koreacentral.tts.speech.microsoft.com/cognitiveservices/v1
شمال وسط الولايات المتحدة https://northcentralus.tts.speech.microsoft.com/cognitiveservices/v1
شمال أوروبا https://northeurope.tts.speech.microsoft.com/cognitiveservices/v1
شرق النرويج https://norwayeast.tts.speech.microsoft.com/cognitiveservices/v1
جنوب وسط الولايات المتحدة https://southcentralus.tts.speech.microsoft.com/cognitiveservices/v1
جنوب شرق آسيا https://southeastasia.tts.speech.microsoft.com/cognitiveservices/v1
منطقة السويد الوسطى https://swedencentral.tts.speech.microsoft.com/cognitiveservices/v1
شمال سويسرا https://switzerlandnorth.tts.speech.microsoft.com/cognitiveservices/v1
غرب سويسرا https://switzerlandwest.tts.speech.microsoft.com/cognitiveservices/v1
شمال الإمارات العربية المتحدة https://uaenorth.tts.speech.microsoft.com/cognitiveservices/v1
US Gov – أريزونا https://usgovarizona.tts.speech.azure.us/cognitiveservices/v1
ولاية فرجينيا الأمريكية https://usgovvirginia.tts.speech.azure.us/cognitiveservices/v1
جنوب المملكة المتحدة https://uksouth.tts.speech.microsoft.com/cognitiveservices/v1
غرب وسط الولايات المتحدة https://westcentralus.tts.speech.microsoft.com/cognitiveservices/v1
غرب أوروبا https://westeurope.tts.speech.microsoft.com/cognitiveservices/v1
غرب الولايات المتحدة https://westus.tts.speech.microsoft.com/cognitiveservices/v1
منطقة غرب الولايات المتحدة الأمريكية 2 https://westus2.tts.speech.microsoft.com/cognitiveservices/v1
West US 3 https://westus3.tts.speech.microsoft.com/cognitiveservices/v1

تلميح

تتوفر الأصوات في المعاينة في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وأوروبا الغربية وجنوب شرق آسيا.

الأصوات العصبية المخصصة

إذا قمت بإنشاء خط صوت عصبي مخصص، فاستخدم نقطة النهاية التي أنشأتها. يمكنك أيضا استخدام نقاط النهاية التالية. استبدل {deploymentId} بمعرف النشر لنموذج الصوت العصبي الخاص بك.

المنطقة نقطة النهاية
شرق أستراليا https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
جنوب البرازيل https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
كندا الوسطى https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
وسط الولايات المتحدة https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شرق آسيا https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شرق الولايات المتحدة https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
East US 2 https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
فرنسا الوسطى https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
وسط غرب ألمانيا https://germanywestcentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
وسط الهند https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شرق اليابان https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
غرب اليابان https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
جيو الهند الغربية https://jioindiawest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
وسط كوريا https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شمال وسط الولايات المتحدة https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شمال أوروبا https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
منطقة شرق النرويج https://norwayeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شمال جنوب أفريقيا https://southafricanorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
جنوب وسط الولايات المتحدة https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
جنوب شرق آسيا https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شمال سويسرا https://switzerlandnorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
غرب سويسرا https://switzerlandwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
شمال الإمارات العربية المتحدة https://uaenorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
جنوب المملكة المتحدة https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
غرب وسط الولايات المتحدة https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
غرب أوروبا https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
غرب الولايات المتحدة https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
منطقة غرب الولايات المتحدة الأمريكية 2 https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
West US 3 https://westus3.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}

ملاحظة

المناطق السابقة متاحة لاستضافة نموذج الصوت العصبي والتوليف في الوقت الحقيقي. يتوفر التدريب الصوتي العصبي المخصص في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وجنوب شرق آسيا وجنوب شرق المملكة المتحدة. ولكن يمكن للمستخدمين بسهولة نسخ نموذج الصوت العصبي من المناطق الثلاث إلى مناطق أخرى في القائمة السابقة.

واجهة برمجة تطبيقات الصوت الطويلة

تتوفر واجهة برمجة تطبيقات الصوت الطويل في مناطق متعددة مع نقاط نهاية فريدة:

المنطقة نقطة النهاية
شرق أستراليا https://australiaeast.customvoice.api.speech.microsoft.com
شرق الولايات المتحدة https://eastus.customvoice.api.speech.microsoft.com
وسط الهند https://centralindia.customvoice.api.speech.microsoft.com
جنوب وسط الولايات المتحدة https://southcentralus.customvoice.api.speech.microsoft.com
جنوب شرق آسيا https://southeastasia.customvoice.api.speech.microsoft.com
جنوب المملكة المتحدة https://uksouth.customvoice.api.speech.microsoft.com
غرب أوروبا https://westeurope.customvoice.api.speech.microsoft.com

طلبات رؤوس

يسرد هذا الجدول الرؤوس المطلوبة والاختيارية لطلبات تحويل النص إلى كلام:

الرأس الوصف مطلوب أو اختياري
Authorization رمز تفويض مسبوق بكلمة Bearer. لمزيد من المعلومات، راجع المصادقة. مطلوب
Content-Type يحدد نوع المحتوى للنص المقدم. القيمة المقبولة: application/ssml+xml. مطلوب
X-Microsoft-OutputFormat يحدد تنسيق إخراج الصوت. للحصول على قائمة كاملة بالقيم المقبولة، راجع مخرجات الصوت. مطلوب
User-Agent اسم التطبيق. يجب أن تكون القيمة المقدمة أقل من 255 حرفا. مطلوب

مخرجات الصوت

هذه قائمة بتنسيقات الصوت المدعومة التي يتم إرسالها في كل طلب كرأس X-Microsoft-OutputFormat . يتضمن كل تنسيق معدل بت ونوع ترميز. تدعم خدمة Speech مخرجات الصوت 24 كيلو هرتز و 16 كيلو هرتز و 8 كيلو هرتز.

raw-16khz-16bit-mono-pcm            riff-16khz-16bit-mono-pcm
raw-24khz-16bit-mono-pcm            riff-24khz-16bit-mono-pcm
raw-48khz-16bit-mono-pcm            riff-48khz-16bit-mono-pcm
raw-8khz-8bit-mono-mulaw            riff-8khz-8bit-mono-mulaw
raw-8khz-8bit-mono-alaw             riff-8khz-8bit-mono-alaw
audio-16khz-32kbitrate-mono-mp3     audio-16khz-64kbitrate-mono-mp3
audio-16khz-128kbitrate-mono-mp3    audio-24khz-48kbitrate-mono-mp3
audio-24khz-96kbitrate-mono-mp3     audio-24khz-160kbitrate-mono-mp3
audio-48khz-96kbitrate-mono-mp3     audio-48khz-192kbitrate-mono-mp3
raw-16khz-16bit-mono-truesilk       raw-24khz-16bit-mono-truesilk
webm-16khz-16bit-mono-opus          webm-24khz-16bit-mono-opus
ogg-16khz-16bit-mono-opus           ogg-24khz-16bit-mono-opus
ogg-48khz-16bit-mono-opus

ملاحظة

إذا كان تنسيق الصوت والإخراج المحدد له معدلات بت مختلفة، إعادة تشكيل الصوت حسب الضرورة. يمكنك فك تشفير ogg-24khz-16bit-mono-opus التنسيق باستخدام برنامج ترميز Opus.

نص الطلب

إذا كنت تستخدم صوتا عصبيا مخصصا، فيمكن إرسال نص الطلب كنص عادي (ASCII أو UTF-8). وإلا، يتم إرسال نص كل POST طلب باسم SSML. يسمح لك SSML باختيار صوت ولغة الكلام المركب الذي ترجعه ميزة تحويل النص إلى كلام. للحصول على قائمة كاملة بالأصوات المدعومة، راجع دعم اللغة والصوت لخدمة الكلام.

طلب عينة

يستخدم طلب HTTP هذا SSML لتحديد الصوت واللغة. إذا كان طول الجسم طويلا، وتجاوز الصوت الناتج 10 دقائق، اقتطاعه إلى 10 دقائق. بمعنى آخر ، لا يمكن أن يتجاوز طول الصوت 10 دقائق.

POST /cognitiveservices/v1 HTTP/1.1

X-Microsoft-OutputFormat: riff-24khz-16bit-mono-pcm
Content-Type: application/ssml+xml
Host: westus.tts.speech.microsoft.com
Content-Length: <Length>
Authorization: Bearer [Base64 access_token]
User-Agent: <Your application name>

<speak version='1.0' xml:lang='en-US'><voice xml:lang='en-US' xml:gender='Male'
    name='en-US-ChristopherNeural'>
        Microsoft Speech Service Text-to-Speech API
</voice></speak>

* بالنسبة إلى طول المحتوى، يجب عليك استخدام طول المحتوى الخاص بك. في معظم الحالات، يتم حساب هذه القيمة تلقائيا.

تعليمة برمجية حالة HTTP

يشير رمز حالة HTTP لكل استجابة إلى النجاح أو الأخطاء الشائعة:

رمز حالة HTTP الوصف السبب المحتمل
200 موافق الطلب ناجح. نص الاستجابة هو ملف صوتي.
400 طلب غير صالح معلمة مطلوبة مفقودة أو فارغة أو خالية. أو، القيمة التي تم تمريرها إلى معلمة مطلوبة أو اختيارية غير صالحة. السبب الشائع هو رأس طويل جدا.
401 غير مصرح به الطلب غير مصرح به. تأكد من أن مفتاح الاشتراك أو الرمز المميز صالح وفي المنطقة الصحيحة.
415 نوع الوسائط غير المدعومة من الممكن أن تكون القيمة الخاطئة Content-Type قد تم توفيرها. Content-Type يجب ضبطه على application/ssml+xml.
429 عدد كبير جدًا من الطلبات لقد تجاوزت الحصة النسبية أو معدل الطلبات المسموح بها لاشتراكك.
502 مدخل خطأ هناك مشكلة في الشبكة أو الخادم. قد تشير هذه الحالة أيضا إلى رؤوس غير صالحة.

إذا كانت حالة HTTP ، 200 OKفإن نص الاستجابة يحتوي على ملف صوتي بالتنسيق المطلوب. يمكن تشغيل هذا الملف أثناء نقله أو حفظه في مخزن مؤقت أو حفظه في ملف.

الخطوات التالية