واجهة برمجة تطبيق REST لتحويل النص إلى كلام
تتيح لك خدمة "الكلام" تحويل النص إلى كلام مركبوالحصول على قائمة بالأصوات المدعومة لمنطقة ما باستخدام واجهة برمجة تطبيقات REST. في هذه المقالة، ستتعرف على خيارات التخويل وخيارات الاستعلام وكيفية هيكلة الطلب وكيفية تفسير الاستجابة.
تدعم واجهة برمجة تطبيقات REST لتحويل النص إلى كلام الأصوات العصبية لتحويل النص إلى كلام، والتي تدعم لغات ولهجات محددة يتم تحديدها بواسطة الإعدادات المحلية. ترتبط كل نقطة نهاية متاحة بمنطقة. مطلوب مفتاح اشتراك لنقطة النهاية أو المنطقة التي تخطط لاستخدامها. فيما يلي روابط لمزيد من المعلومات:
- للحصول على قائمة كاملة بالأصوات، راجع دعم اللغة والصوت لخدمة الكلام.
- للحصول على معلومات حول التوفر الإقليمي، راجع المناطق المدعومة لخدمة الكلام.
- للحصول على Azure Government ونقاط نهاية Azure China، راجع هذه المقالة حول السحب السيادية.
هام
تختلف التكاليف للأصوات العصبية المعدة مسبقا (تسمى Neural في صفحة التسعير) والأصوات العصبية المخصصة (تسمى Custom Neural في صفحة التسعير). لمزيد من المعلومات، راجع تسعير خدمة الكلام.
قبل استخدام واجهة برمجة تطبيقات REST لتحويل النص إلى كلام، افهم أنك بحاجة إلى إكمال تبادل الرموز المميزة كجزء من المصادقة للوصول إلى الخدمة.
المصادقة
يتطلب كل طلب رأس تفويض. يوضح هذا الجدول الرؤوس المدعومة لكل ميزة:
| رأس التفويض المعتمد | تحويل الكلام إلى نص | تحويل النص إلى كلام |
|---|---|---|
Ocp-Apim-Subscription-Key |
نعم | نعم |
Authorization: Bearer |
نعم | نعم |
عند استخدام الرأس Ocp-Apim-Subscription-Key ، لن يطلب منك سوى تقديم مفتاح الاشتراك. على سبيل المثال:
'Ocp-Apim-Subscription-Key': 'YOUR_SUBSCRIPTION_KEY'
عند استخدام الرأس Authorization: Bearer ، سيطلب منك تقديم طلب إلى issueToken نقطة النهاية. في هذا الطلب، يمكنك استبدال مفتاح الاشتراك برمز وصول صالح لمدة 10 دقائق.
كيفية الحصول على رمز وصول مميز
للحصول على رمز مميز للوصول، تحتاج إلى تقديم طلب إلى issueToken نقطة النهاية باستخدام Ocp-Apim-Subscription-Key مفتاح الاشتراك الخاص بك.
تحتوي issueToken نقطة النهاية على هذا التنسيق:
https://<REGION_IDENTIFIER>.api.cognitive.microsoft.com/sts/v1.0/issueToken
استبدل <REGION_IDENTIFIER> بالمعرف الذي يطابق منطقة اشتراكك من هذا الجدول:
| الجغرافيا | المنطقة | معرف المنطقة |
|---|---|---|
| أفريقيا | شمال جنوب أفريقيا | southafricanorth |
| آسيا الباسيفيك | شرق آسيا | eastasia |
| آسيا الباسيفيك | جنوب شرق آسيا | southeastasia |
| آسيا الباسيفيك | شرق أستراليا | australiaeast |
| آسيا الباسيفيك | وسط الهند | centralindia |
| آسيا الباسيفيك | شرق اليابان | japaneast |
| آسيا الباسيفيك | غرب اليابان | japanwest |
| آسيا الباسيفيك | وسط كوريا | koreacentral |
| كندا | كندا الوسطى | canadacentral |
| أوروبا | شمال أوروبا | northeurope |
| أوروبا | غرب أوروبا | westeurope |
| أوروبا | فرنسا الوسطى | francecentral |
| أوروبا | وسط غرب ألمانيا | germanywestcentral |
| أوروبا | شرق النرويج | norwayeast |
| أوروبا | شمال سويسرا | switzerlandnorth |
| أوروبا | غرب سويسرا | switzerlandwest |
| أوروبا | جنوب المملكة المتحدة | uksouth |
| الشرق الأوسط | شمال الإمارات العربية المتحدة | uaenorth |
| أمريكا الجنوبية | جنوب البرازيل | brazilsouth |
| الولايات المتحدة | وسط الولايات المتحدة | centralus |
| الولايات المتحدة | شرق الولايات المتحدة | eastus |
| الولايات المتحدة | East US 2 | eastus2 |
| الولايات المتحدة | North Central US | northcentralus |
| الولايات المتحدة | جنوب وسط الولايات المتحدة | southcentralus |
| الولايات المتحدة | غرب وسط الولايات المتحدة | westcentralus |
| الولايات المتحدة | غرب الولايات المتحدة | westus |
| الولايات المتحدة | منطقة غرب الولايات المتحدة الأمريكية 2 | westus2 |
| الولايات المتحدة | غرب الولايات المتحدة الأمريكية 3 | westus3 |
استخدم النماذج التالية لإنشاء طلب رمز الوصول المميز الخاص بك.
نموذج HTTP
هذا المثال هو طلب HTTP بسيط للحصول على رمز مميز. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". إذا لم يكن اشتراكك في منطقة غرب الولايات المتحدة، فاستبدل Host الرأس باسم مضيف منطقتك.
POST /sts/v1.0/issueToken HTTP/1.1
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY
Host: westus.api.cognitive.microsoft.com
Content-type: application/x-www-form-urlencoded
Content-Length: 0
يحتوي نص الاستجابة على رمز الوصول المميز بتنسيق JSON Web Token (JWT).
نموذج PowerShell
هذا المثال عبارة عن برنامج نصي PowerShell بسيط للحصول على رمز مميز للوصول. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". تأكد من استخدام نقطة النهاية الصحيحة للمنطقة التي تطابق اشتراكك. تم تعيين هذا المثال حاليا إلى غرب الولايات المتحدة.
$FetchTokenHeader = @{
'Content-type'='application/x-www-form-urlencoded';
'Content-Length'= '0';
'Ocp-Apim-Subscription-Key' = 'YOUR_SUBSCRIPTION_KEY'
}
$OAuthToken = Invoke-RestMethod -Method POST -Uri https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken
-Headers $FetchTokenHeader
# show the token received
$OAuthToken
نموذج cURL
cURL هي أداة سطر أوامر متوفرة في Linux (وفي نظام Windows الفرعي لـ Linux). يوضح أمر cURL هذا كيفية الحصول على رمز مميز للوصول. استبدل YOUR_SUBSCRIPTION_KEY بمفتاح الاشتراك لخدمة "الكلام". تأكد من استخدام نقطة النهاية الصحيحة للمنطقة التي تطابق اشتراكك. تم تعيين هذا المثال حاليا إلى غرب الولايات المتحدة.
curl -v -X POST \
"https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken" \
-H "Content-type: application/x-www-form-urlencoded" \
-H "Content-Length: 0" \
-H "Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY"
عينة C#
توضح فئة C # هذه كيفية الحصول على رمز مميز للوصول. قم بتمرير مفتاح الاشتراك لخدمة Speech عند إنشاء مثيل للفصل. إذا لم يكن اشتراكك في منطقة غرب الولايات المتحدة، فقم بتغيير القيمة FetchTokenUri لمطابقة المنطقة لاشتراكك.
public class Authentication
{
public static readonly string FetchTokenUri =
"https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken";
private string subscriptionKey;
private string token;
public Authentication(string subscriptionKey)
{
this.subscriptionKey = subscriptionKey;
this.token = FetchTokenAsync(FetchTokenUri, subscriptionKey).Result;
}
public string GetAccessToken()
{
return this.token;
}
private async Task<string> FetchTokenAsync(string fetchUri, string subscriptionKey)
{
using (var client = new HttpClient())
{
client.DefaultRequestHeaders.Add("Ocp-Apim-Subscription-Key", subscriptionKey);
UriBuilder uriBuilder = new UriBuilder(fetchUri);
var result = await client.PostAsync(uriBuilder.Uri.AbsoluteUri, null);
Console.WriteLine("Token Uri: {0}", uriBuilder.Uri.AbsoluteUri);
return await result.Content.ReadAsStringAsync();
}
}
}
عينة Python
# Request module must be installed.
# Run pip install requests if necessary.
import requests
subscription_key = 'REPLACE_WITH_YOUR_KEY'
def get_token(subscription_key):
fetch_token_url = 'https://westus.api.cognitive.microsoft.com/sts/v1.0/issueToken'
headers = {
'Ocp-Apim-Subscription-Key': subscription_key
}
response = requests.post(fetch_token_url, headers=headers)
access_token = str(response.text)
print(access_token)
كيفية استخدام رمز وصول مميز
يجب إرسال رمز الوصول المميز إلى الخدمة كرأس Authorization: Bearer <TOKEN> . كل رمز وصول صالح لمدة 10 دقائق. يمكنك الحصول على رمز مميز جديد في أي وقت، ولكن لتقليل حركة مرور الشبكة وزمن الوصول إلى الحد الأدنى، نوصي باستخدام نفس الرمز المميز لمدة تسع دقائق.
فيما يلي نموذج لطلب HTTP إلى واجهة برمجة تطبيقات REST لتحويل الكلام إلى نص للحصول على صوت قصير:
POST /cognitiveservices/v1 HTTP/1.1
Authorization: Bearer YOUR_ACCESS_TOKEN
Host: westus.stt.speech.microsoft.com
Content-type: application/ssml+xml
Content-Length: 199
Connection: Keep-Alive
// Message body here...
الحصول على قائمة بالأصوات
يمكنك استخدام voices/list نقطة النهاية للحصول على قائمة كاملة بالأصوات لمنطقة أو نقطة نهاية معينة:
| المنطقة | نقطة النهاية |
|---|---|
| شرق أستراليا | https://australiaeast.tts.speech.microsoft.com/cognitiveservices/voices/list |
| جنوب البرازيل | https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/voices/list |
| كندا الوسطى | https://canadacentral.tts.speech.microsoft.com/cognitiveservices/voices/list |
| وسط الولايات المتحدة | https://centralus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| منطقة شرق الصين 2 | https://chinaeast2.tts.speech.azure.cn/cognitiveservices/voices/list |
| منطقة شمال الصين 2 | https://chinanorth2.tts.speech.azure.cn/cognitiveservices/voices/list |
| شرق آسيا | https://eastasia.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شرق الولايات المتحدة | https://eastus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| East US 2 | https://eastus2.tts.speech.microsoft.com/cognitiveservices/voices/list |
| فرنسا الوسطى | https://francecentral.tts.speech.microsoft.com/cognitiveservices/voices/list |
| وسط غرب ألمانيا | https://germanywestcentral.tts.speech.microsoft.com/cognitiveservices/voices/list |
| وسط الهند | https://centralindia.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شرق اليابان | https://japaneast.tts.speech.microsoft.com/cognitiveservices/voices/list |
| غرب اليابان | https://japanwest.tts.speech.microsoft.com/cognitiveservices/voices/list |
| جيو الهند الغربية | https://jioindiawest.tts.speech.microsoft.com/cognitiveservices/voices/list |
| وسط كوريا | https://koreacentral.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شمال وسط الولايات المتحدة | https://northcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شمال أوروبا | https://northeurope.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شرق النرويج | https://norwayeast.tts.speech.microsoft.com/cognitiveservices/voices/list |
| جنوب وسط الولايات المتحدة | https://southcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| جنوب شرق آسيا | https://southeastasia.tts.speech.microsoft.com/cognitiveservices/voices/list |
| شمال سويسرا | https://switzerlandnorth.tts.speech.microsoft.com/cognitiveservices/voices/list |
| غرب سويسرا | https://switzerlandwest.tts.speech.microsoft.com/cognitiveservices/voices/list |
| US Gov – أريزونا | https://usgovarizona.tts.speech.azure.us/cognitiveservices/voices/list |
| ولاية فرجينيا الأمريكية | https://usgovvirginia.tts.speech.azure.us/cognitiveservices/voices/list |
| جنوب المملكة المتحدة | https://uksouth.tts.speech.microsoft.com/cognitiveservices/voices/list |
| غرب وسط الولايات المتحدة | https://westcentralus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| غرب أوروبا | https://westeurope.tts.speech.microsoft.com/cognitiveservices/voices/list |
| غرب الولايات المتحدة | https://westus.tts.speech.microsoft.com/cognitiveservices/voices/list |
| منطقة غرب الولايات المتحدة الأمريكية 2 | https://westus2.tts.speech.microsoft.com/cognitiveservices/voices/list |
| West US 3 | https://westus3.tts.speech.microsoft.com/cognitiveservices/voices/list |
تلميح
تتوفر الأصوات في المعاينة في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وأوروبا الغربية وجنوب شرق آسيا.
طلبات رؤوس
يسرد هذا الجدول الرؤوس المطلوبة والاختيارية لطلبات تحويل النص إلى كلام:
| الرأس | الوصف | مطلوب أو اختياري |
|---|---|---|
Ocp-Apim-Subscription-Key |
مفتاح الاشتراك في خدمة الكلام. | إما هذا الرأس أو Authorization مطلوب. |
Authorization |
رمز تفويض مسبوق بكلمة Bearer. لمزيد من المعلومات، راجع المصادقة. |
إما هذا الرأس أو Ocp-Apim-Subscription-Key مطلوب. |
نص الطلب
لا يلزم وجود نص أساسي للطلبات GET إلى نقطة النهاية هذه.
طلب عينة
يتطلب هذا الطلب رأس تفويض فقط:
GET /cognitiveservices/voices/list HTTP/1.1
Host: westus.tts.speech.microsoft.com
Ocp-Apim-Subscription-Key: YOUR_SUBSCRIPTION_KEY
استجابة العينة
وقد تم اقتطاع هذه الاستجابة لتوضيح هيكل الاستجابة.
ملاحظة
يختلف توفر الصوت حسب المنطقة أو نقطة النهاية.
[
{
"Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyNeural)",
"DisplayName": "Jenny",
"LocalName": "Jenny",
"ShortName": "en-US-JennyNeural",
"Gender": "Female",
"Locale": "en-US",
"StyleList": [
"chat",
"customerservice",
"newscast-casual",
"assistant",
],
"SampleRateHertz": "24000",
"VoiceType": "Neural",
"Status": "GA"
},
...
{
"Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyMultilingualNeural)",
"ShortName": "en-US-JennyMultilingualNeural",
"DisplayName": "Jenny Multilingual",
"LocalName": "Jenny Multilingual",
"Gender": "Female",
"Locale": "en-US",
"SampleRateHertz": "24000",
"VoiceType": "Neural",
"SecondaryLocaleList": [
"de-DE",
"en-AU",
"en-CA",
"en-GB",
"es-ES",
"es-MX",
"fr-CA",
"fr-FR",
"it-IT",
"ja-JP",
"ko-KR",
"pt-BR",
"zh-CN"
],
"Status": "Preview"
},
...
{
"Name": "Microsoft Server Speech Text to Speech Voice (ga-IE, OrlaNeural)",
"DisplayName": "Orla",
"LocalName": "Orla",
"ShortName": "ga-IE-OrlaNeural",
"Gender": "Female",
"Locale": "ga-IE",
"SampleRateHertz": "24000",
"VoiceType": "Neural",
"Status": "GA"
},
...
{
"Name": "Microsoft Server Speech Text to Speech Voice (zh-CN, YunxiNeural)",
"DisplayName": "Yunxi",
"LocalName": "云希",
"ShortName": "zh-CN-YunxiNeural",
"Gender": "Male",
"Locale": "zh-CN",
"StyleList": [
"Calm",
"Fearful",
"Cheerful",
"Disgruntled",
"Serious",
"Angry",
"Sad",
"Depressed",
"Embarrassed"
],
"SampleRateHertz": "24000",
"VoiceType": "Neural",
"Status": "GA"
},
...
]
تعليمة برمجية حالة HTTP
يشير رمز حالة HTTP لكل استجابة إلى النجاح أو الأخطاء الشائعة.
| رمز حالة HTTP | الوصف | السبب المحتمل |
|---|---|---|
| 200 | موافق | الطلب ناجح. |
| 400 | طلب غير صالح | معلمة مطلوبة مفقودة أو فارغة أو خالية. أو، القيمة التي تم تمريرها إلى معلمة مطلوبة أو اختيارية غير صالحة. السبب الشائع هو رأس طويل جدا. |
| 401 | غير مصرح به | الطلب غير مصرح به. تأكد من أن مفتاح الاشتراك أو الرمز المميز صالح وفي المنطقة الصحيحة. |
| 429 | عدد كبير جدًا من الطلبات | لقد تجاوزت الحصة النسبية أو معدل الطلبات المسموح بها لاشتراكك. |
| 502 | مدخل خطأ | هناك مشكلة في الشبكة أو الخادم. قد تشير هذه الحالة أيضا إلى رؤوس غير صالحة. |
تحويل النص إلى كلام
v1 تسمح لك نقطة النهاية بتحويل النص إلى كلام باستخدام لغة ترميز توليف الكلام (SSML).
المناطق ونقاط النهاية
يتم دعم هذه المناطق لتحويل النص إلى كلام من خلال واجهة برمجة تطبيقات REST. تأكد من تحديد نقطة النهاية التي تطابق منطقة اشتراكك.
أصوات عصبية مسبقة الصنع
استخدم هذا الجدول لتحديد مدى توفر الأصوات العصبية حسب المنطقة أو نقطة النهاية:
| المنطقة | نقطة النهاية |
|---|---|
| شرق أستراليا | https://australiaeast.tts.speech.microsoft.com/cognitiveservices/v1 |
| جنوب البرازيل | https://brazilsouth.tts.speech.microsoft.com/cognitiveservices/v1 |
| كندا الوسطى | https://canadacentral.tts.speech.microsoft.com/cognitiveservices/v1 |
| وسط الولايات المتحدة | https://centralus.tts.speech.microsoft.com/cognitiveservices/v1 |
| منطقة شرق الصين 2 | https://chinaeast2.tts.speech.azure.cn/cognitiveservices/v1 |
| منطقة شمال الصين 2 | https://chinanorth2.tts.speech.azure.cn/cognitiveservices/v1 |
| شرق آسيا | https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1 |
| شرق الولايات المتحدة | https://eastus.tts.speech.microsoft.com/cognitiveservices/v1 |
| East US 2 | https://eastus2.tts.speech.microsoft.com/cognitiveservices/v1 |
| فرنسا الوسطى | https://francecentral.tts.speech.microsoft.com/cognitiveservices/v1 |
| وسط غرب ألمانيا | https://germanywestcentral.tts.speech.microsoft.com/cognitiveservices/v1 |
| وسط الهند | https://centralindia.tts.speech.microsoft.com/cognitiveservices/v1 |
| شرق اليابان | https://japaneast.tts.speech.microsoft.com/cognitiveservices/v1 |
| غرب اليابان | https://japanwest.tts.speech.microsoft.com/cognitiveservices/v1 |
| جيو الهند الغربية | https://jioindiawest.tts.speech.microsoft.com/cognitiveservices/v1 |
| وسط كوريا | https://koreacentral.tts.speech.microsoft.com/cognitiveservices/v1 |
| شمال وسط الولايات المتحدة | https://northcentralus.tts.speech.microsoft.com/cognitiveservices/v1 |
| شمال أوروبا | https://northeurope.tts.speech.microsoft.com/cognitiveservices/v1 |
| شرق النرويج | https://norwayeast.tts.speech.microsoft.com/cognitiveservices/v1 |
| جنوب وسط الولايات المتحدة | https://southcentralus.tts.speech.microsoft.com/cognitiveservices/v1 |
| جنوب شرق آسيا | https://southeastasia.tts.speech.microsoft.com/cognitiveservices/v1 |
| منطقة السويد الوسطى | https://swedencentral.tts.speech.microsoft.com/cognitiveservices/v1 |
| شمال سويسرا | https://switzerlandnorth.tts.speech.microsoft.com/cognitiveservices/v1 |
| غرب سويسرا | https://switzerlandwest.tts.speech.microsoft.com/cognitiveservices/v1 |
| شمال الإمارات العربية المتحدة | https://uaenorth.tts.speech.microsoft.com/cognitiveservices/v1 |
| US Gov – أريزونا | https://usgovarizona.tts.speech.azure.us/cognitiveservices/v1 |
| ولاية فرجينيا الأمريكية | https://usgovvirginia.tts.speech.azure.us/cognitiveservices/v1 |
| جنوب المملكة المتحدة | https://uksouth.tts.speech.microsoft.com/cognitiveservices/v1 |
| غرب وسط الولايات المتحدة | https://westcentralus.tts.speech.microsoft.com/cognitiveservices/v1 |
| غرب أوروبا | https://westeurope.tts.speech.microsoft.com/cognitiveservices/v1 |
| غرب الولايات المتحدة | https://westus.tts.speech.microsoft.com/cognitiveservices/v1 |
| منطقة غرب الولايات المتحدة الأمريكية 2 | https://westus2.tts.speech.microsoft.com/cognitiveservices/v1 |
| West US 3 | https://westus3.tts.speech.microsoft.com/cognitiveservices/v1 |
تلميح
تتوفر الأصوات في المعاينة في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وأوروبا الغربية وجنوب شرق آسيا.
الأصوات العصبية المخصصة
إذا قمت بإنشاء خط صوت عصبي مخصص، فاستخدم نقطة النهاية التي أنشأتها. يمكنك أيضا استخدام نقاط النهاية التالية. استبدل {deploymentId} بمعرف النشر لنموذج الصوت العصبي الخاص بك.
| المنطقة | نقطة النهاية |
|---|---|
| شرق أستراليا | https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| جنوب البرازيل | https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| كندا الوسطى | https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| وسط الولايات المتحدة | https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شرق آسيا | https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شرق الولايات المتحدة | https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| East US 2 | https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| فرنسا الوسطى | https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| وسط غرب ألمانيا | https://germanywestcentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| وسط الهند | https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شرق اليابان | https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| غرب اليابان | https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| جيو الهند الغربية | https://jioindiawest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| وسط كوريا | https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شمال وسط الولايات المتحدة | https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شمال أوروبا | https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| منطقة شرق النرويج | https://norwayeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شمال جنوب أفريقيا | https://southafricanorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| جنوب وسط الولايات المتحدة | https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| جنوب شرق آسيا | https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شمال سويسرا | https://switzerlandnorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| غرب سويسرا | https://switzerlandwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| شمال الإمارات العربية المتحدة | https://uaenorth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| جنوب المملكة المتحدة | https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| غرب وسط الولايات المتحدة | https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| غرب أوروبا | https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| غرب الولايات المتحدة | https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| منطقة غرب الولايات المتحدة الأمريكية 2 | https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
| West US 3 | https://westus3.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId} |
ملاحظة
المناطق السابقة متاحة لاستضافة نموذج الصوت العصبي والتوليف في الوقت الحقيقي. يتوفر التدريب الصوتي العصبي المخصص في هذه المناطق الثلاث فقط: شرق الولايات المتحدة وجنوب شرق آسيا وجنوب شرق المملكة المتحدة. ولكن يمكن للمستخدمين بسهولة نسخ نموذج الصوت العصبي من المناطق الثلاث إلى مناطق أخرى في القائمة السابقة.
واجهة برمجة تطبيقات الصوت الطويلة
تتوفر واجهة برمجة تطبيقات الصوت الطويل في مناطق متعددة مع نقاط نهاية فريدة:
| المنطقة | نقطة النهاية |
|---|---|
| شرق أستراليا | https://australiaeast.customvoice.api.speech.microsoft.com |
| شرق الولايات المتحدة | https://eastus.customvoice.api.speech.microsoft.com |
| وسط الهند | https://centralindia.customvoice.api.speech.microsoft.com |
| جنوب وسط الولايات المتحدة | https://southcentralus.customvoice.api.speech.microsoft.com |
| جنوب شرق آسيا | https://southeastasia.customvoice.api.speech.microsoft.com |
| جنوب المملكة المتحدة | https://uksouth.customvoice.api.speech.microsoft.com |
| غرب أوروبا | https://westeurope.customvoice.api.speech.microsoft.com |
طلبات رؤوس
يسرد هذا الجدول الرؤوس المطلوبة والاختيارية لطلبات تحويل النص إلى كلام:
| الرأس | الوصف | مطلوب أو اختياري |
|---|---|---|
Authorization |
رمز تفويض مسبوق بكلمة Bearer. لمزيد من المعلومات، راجع المصادقة. |
مطلوب |
Content-Type |
يحدد نوع المحتوى للنص المقدم. القيمة المقبولة: application/ssml+xml. |
مطلوب |
X-Microsoft-OutputFormat |
يحدد تنسيق إخراج الصوت. للحصول على قائمة كاملة بالقيم المقبولة، راجع مخرجات الصوت. | مطلوب |
User-Agent |
اسم التطبيق. يجب أن تكون القيمة المقدمة أقل من 255 حرفا. | مطلوب |
مخرجات الصوت
هذه قائمة بتنسيقات الصوت المدعومة التي يتم إرسالها في كل طلب كرأس X-Microsoft-OutputFormat . يتضمن كل تنسيق معدل بت ونوع ترميز. تدعم خدمة Speech مخرجات الصوت 24 كيلو هرتز و 16 كيلو هرتز و 8 كيلو هرتز.
raw-16khz-16bit-mono-pcm riff-16khz-16bit-mono-pcm
raw-24khz-16bit-mono-pcm riff-24khz-16bit-mono-pcm
raw-48khz-16bit-mono-pcm riff-48khz-16bit-mono-pcm
raw-8khz-8bit-mono-mulaw riff-8khz-8bit-mono-mulaw
raw-8khz-8bit-mono-alaw riff-8khz-8bit-mono-alaw
audio-16khz-32kbitrate-mono-mp3 audio-16khz-64kbitrate-mono-mp3
audio-16khz-128kbitrate-mono-mp3 audio-24khz-48kbitrate-mono-mp3
audio-24khz-96kbitrate-mono-mp3 audio-24khz-160kbitrate-mono-mp3
audio-48khz-96kbitrate-mono-mp3 audio-48khz-192kbitrate-mono-mp3
raw-16khz-16bit-mono-truesilk raw-24khz-16bit-mono-truesilk
webm-16khz-16bit-mono-opus webm-24khz-16bit-mono-opus
ogg-16khz-16bit-mono-opus ogg-24khz-16bit-mono-opus
ogg-48khz-16bit-mono-opus
ملاحظة
إذا كان تنسيق الصوت والإخراج المحدد له معدلات بت مختلفة، إعادة تشكيل الصوت حسب الضرورة. يمكنك فك تشفير ogg-24khz-16bit-mono-opus التنسيق باستخدام برنامج ترميز Opus.
نص الطلب
إذا كنت تستخدم صوتا عصبيا مخصصا، فيمكن إرسال نص الطلب كنص عادي (ASCII أو UTF-8). وإلا، يتم إرسال نص كل POST طلب باسم SSML. يسمح لك SSML باختيار صوت ولغة الكلام المركب الذي ترجعه ميزة تحويل النص إلى كلام. للحصول على قائمة كاملة بالأصوات المدعومة، راجع دعم اللغة والصوت لخدمة الكلام.
طلب عينة
يستخدم طلب HTTP هذا SSML لتحديد الصوت واللغة. إذا كان طول الجسم طويلا، وتجاوز الصوت الناتج 10 دقائق، اقتطاعه إلى 10 دقائق. بمعنى آخر ، لا يمكن أن يتجاوز طول الصوت 10 دقائق.
POST /cognitiveservices/v1 HTTP/1.1
X-Microsoft-OutputFormat: riff-24khz-16bit-mono-pcm
Content-Type: application/ssml+xml
Host: westus.tts.speech.microsoft.com
Content-Length: <Length>
Authorization: Bearer [Base64 access_token]
User-Agent: <Your application name>
<speak version='1.0' xml:lang='en-US'><voice xml:lang='en-US' xml:gender='Male'
name='en-US-ChristopherNeural'>
Microsoft Speech Service Text-to-Speech API
</voice></speak>
* بالنسبة إلى طول المحتوى، يجب عليك استخدام طول المحتوى الخاص بك. في معظم الحالات، يتم حساب هذه القيمة تلقائيا.
تعليمة برمجية حالة HTTP
يشير رمز حالة HTTP لكل استجابة إلى النجاح أو الأخطاء الشائعة:
| رمز حالة HTTP | الوصف | السبب المحتمل |
|---|---|---|
| 200 | موافق | الطلب ناجح. نص الاستجابة هو ملف صوتي. |
| 400 | طلب غير صالح | معلمة مطلوبة مفقودة أو فارغة أو خالية. أو، القيمة التي تم تمريرها إلى معلمة مطلوبة أو اختيارية غير صالحة. السبب الشائع هو رأس طويل جدا. |
| 401 | غير مصرح به | الطلب غير مصرح به. تأكد من أن مفتاح الاشتراك أو الرمز المميز صالح وفي المنطقة الصحيحة. |
| 415 | نوع الوسائط غير المدعومة | من الممكن أن تكون القيمة الخاطئة Content-Type قد تم توفيرها. Content-Type يجب ضبطه على application/ssml+xml. |
| 429 | عدد كبير جدًا من الطلبات | لقد تجاوزت الحصة النسبية أو معدل الطلبات المسموح بها لاشتراكك. |
| 502 | مدخل خطأ | هناك مشكلة في الشبكة أو الخادم. قد تشير هذه الحالة أيضا إلى رؤوس غير صالحة. |
إذا كانت حالة HTTP ، 200 OKفإن نص الاستجابة يحتوي على ملف صوتي بالتنسيق المطلوب. يمكن تشغيل هذا الملف أثناء نقله أو حفظه في مخزن مؤقت أو حفظه في ملف.