تثبيت حاويات Docker وتشغيلها لواجهات برمجة تطبيقات خدمة الكلام
باستخدام الحاويات، يمكنك تشغيل بعض واجهات برمجة تطبيقات خدمة الكلام Azure Cognitive Services في بيئتك الخاصة. وتعد الحاويات رائعة لمتطلبات الأمان وإدارة البيانات المحددة. في هذه المقالة، ستتعرف على كيفية تنزيل حاوية كلام وتثبيتها وتشغيلها.
باستخدام حاويات الكلام، يمكنك إنشاء بنية تطبيق كلام محسنة لكل من إمكانات السحابة القوية وموقع الحافة. تتوفر العديد من الحاويات، والتي تستخدم نفس أسعار خدمات Azure Speech المستندة إلى مجموعة النظراء.
هام
لقد تقاعدنا من أصوات توليف الكلام القياسية وحاوية تحويل النص إلى كلام في 31 أغسطس 2021. فكر في ترحيل تطبيقاتك لاستخدام حاوية تحويل النص إلى كلام العصبية بدلا من ذلك. لمزيد من المعلومات حول تحديث تطبيقك، راجع الترحيل من الصوت القياسي إلى الصوت العصبي المعد مسبقا.
| الحاوية | الميزات | الأحدث | حالة الإصدار |
|---|---|---|---|
| تحويل الكلام إلى نص | يحلل المشاعر وينسخ الكلام المستمر في الوقت الفعلي أو التسجيلات الصوتية الدفعية مع نتائج وسيطة. | 3.2.0 | متوفر بشكل عام |
| مخصص تحويل الكلام إلى نص | باستخدام نموذج مخصص من مدخل "الكلام المخصص"، يقوم بنسخ الكلام المستمر في الوقت الفعلي أو التسجيلات الصوتية الدفعية إلى نص بنتائج وسيطة. | 3.2.0 | متوفر بشكل عام |
| تحديد لغة الكلام | يكتشف اللغة المنطوقة في الملفات الصوتية. | 1.5.0 | معاينة |
| تحويل النص العصبي إلى كلام | يحول النص إلى كلام طبيعي باستخدام تقنية الشبكة العصبية العميقة ، والتي تسمح بمزيد من الكلام المركب الطبيعي. | 2.1.0 | متوفر بشكل عام |
المتطلبات الأساسية
هام
- لاستخدام حاويات الكلام، يجب إرسال طلب عبر الإنترنت والموافقة عليه. لمزيد من المعلومات، راجع قسم "طلب الموافقة على تشغيل الحاوية".
- تفي الحاويات المتوفرة بشكل عام بمتطلبات الاستقرار والدعم من Microsoft. لا تزال الحاويات قيد الإعداد.
يجب أن تستوفي المتطلبات الأساسية التالية قبل استخدام حاويات خدمة الكلام. إذا لم يكن لديك اشتراك Azure، فأنشئ حساباً مجانياً قبل أن تبدأ. تحتاج:
- Docker مثبت على كمبيوتر مضيف. يجب تكوين Docker للسماح للحاويات بالاتصال ببيانات الفوترة وإرسالها إلى Azure.
- في Windows ، يجب أيضا تكوين Docker لدعم حاويات Linux.
- يجب أن يكون لديك فهم أساسي لمفاهيم Docker.
- مورد خدمة Speech مع طبقة التسعير المجانية (F0) أو القياسية (S).
جمع المعلمات المطلوبة
هناك حاجة إلى ثلاثة معلمات أساسية لجميع حاويات الخدمات المعرفية. يجب أن تكون شروط ترخيص برامج Microsoft موجودة بقيمة قبول. هناك حاجة أيضا إلى مفتاح URI وواجهة برمجة التطبيقات لنقطة النهاية.
URI نقطة النهاية
{ENDPOINT_URI} تتوفر القيمة في صفحة نظرة عامة على مدخل Azure لمورد الخدمات المعرفية المقابل. انتقل إلى صفحة نظرة عامة ، ومرر مؤشر الماوس فوق نقطة النهاية، وستظهر أيقونة نسخ إلى الحافظة . انسخ نقطة النهاية واستخدمها عند الحاجة.

المفاتيح
{API_KEY} يتم استخدام القيمة لبدء تشغيل الحاوية وهي متوفرة في صفحة مفاتيح مدخل Azure من مورد الخدمات المعرفية المقابل. انتقل إلى صفحة المفاتيح ، وحدد أيقونة نسخ إلى الحافظة .

هام
يتم استخدام مفاتيح الاشتراك هذه للوصول إلى واجهة برمجة تطبيقات الخدمات المعرفية. لا تشارك مفاتيحك. تخزينها بشكل آمن. على سبيل المثال، استخدم Azure Key Vault. نوصي أيضا بإعادة إنشاء هذه المفاتيح بانتظام. مفتاح واحد فقط ضروري لإجراء استدعاء واجهة برمجة التطبيقات. عند إعادة إنشاء المفتاح الأول، يمكنك استخدام المفتاح الثاني لاستمرار الوصول إلى الخدمة.
متطلبات الكمبيوتر المضيف وتوصياته
المضيف هو جهاز كمبيوتر يستند إلى x64 يقوم بتشغيل حاوية Docker. يمكن أن يكون جهاز كمبيوتر في المبنى الخاص بك أو خدمة استضافة Docker في Azure، مثل:
- Azure Kubernetes Service.
- Azure Container instances.
- A Kubernetes cluster deployment to Azure Stack. لمزيد من المعلومات، راجع نشر Kubernetes إلى Azure Stack.
متطلبات الحاويات والتوصيات
يصف الجدول التالي الحد الأدنى والموصى به من تخصيص الموارد لكل حاوية كلام:
| الحاوية | الحدّ الأدنى | المستحسنة |
|---|---|---|
| تحويل الكلام إلى نص | نواتان، ذاكرة 2 جيجابايت | 4 نويات، ذاكرة 4 جيجابايت |
| مخصص تحويل الكلام إلى نص | نواتان، ذاكرة 2 جيجابايت | 4 نويات، ذاكرة 4 جيجابايت |
| تحديد لغة الكلام | 1 نواة، ذاكرة 1 جيجابايت | 1 نواة، ذاكرة 1 جيجابايت |
| تحويل النص العصبي إلى كلام | 6 نواة، ذاكرة 12 جيجابايت | 8 نواة، ذاكرة 16 جيجابايت |
يجب أن يكون كل نواة 2.6 غيغاهيرتز على الأقل (غيغاهرتز) أو أسرع.
يتوافق --cpus النواة والذاكرة مع الإعدادات والإعدادات --memory المستخدمة كجزء من docker run الأمر.
ملاحظة
يعتمد الحد الأدنى من المخصصات الموصى بها على حدود Docker ، وليس موارد الجهاز المضيف. على سبيل المثال، تقوم حاويات الكلام إلى نص بتعيين أجزاء من نموذج لغة كبير. نوصي بأن الملف بأكمله يجب أن يتناسب مع الذاكرة ، وهو عبارة عن 4 إلى 6 غيغابايت إضافية. أيضا ، قد يستغرق التشغيل الأول لأي من الحاويتين وقتا أطول لأنه يتم تقسيم النماذج إلى صفحات في الذاكرة.
دعم ملحق متجه متقدم
المضيف هو الكمبيوتر الذي يقوم بتشغيل حاوية Docker. يجب أن يدعمالمضيف ملحقات المتجهات المتقدمة (AVX2). يمكنك التحقق من وجود دعم AVX2 على مضيفات Linux باستخدام الأمر التالي:
grep -q avx2 /proc/cpuinfo && echo AVX2 supported || echo No AVX2 support detected
تحذير
الكمبيوتر المضيف مطلوب لدعم AVX2. لن تعمل الحاوية بشكل صحيح بدون دعم AVX2.
طلب الموافقة على تشغيل الحاوية
املأ نموذج الطلب وأرسله لطلب الوصول إلى الحاوية.
يطلب النموذج معلومات عنك وعن شركتك وسيناريو المستخدم الذي ستستخدم الحاوية له. بعد إرسال النموذج، يقوم فريق Azure Cognitive Services بمراجعته وإرسال قرار إليك عبر البريد الإلكتروني في غضون 10 أيام عمل.
هام
- في النموذج، يجب عليك استخدام عنوان بريد إلكتروني مقترن بمعرف اشتراك Azure.
- يجب أن يكون مورد Azure الذي تستخدمه لتشغيل الحاوية قد تم إنشاؤه باستخدام معرف اشتراك Azure المعتمد.
- تحقق من بريدك الإلكتروني (كل من علبة الوارد ومجلدات البريد غير الهام) للحصول على تحديثات حول حالة التطبيق الخاص بك من Microsoft.
بعد الموافقة، ستتمكن من تشغيل الحاوية بعد تنزيلها من سجل حاويات Microsoft (MCR)، الموضح لاحقا في المقالة.
لن تتمكن من تشغيل الحاوية إذا لم تتم الموافقة على اشتراكك في Azure.
احصل على صورة الحاوية باستخدام سحب عامل الرصيف
تتوفر صور الحاوية الخاصة ب "الكلام" في سجل الحاوية التالي.
| الحاوية | المستودع |
|---|---|
| تحويل الكلام إلى نص | mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest |
تلميح
يمكنك استخدام الأمر "صور عامل الإرساء " لسرد صور الحاوية التي تم تنزيلها. على سبيل المثال، يسرد الأمر التالي المعرف والمستودع والعلامة الخاصة بكل صورة حاوية تم تنزيلها، منسقة كجدول:
docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"
IMAGE ID REPOSITORY TAG
<image-id> <repository-path/name> <tag-name>
سحب الرصيف لحاويات الكلام
سحب Docker لحاوية تحويل الكلام إلى نص
استخدم أمر سحب عامل الرصيف لتنزيل صورة حاوية من سجل حاويات Microsoft:
docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest
هام
تقوم latest العلامة بسحب en-US الإعدادات المحلية. للحصول على لغات إضافية، راجع الإعدادات المحلية لتحويل الكلام إلى نص.
الإعدادات المحلية لتحويل الكلام إلى نص
جميع العلامات، باستثناء ، هي بالتنسيق التالي وهي حساسة لحالة latestالأحرف:
<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>
العلامة التالية هي مثال على التنسيق:
2.6.0-amd64-en-us
للحصول على كافة الإعدادات المحلية المدعومة لحاوية تحويل الكلام إلى نص، راجع علامات تمييز صورة تحويل الكلام إلى نص.
استخدم الحاوية
بعد أن تكون الحاوية على الكمبيوتر المضيف، استخدم العملية التالية للعمل مع الحاوية.
- قم بتشغيل الحاوية باستخدام إعدادات الفوترة المطلوبة. تتوفر المزيد من الأمثلة على
docker runالأمر. - الاستعلام عن نقطة نهاية التنبؤ بالحاوية.
قم بتشغيل الحاوية مع تشغيل عامل الرصيف
استخدم الأمر تشغيل عامل الرصيف لتشغيل الحاوية. لمزيد من المعلومات حول كيفية الحصول على {Endpoint_URI} القيم والقيم {API_Key} ، راجع جمع المعلمات المطلوبة. تتوفر أيضا المزيد من الأمثلة علىdocker run الأمر.
تشغيل الحاوية في بيئات غير متصلة
بدءا من الإصدار 3.0.0 من الحاوية، يمكن للعملاء المحددين تشغيل حاويات تحويل الكلام إلى نص في بيئة لا يمكن الوصول إليها عبر الإنترنت. لمزيد من المعلومات، راجع تشغيل حاويات الخدمات المعرفية في بيئات غير متصلة.
بدءا من إصدار الحاوية 2.0.0 ، يمكن للعملاء المحددين تشغيل حاويات تحويل النص إلى كلام عصبي في بيئة لا يمكن الوصول إليها عبر الإنترنت. لمزيد من المعلومات، راجع تشغيل حاويات الخدمات المعرفية في بيئات غير متصلة.
لتشغيل حاوية تحويل الكلام إلى نص القياسية، قم بتنفيذ الأمر التالي docker run :
docker run --rm -it -p 5000:5000 --memory 4g --cpus 4 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
هذا الأمر:
- تشغيل حاوية تحويل الكلام إلى نص من صورة الحاوية.
- يخصص 4 نوى وحدة المعالجة المركزية و 4 غيغابايت من الذاكرة.
- يعرض منفذ TCP 5000 ويخصص TTY زائف للحاوية.
- يزيل الحاوية تلقائياً بعد إنهائها. صورة الحاوية لا تزال متوفرة على الكمبيوتر المضيف.
ملاحظة
تدعم الحاويات إدخال الصوت المضغوط إلى Speech SDK باستخدام GStreamer. لتثبيت GStreamer في حاوية، اتبع إرشادات Linux الخاصة ب GStreamer في استخدام إدخال الصوت المضغوط لبرنامج الترميز مع Speech SDK.
التقسيم اليومي على مخرجات تحويل الكلام إلى نص
يتم تمكين Diarization افتراضيا. للحصول على diarization في ردك ، استخدم diarize_speech_config.set_service_property.
اضبط تنسيق إخراج العبارة على
Detailed.اضبط وضع التدوير. الأوضاع المدعومة هي
IdentityوAnonymous.diarize_speech_config.set_service_property( name='speechcontext-PhraseOutput.Format', value='Detailed', channel=speechsdk.ServicePropertyChannel.UriQueryParameter ) diarize_speech_config.set_service_property( name='speechcontext-phraseDetection.speakerDiarization.mode', value='Identity', channel=speechsdk.ServicePropertyChannel.UriQueryParameter )ملاحظة
يعود
"SpeakerId": "Customer"وضع "الهوية" أو"SpeakerId": "Agent". يعود"SpeakerId": "Speaker 1"وضع "مجهول" أو"SpeakerId": "Speaker 2".
تحليل المشاعر حول إخراج الكلام إلى نص
بدءا من الإصدار 2.6.0 من حاوية تحويل الكلام إلى نص، يجب عليك استخدام نقطة نهاية واجهة برمجة تطبيقات خدمة اللغة 3.0 بدلا من نقطة المعاينة. على سبيل المثال:
https://westus2.api.cognitive.microsoft.com/text/analytics/v3.0/sentimenthttps://localhost:5000/text/analytics/v3.0/sentiment
ملاحظة
واجهة برمجة تطبيقات خدمة v3.0 اللغة غير متوافقة مع الإصدارات السابقة مع v3.0-preview.1. للحصول على أحدث دعم لميزة المشاعر ، استخدم v2.6.0 صورة حاوية الكلام إلى نص وخدمة v3.0اللغة .
بدءا من الإصدار 2.2.0 من حاوية تحويل الكلام إلى نص ، يمكنك استدعاء واجهة برمجة تطبيقات تحليل المشاعر v3 على الإخراج. للاتصال بتحليل المشاعر، ستحتاج إلى نقطة نهاية مورد واجهة برمجة تطبيقات خدمة اللغة. على سبيل المثال:
https://westus2.api.cognitive.microsoft.com/text/analytics/v3.0-preview.1/sentimenthttps://localhost:5000/text/analytics/v3.0-preview.1/sentiment
إذا كنت تقوم بالوصول إلى نقطة نهاية خدمة اللغة في السحابة، فستحتاج إلى مفتاح. إذا كنت تستخدم ميزات خدمة اللغة محليا، فقد لا تحتاج إلى توفير ذلك.
يتم تمرير المفتاح ونقطة النهاية إلى حاوية الكلام كوسيطات، كما في المثال التالي:
docker run -it --rm -p 5000:5000 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY} \
CloudAI:SentimentAnalysisSettings:TextAnalyticsHost={TEXT_ANALYTICS_HOST} \
CloudAI:SentimentAnalysisSettings:SentimentAnalysisApiKey={SENTIMENT_APIKEY}
هذا الأمر:
- ينفذ نفس الخطوات مثل الأمر السابق.
- يخزن نقطة نهاية ومفتاح واجهة برمجة تطبيقات خدمة اللغة، لإرسال طلبات تحليل المشاعر.
قائمة العبارات v2 على إخراج الكلام إلى نص
بدءا من الإصدار 2.6.0 من حاوية تحويل الكلام إلى نص ، يمكنك الحصول على الإخراج باستخدام العبارات الخاصة بك ، إما الجملة بأكملها أو العبارات الموجودة في المنتصف. على سبيل المثال ، الرجل طويل القامة في الجملة التالية:
- "هذه جملة الرجل الطويل القامة هذه جملة أخرى."
لتكوين قائمة عبارات، تحتاج إلى إضافة العبارات الخاصة بك عند إجراء المكالمة. على سبيل المثال:
phrase="the tall man"
recognizer = speechsdk.SpeechRecognizer(
speech_config=dict_speech_config,
audio_config=audio_config)
phrase_list_grammer = speechsdk.PhraseListGrammar.from_recognizer(recognizer)
phrase_list_grammer.addPhrase(phrase)
dict_speech_config.set_service_property(
name='setflight',
value='xonlineinterp',
channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)
إذا كان لديك عبارات متعددة لإضافتها، فاتصل .addPhrase() بكل عبارة لإضافتها إلى قائمة العبارات.
هام
Eulaيجب تحديد ، Billingوالخيارات ApiKey لتشغيل الحاوية. وإلا، فلن تبدأ الحاوية. لمزيد من المعلومات، راجع الفوترة.
الاستعلام عن نقطة نهاية التنبؤ بالحاوية
ملاحظة
استخدم رقم منفذ فريدا إذا كنت تقوم بتشغيل حاويات متعددة.
| الحاويات | عنوان URL لمضيف SDK | البروتوكول |
|---|---|---|
| تحويل الكلام إلى نص قياسي وتحويل الكلام إلى نص مخصص | ws://localhost:5000 |
دبليو إس |
| تحويل النص العصبي إلى كلام، تحديد لغة الكلام | http://localhost:5000 |
HTTP |
لمزيد من المعلومات حول استخدام بروتوكولي WSS وHTTPS، راجع أمان الحاويات.
تحويل الكلام إلى نص (قياسي ومخصص)
توفر الحاوية واجهات برمجة تطبيقات نقطة نهاية الاستعلام المستندة إلى websocket والتي يتم الوصول إليها من خلال Speech SDK. بشكل افتراضي، تستخدم حزمة تطوير البرامج (SDK) الخاصة بالكلام خدمات الكلام عبر الإنترنت. لاستخدام الحاوية ، تحتاج إلى تغيير طريقة التهيئة.
تلميح
عند استخدام Speech SDK مع حاويات، لن تحتاج إلى توفير مفتاح اشتراك مورد Azure Speech أو رمز مميز لحامل المصادقة.
انظر الأمثلة التالية.
التغيير من استخدام استدعاء تهيئة سحابة Azure هذا:
var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");
لاستخدام هذه المكالمة مع مضيف الحاوية:
var config = SpeechConfig.FromHost(
new Uri("ws://localhost:5000"));
تحليل التوجه
إذا قمت بتوفير بيانات اعتماد واجهة برمجة تطبيقات خدمة اللغة إلى الحاوية، فيمكنك استخدام Speech SDK لإرسال طلبات التعرف على الكلام مع تحليل المشاعر. يمكنك تكوين استجابات واجهة برمجة التطبيقات لاستخدام تنسيق بسيط أو مفصل .
ملاحظة
يحتوي الإصدار 1.13 من Python SDK لخدمة الكلام على مشكلة محددة في تحليل المشاعر. استخدم الإصدار v1.12.x أو إصدار أقدم إذا كنت تستخدم تحليل المشاعر في Speech Service Python SDK.
لتكوين عميل Speech لاستخدام تنسيق بسيط، أضف "Sentiment" كقيمة ل Simple.Extensions. إذا كنت تريد اختيار إصدار طراز خدمة لغة معين، فاستبدله 'latest' في تكوين الخاصية speechcontext-phraseDetection.sentimentAnalysis.modelversion .
speech_config.set_service_property(
name='speechcontext-PhraseOutput.Simple.Extensions',
value='["Sentiment"]',
channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)
speech_config.set_service_property(
name='speechcontext-phraseDetection.sentimentAnalysis.modelversion',
value='latest',
channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)
Simple.Extensions ترجع هذه الدالة نتيجة المشاعر في الطبقة الجذرية للاستجابة.
{
"DisplayText":"What's the weather like?",
"Duration":13000000,
"Id":"6098574b79434bd4849fee7e0a50f22e",
"Offset":4700000,
"RecognitionStatus":"Success",
"Sentiment":{
"Negative":0.03,
"Neutral":0.79,
"Positive":0.18
}
}
إذا كنت ترغب في تعطيل تحليل المشاعر تماما ، فأضف false قيمة إلى sentimentanalysis.enabled.
speech_config.set_service_property(
name='speechcontext-phraseDetection.sentimentanalysis.enabled',
value='false',
channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)
تحويل النص العصبي إلى كلام
توفر الحاوية واجهات برمجة تطبيقات نقطة النهاية المستندة إلى REST. تتوفر العديد من نماذج مشاريع التعليمات البرمجية المصدر للنظام الأساسي والإطار والاختلافات اللغوية.
باستخدام حاويات تحويل النص إلى كلام العصبية، يجب أن تعتمد على الإعدادات المحلية وصوت علامة الصورة التي قمت بتنزيلها. على سبيل المثال، إذا قمت بتنزيل latest العلامة، فإن الإعدادات المحلية الافتراضية هي en-US والصوت AriaNeural . {VOICE_NAME} ستكون الحجة بعد en-US-AriaNeuralذلك . راجع المثال التالي SSML:
<speak version="1.0" xml:lang="en-US">
<voice name="en-US-AriaNeural">
This text will get converted into synthesized speech.
</voice>
</speak>
تشغيل حاويات متعددة على نفس المضيف
إذا كنت تنوي تشغيل حاويات متعددة مع منافذ مكشوفة، فتأكد من تشغيل كل حاوية بمنفذ مكشوف مختلف. على سبيل المثال، قم بتشغيل الحاوية الأولى على المنفذ 5000 والحاوية الثانية على المنفذ 5001.
يمكنك تشغيل هذه الحاوية وحاوية خدمات معرفية مختلفة على المضيف معا. يمكنك أيضا تشغيل حاويات متعددة من نفس حاوية الخدمات المعرفية.
التحقق من تشغيل حاوية
هناك عدة طرق للتحقق من أن الحاوية قيد التشغيل. حدد موقع عنوان IP الخارجي والمنفذ المكشوف للحاوية المعنية، وافتح متصفح الويب المفضل لديك. استخدم عناوين URL المختلفة للطلبات التالية للتحقق من صحة تشغيل الحاوية. أمثلة عناوين URL للطلبات المدرجة هنا هي http://localhost:5000، ولكن قد تختلف الحاوية المحددة. تأكد من الاعتماد على عنوان IP الخارجي للحاوية والمنفذ المكشوف.
| URL للطلب | الغرض |
|---|---|
http://localhost:5000/ |
توفر الحاوية صفحةً رئيسيةً. |
http://localhost:5000/ready |
يوفر عنوان URL هذا، المطلوب باستخدام GET، التحقق من أن الحاوية جاهزة لقبول استعلام مقابل النموذج. يمكن استخدام هذا الطلب لتحقيقات Kubernetes للأحياء والاستعداد. |
http://localhost:5000/status |
يتحقق عنوان URL هذا المطلوب أيضا مع GET مما إذا كان مفتاح واجهة برمجة التطبيقات المستخدم لبدء تشغيل الحاوية صالحا دون التسبب في استعلام نقطة نهاية. يمكن استخدام هذا الطلب لتحقيقات Kubernetes للأحياء والاستعداد. |
http://localhost:5000/swagger |
توفر الحاوية مجموعةً كاملةً من الوثائق لنقاط النهاية وميزة Try it out. باستخدام هذه الميزة ، يمكنك إدخال إعداداتك في نموذج HTML مستند إلى الويب وإجراء الاستعلام دون الحاجة إلى كتابة أي رمز. بعد إرجاع الاستعلام، يتم توفير مثال لأمر CURL لإظهار رؤوس HTTP وتنسيق النص الأساسي المطلوب. |

إيقاف الحاوية
لإيقاف تشغيل الحاوية، في بيئة سطر الأوامر حيث يتم تشغيل الحاوية، حدد Ctrl+C.
استكشاف الأخطاء وإصلاحها
عند بدء تشغيل الحاوية أو تشغيلها، قد تواجه مشكلات. استخدم حامل الإخراج وقم بتمكين التسجيل. يسمح القيام بذلك للحاوية بإنشاء ملفات سجل مفيدة عند استكشاف المشكلات وإصلاحها.
تلميح
لمزيد من المعلومات والإرشادات حول استكشاف الأخطاء وإصلاحها، راجع الأسئلة المتداولة حول حاويات الخدمات المعرفية (FAQ).
إذا كنت تواجه مشكلة في تشغيل حاوية الخدمات المعرفية، فيمكنك تجربة استخدام حاوية تشخيص Microsoft. استخدم هذه الحاوية لتشخيص الأخطاء الشائعة في بيئة النشر الخاصة بك والتي قد تمنع حاويات الخدمات المعرفية من العمل بالشكل المتوقع.
للحصول على الحاوية، استخدم الأمر التالي docker pull :
docker pull mcr.microsoft.com/azure-cognitive-services/diagnostic
ثم قم بتشغيل الحاوية. استبدل {ENDPOINT_URI} بنقطة النهاية، واستبدلها {API_KEY} بمفتاح المورد:
docker run --rm mcr.microsoft.com/azure-cognitive-services/diagnostic \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
ستختبر الحاوية اتصال الشبكة بنقطة نهاية الفوترة.
الفوترة
ترسل حاويات الكلام معلومات الفوترة إلى Azure باستخدام مورد Speech على حساب Azure الخاص بك.
تتم فوترة الاستعلامات إلى الحاوية في طبقة التسعير لمورد Azure المستخدم للمعلمة ApiKey .
حاويات Azure Cognitive Services غير مرخصة للتشغيل دون الاتصال بنقطة نهاية القياس أو الفوترة. يجب تمكين الحاويات من توصيل معلومات الفوترة بنقطة نهاية الفوترة في جميع الأوقات. لا ترسل حاويات الخدمات المعرفية بيانات العملاء، مثل الصورة أو النص الذي يتم تحليله، إلى Microsoft.
قم بالاتصال بـ Azure
تحتاج الحاوية إلى قيم وسيطة الفوترة لتشغيلها. تسمح هذه القيم للحاوية بالاتصال بنقطة نهاية الفوترة. تقوم الحاوية بالإبلاغ عن الاستخدام كل 10 إلى 15 دقيقة تقريبا. إذا لم تتصل الحاوية ب Azure خلال الإطار الزمني المسموح به، فستستمر الحاوية في العمل ولكنها لا تعرض الاستعلامات حتى تتم استعادة نقطة نهاية الفوترة. تتم محاولة الاتصال 10 مرات في نفس الفاصل الزمني من 10 إلى 15 دقيقة. إذا تعذر عليها الاتصال بنقطة نهاية الفوترة خلال 10 محاولات، فستتوقف الحاوية عن عرض الطلبات. راجع الأسئلة المتداولة حول حاوية الخدمات المعرفية للحصول على مثال على المعلومات المرسلة إلى Microsoft للفوترة.
وسيطات الفوترة
docker run سيبدأ الأمر الحاوية عند توفير جميع الخيارات الثلاثة التالية بقيم صالحة:
| الخيار | الوصف |
|---|---|
ApiKey |
مفتاح واجهة برمجة التطبيقات لمورد الخدمات المعرفية المستخدم لتعقب معلومات الفوترة. يجب تعيين قيمة هذا الخيار إلى مفتاح API للمورد الموفر المحدد في Billing. |
Billing |
نقطة نهاية مورد الخدمات المعرفية المستخدم لتعقب معلومات الفوترة. يجب تعيين قيمة هذا الخيار إلى URI نقطة النهاية لمورد Azure مزود. |
Eula |
يشير إلى أنك قبلت ترخيص الحاوية. يجب تعيين قيمة هذا الخيار لقبول. |
لمزيد من المعلومات حول هذه الخيارات، راجع تكوين الحاويات.
الملخص
في هذه المقالة، تعلمت المفاهيم وسير العمل لكيفية تنزيل حاويات الكلام وتثبيتها وتشغيلها. وخلاصة القول:
- يوفر Speech أربع حاويات Linux ل Docker تتمتع بقدرات مختلفة:
- تحويل الكلام إلى نص
- مخصص تحويل الكلام إلى نص
- تحويل النص العصبي إلى كلام
- تحديد لغة الكلام
- يتم تنزيل صور الحاوية من سجل الحاوية في Azure.
- يتم تشغيل صور الحاوية في Docker.
- سواء كنت تستخدم واجهة برمجة تطبيقات REST (تحويل النص إلى كلام فقط) أو SDK (تحويل الكلام إلى نص أو تحويل النص إلى كلام)، فإنك تحدد عنوان URI المضيف للحاوية.
- يتعين عليك تقديم معلومات الفوترة عند إنشاء حاوية.
هام
حاويات الخدمات المعرفية غير مرخصة للتشغيل دون الاتصال ب Azure للقياس. يحتاج العملاء إلى تمكين الحاويات من توصيل معلومات الفوترة مع خدمة القياس في جميع الأوقات. لا ترسل حاويات الخدمات المعرفية بيانات العملاء (على سبيل المثال، الصورة أو النص الذي يتم تحليله) إلى Microsoft.
الخطوات التالية
- راجع تكوين الحاويات لإعدادات التكوين.
- تعرف على كيفية استخدام حاويات خدمة الكلام مع Kubernetes وHelm.
- استخدم المزيد من حاويات الخدمات المعرفية.

