ما هو المساعد الصوتي؟
باستخدام المساعدين الصوتيين مع خدمة Speech ، يمكن للمطورين إنشاء واجهات محادثة طبيعية تشبه الإنسان لتطبيقاتهم وتجاربهم.
توفر خدمة المساعد الصوتي تفاعلا سريعا وموثوقا به بين الجهاز وتنفيذ المساعد الذي يستخدم إما الكلام المباشر (عبر خدمة Azure Bot) لإضافة إمكانات صوتية إلى برامج التتبع أو الأوامر المخصصة لسيناريوهات الأوامر الصوتية.
اختر حل مساعد
الخطوة الأولى في إنشاء مساعد صوتي هي تحديد ما تريد أن يفعله. توفر خدمة الكلام حلولا متعددة وتكميلية لصياغة تفاعلات المساعد. للحصول على المرونة وتعدد الاستخدامات، يمكنك إضافة إمكانات الدخول والخروج الصوتي إلى روبوت باستخدام خدمة Azure Bot مع قناة Direct Line Speech ، أو يمكنك ببساطة تأليف تطبيق أوامر مخصصة للحصول على سيناريوهات أوامر صوتية أكثر وضوحا.
| إذا كنت تريد... | فكر في استخدام... | أمثلة |
|---|---|---|
| محادثة مفتوحة مع تكامل قوي للمهارات وتحكم كامل في النشر | Azure Bot Service bot with Direct Line Speech channel |
|
| الأوامر الصوتية أو المحادثات البسيطة الموجهة نحو المهام مع التأليف والاستضافة المبسطة | الأوامر المخصصة |
|
إذا لم تكن متأكدا بعد مما تريد أن يفعله مساعدك، فإننا نوصي باستخدام " الكلام المباشر" كأفضل خيار. يوفر التكامل مع مجموعة غنية من الأدوات ومساعدات التأليف ، مثل حل المساعد الافتراضي وقالب المؤسسةوخدمة QnA Maker ، للبناء على الأنماط الشائعة واستخدام مصادر المعرفة الحالية الخاصة بك.
إذا كنت ترغب في الحفاظ على بساطة الأمر في الوقت الحالي ، فإن الأوامر المخصصة تجعل من السهل إنشاء تطبيقات غنية للأوامر الصوتية تم تحسينها للتفاعل الصوتي أولا. توفر الأوامر المخصصة تجربة تأليف موحدة ونموذج استضافة تلقائي وتعقيدا أقل نسبيا، وكل ذلك يمكن أن يساعدك على التركيز على بناء أفضل حل لسيناريو الأوامر الصوتية.

بنية مرجعية لإنشاء مساعد صوتي باستخدام Speech SDK

الميزات الأساسية
سواء اخترت " كلام الخط المباشر " أو " أوامر مخصصة " لإنشاء تفاعلات "مساعد"، يمكنك استخدام مجموعة غنية من ميزات التخصيص لتخصيص مساعدك لعلامتك التجارية ومنتجك وشخصيتك.
| الفئة | الميزات |
|---|---|
| كلمة رئيسية مخصصة | يمكن للمستخدمين بدء المحادثات مع المساعدين باستخدام كلمة رئيسية مخصصة مثل "Hey Contoso". يقوم أحد التطبيقات بذلك باستخدام محرك كلمات رئيسية مخصص في Speech SDK، والذي يمكنك تكوينه من خلال الانتقال إلى بدء استخدام الكلمات الرئيسية المخصصة. يمكن للمساعدين الصوتيين استخدام التحقق من الكلمات الرئيسية من جانب الخدمة لتحسين دقة تنشيط الكلمة الرئيسية (مقابل استخدام الجهاز وحده). |
| تحويل الكلام إلى نص | يقوم المساعدون الصوتيون بتحويل الصوت في الوقت الفعلي إلى نص تم التعرف عليه باستخدام تحويل الكلام إلى نص من خدمة الكلام. يتوفر هذا النص ، كما يتم نسخه ، لكل من تنفيذ مساعدك وتطبيق العميل. |
| تحويل النص إلى كلام | يتم تجميع الردود النصية من مساعدك من خلال تحويل النص إلى كلام من خدمة الكلام. ثم يتم توفير هذا التوليف لتطبيق العميل الخاص بك كدفق صوتي. توفر Microsoft القدرة على إنشاء صوت مخصص وعالي الجودة لتحويل النص العصبي إلى كلام (Neural TTS) يعطي صوتا لعلامتك التجارية. لمعرفة المزيد، اتصل بنا. |
بدء استخدام المساعدين الصوتيين
نحن نقدم مقالات التشغيل السريع التالية ، التي تم تنظيمها بواسطة لغة البرمجة ، والتي تم تصميمها لجعلك تقوم بتشغيل التعليمات البرمجية في أقل من 10 دقائق:
- التشغيل السريع: إنشاء مساعد صوتي مخصص باستخدام "كلام الخط المباشر"
- التشغيل السريع: إنشاء تطبيق أوامر صوتية باستخدام الأوامر المخصصة
نموذج التعليمات البرمجية والبرامج التعليمية
يتوفر نموذج التعليمات البرمجية لإنشاء مساعد صوتي على GitHub. تغطي العينات تطبيق العميل للاتصال بمساعدك بعدة لغات برمجة شائعة.
- عينات المساعد الصوتي على GitHub
- البرنامج التعليمي: تمكين مساعد تم إنشاؤه باستخدام خدمة Azure Bot باستخدام حزمة تطوير البرامج (SDK) للكلام C#
- البرنامج التعليمي: إنشاء تطبيق أوامر مخصصة باستخدام أوامر صوتية بسيطة
التخصيص
يمكن للمساعدين الصوتيين الذين تقوم بإنشائهم باستخدام خدمة Speech استخدام مجموعة كاملة من خيارات التخصيص.
ملاحظة
تختلف خيارات التخصيص حسب اللغة والإعدادات المحلية. لمعرفة المزيد، راجع اللغات المدعومة.