ما هو المساعد الصوتي؟

باستخدام المساعدين الصوتيين مع خدمة Speech ، يمكن للمطورين إنشاء واجهات محادثة طبيعية تشبه الإنسان لتطبيقاتهم وتجاربهم.

توفر خدمة المساعد الصوتي تفاعلا سريعا وموثوقا به بين الجهاز وتنفيذ المساعد الذي يستخدم إما الكلام المباشر (عبر خدمة Azure Bot) لإضافة إمكانات صوتية إلى برامج التتبع أو الأوامر المخصصة لسيناريوهات الأوامر الصوتية.

اختر حل مساعد

الخطوة الأولى في إنشاء مساعد صوتي هي تحديد ما تريد أن يفعله. توفر خدمة الكلام حلولا متعددة وتكميلية لصياغة تفاعلات المساعد. للحصول على المرونة وتعدد الاستخدامات، يمكنك إضافة إمكانات الدخول والخروج الصوتي إلى روبوت باستخدام خدمة Azure Bot مع قناة Direct Line Speech ، أو يمكنك ببساطة تأليف تطبيق أوامر مخصصة للحصول على سيناريوهات أوامر صوتية أكثر وضوحا.

إذا كنت تريد... فكر في استخدام... أمثلة
محادثة مفتوحة مع تكامل قوي للمهارات وتحكم كامل في النشر Azure Bot Service bot with Direct Line Speech channel
  • "أحتاج للذهاب إلى سياتل"
  • "ما نوع البيتزا التي يمكنني طلبها؟"
الأوامر الصوتية أو المحادثات البسيطة الموجهة نحو المهام مع التأليف والاستضافة المبسطة الأوامر المخصصة
  • "تشغيل الضوء العلوي"
  • "اجعلها أكثر دفئا بمقدار 5 درجات"
  • مزيد من الأمثلة في استوديو الكلام

إذا لم تكن متأكدا بعد مما تريد أن يفعله مساعدك، فإننا نوصي باستخدام " الكلام المباشر" كأفضل خيار. يوفر التكامل مع مجموعة غنية من الأدوات ومساعدات التأليف ، مثل حل المساعد الافتراضي وقالب المؤسسةوخدمة QnA Maker ، للبناء على الأنماط الشائعة واستخدام مصادر المعرفة الحالية الخاصة بك.

إذا كنت ترغب في الحفاظ على بساطة الأمر في الوقت الحالي ، فإن الأوامر المخصصة تجعل من السهل إنشاء تطبيقات غنية للأوامر الصوتية تم تحسينها للتفاعل الصوتي أولا. توفر الأوامر المخصصة تجربة تأليف موحدة ونموذج استضافة تلقائي وتعقيدا أقل نسبيا، وكل ذلك يمكن أن يساعدك على التركيز على بناء أفضل حل لسيناريو الأوامر الصوتية.

Screenshot of a graph comparing the relative complexity and flexibility of the two voice assistant solutions.

بنية مرجعية لإنشاء مساعد صوتي باستخدام Speech SDK

Conceptual diagram of the voice assistant orchestration service flow.

الميزات الأساسية

سواء اخترت " كلام الخط المباشر " أو " أوامر مخصصة " لإنشاء تفاعلات "مساعد"، يمكنك استخدام مجموعة غنية من ميزات التخصيص لتخصيص مساعدك لعلامتك التجارية ومنتجك وشخصيتك.

الفئة الميزات
كلمة رئيسية مخصصة يمكن للمستخدمين بدء المحادثات مع المساعدين باستخدام كلمة رئيسية مخصصة مثل "Hey Contoso". يقوم أحد التطبيقات بذلك باستخدام محرك كلمات رئيسية مخصص في Speech SDK، والذي يمكنك تكوينه من خلال الانتقال إلى بدء استخدام الكلمات الرئيسية المخصصة. يمكن للمساعدين الصوتيين استخدام التحقق من الكلمات الرئيسية من جانب الخدمة لتحسين دقة تنشيط الكلمة الرئيسية (مقابل استخدام الجهاز وحده).
تحويل الكلام إلى نص يقوم المساعدون الصوتيون بتحويل الصوت في الوقت الفعلي إلى نص تم التعرف عليه باستخدام تحويل الكلام إلى نص من خدمة الكلام. يتوفر هذا النص ، كما يتم نسخه ، لكل من تنفيذ مساعدك وتطبيق العميل.
تحويل النص إلى كلام يتم تجميع الردود النصية من مساعدك من خلال تحويل النص إلى كلام من خدمة الكلام. ثم يتم توفير هذا التوليف لتطبيق العميل الخاص بك كدفق صوتي. توفر Microsoft القدرة على إنشاء صوت مخصص وعالي الجودة لتحويل النص العصبي إلى كلام (Neural TTS) يعطي صوتا لعلامتك التجارية. لمعرفة المزيد، اتصل بنا.

بدء استخدام المساعدين الصوتيين

نحن نقدم مقالات التشغيل السريع التالية ، التي تم تنظيمها بواسطة لغة البرمجة ، والتي تم تصميمها لجعلك تقوم بتشغيل التعليمات البرمجية في أقل من 10 دقائق:

نموذج التعليمات البرمجية والبرامج التعليمية

يتوفر نموذج التعليمات البرمجية لإنشاء مساعد صوتي على GitHub. تغطي العينات تطبيق العميل للاتصال بمساعدك بعدة لغات برمجة شائعة.

التخصيص

يمكن للمساعدين الصوتيين الذين تقوم بإنشائهم باستخدام خدمة Speech استخدام مجموعة كاملة من خيارات التخصيص.

ملاحظة

تختلف خيارات التخصيص حسب اللغة والإعدادات المحلية. لمعرفة المزيد، راجع اللغات المدعومة.

الخطوات التالية