ما هو مساعد الصوت؟

من خلال استخدام مساعدين الصوت مع خدمة الكلام، يمكن للمطورين إنشاء واجهات محادثة طبيعية شبيهة بالبشر لتطبيقاتهم وتجاربهم. توفر خدمة المساعد الصوتي تفاعلا سريعا وموثوقا بين جهاز وتنفيذ مساعد.

اختيار حل مساعد

الخطوة الأولى في سبيل إنشاء مساعد صوت هي تحديد ما تريد منه القيام به. توفر خدمة الكلام حلولاً تكميلية متعددة لصياغة تفاعلات المساعد. قد ترغب في أن يدعم تطبيقك محادثة مفتوحة مع عبارات مثل "أحتاج إلى الانتقال إلى سياتل" أو "ما نوع البيتزا التي يمكنني طلبها؟" من أجل المرونة والتنوع، يمكنك إضافة قدرات الصوت والصوت إلى روبوت باستخدام Azure الذكاء الاصطناعي Bot Service مع قناة Direct Line Speech .

إذا لم تكن متأكداً بعد مما تريد أن يفعله مساعدك، نوصي باستخدام Direct Line Speech كأفضل خيار. فهو يوفر التكامل مع مجموعة غنية من الأدوات ومعينات التأليف، مثل حل المساعد الظاهري وقالب المؤسسة و خدمة QnA Maker، للبناء على الأنماط الشائعة واستخدام مصادر المعرفة الحالية.

بنية مرجعية لإنشاء مساعد صوت باستخدام Speech SDK

Conceptual diagram of the voice assistant orchestration service flow.

الميزات الأساسية

سواء اخترت Direct Line Speech أو حل آخر لإنشاء تفاعلات مساعدك، يمكنك استخدام مجموعة غنية من ميزات التخصيص لتخصيص مساعدك للعلامة التجارية والمنتج والشخصية.

Category الميزات
كلمة أساسية مخصصة يمكن للمستخدمين بدء محادثات مع المساعدين باستخدام كلمة أساسية مخصصة مثل "Hey Contoso". يقوم التطبيق بذلك باستخدام محرك كلمات أساسية مخصص في Speech SDK، والذي يمكنك تكوينه بالانتقال إلى بدء استخدام الكلمات الأساسية المخصصة. يمكن لمساعدين الصوت استخدام التحقق من الكلمة الأساسية من جانب الخدمة لتحسين دقة تنشيط الكلمة الأساسية (مقابل استخدام الجهاز وحده).
تحويل الكلام إلى نص يقوم المساعدون الصوتيون بتحويل الصوت في الوقت الحقيقي إلى نص معترف به باستخدام الكلام إلى نص من خدمة الكلام. يتوفر هذا النص، كما تم نسخه، إلى كل من تنفيذ المساعد وتطبيق العميل الخاص بك.
تحويل النص إلى كلام يتم تجميع الاستجابات النصية من مساعدك من خلال النص إلى الكلام من خدمة الكلام. من ثم يتم توفير هذا التركيب لتطبيق العميل الخاص بك كتدفق صوتي. توفر Microsoft القدرة على إنشاء صوت مخصص وعالي الجودة لصوت Neural Text to speech (Neural TTS) الذي يعطي صوتا للعلامة التجارية الخاصة بك.

بدء استخدام مساعدين الصوت

نقدم مقالة التشغيل السريع التالية المصممة لجعلك تقوم بتشغيل التعليمات البرمجية في أقل من 10 دقائق: التشغيل السريع: إنشاء مساعد صوتي مخصص باستخدام Direct Line Speech

نموذج التعليمات البرمجية والبرامج التعليمية

يتوفر نموذج التعليمات البرمجية لإنشاء مساعد صوت على GitHub. تغطي العينات تطبيق العميل للاتصال بمساعدك بالعديد من لغات البرمجة الشائعة.

التخصيص

يمكن لمساعدين الصوت الذين تقوم بإنشائهم باستخدام خدمة الكلام استخدام مجموعة كاملة من خيارات التخصيص.

إشعار

تختلف خيارات التخصيص حسب اللغة واللهجة المحلية. لمعرفة المزيد، راجع اللغات المدعومة.

الخطوات التالية