ما هي أجهزة الكلام؟

تعمل خدمة الكلام مع مجموعة واسعة من الأجهزة ومصادر الصوت. يمكنك استخدام معالجة الصوت الافتراضية المتوفرة على جهاز. وإلا، فإن حزمة تطوير البرامج (SDK) الخاصة بالكلام لديها خيار لاستخدام خوارزميات معالجة الصوت المتقدمة الخاصة بنا والتي تم تصميمها للعمل بشكل جيد مع خدمة الكلام. يوفر التعرف الدقيق على الكلام في المجال البعيد عن طريق قمع الضوضاء وإلغاء الصدى وتشكيل الحزم والاستبكار.

معالجة الصوت

معالجة الصوت هي تحسينات يتم تطبيقها على دفق الصوت لتحسين جودة الصوت. تتضمن أمثلة التحسينات الشائعة التحكم التلقائي في الكسب (AGC) وقمع الضوضاء وإلغاء الصدى الصوتي (AEC). تدمج حزمة تطوير البرامج (SDK) الخاصة بالكلام مكدس الصوت من Microsoft (MAS)، مما يسمح لأي تطبيق أو منتج باستخدام إمكانات معالجة الصوت الخاصة به على إدخال الصوت.

توصيات صفيف الميكروفونات

تعمل حزمة تطوير البرامج (SDK) للكلام بشكل أفضل مع صفيف الميكروفون الذي تم تصميمه وفقا لإرشاداتنا الموصى بها. لمعرفة التفاصيل، راجع توصيات صفيف الميكروفون.

مجموعات تطوير الأجهزة

تم تصميم Speech SDK للعمل مع مجموعات التطوير المصممة لهذا الغرض، وتكوينات صفيف الميكروفون المختلفة. على سبيل المثال، يمكنك استخدام إحدى مجموعات تطوير Azure هذه.

  • يحتوي Azure Percept DK على معالج صوت تم تكوينه مسبقا ومصفوفة خطية مكونة من أربعة ميكروفونات. يمكنك استخدام الأوامر الصوتية واكتشاف الكلمات الرئيسية وكلام الحقل البعيد بمساعدة Azure Cognitive Services.
  • Azure Kinect DK هي مجموعة مطوري الحوسبة المكانية مع مستشعرات الذكاء الاصطناعي المتقدمة التي توفر رؤية كمبيوتر متطورة ونماذج كلام. كجهاز صغير متعدد الإمكانات مع أوضاع متعددة ، فإنه يحتوي على مستشعر عمق ، ومجموعة ميكروفون مكاني مع كاميرا فيديو ، ومستشعر اتجاه.

الخطوات التالية