ما هو الكلام المخصص؟

باستخدام الكلام المخصص، يمكنك تقييم وتحسين دقة التعرف على الكلام لتطبيقاتك ومنتجاتك. يمكن استخدام نموذج كلام مخصص لتحويل الكلام في الوقت الحقيقي إلى نص وترجمة الكلام والنسخ الدفعي.

يستخدم التعرف على الكلام نموذج اللغة العالمي كنموذج أساسي يتم تدريبه باستخدام البيانات المملوكة ل Microsoft ويعكس اللغة المنطوقة شائعة الاستخدام. يتم تدريب النموذج الأساسي مسبقا مع اللهجات والهاتفية التي تمثل مختلف المجالات الشائعة. عند تقديم طلب التعرف على الكلام، يتم استخدام أحدث نموذج أساسي لكل لغة مدعومة بشكل افتراضي. يعمل النموذج الأساسي بشكل جيد في معظم سيناريوهات التعرف على الكلام.

يمكن استخدام نموذج مخصص لزيادة النموذج الأساسي لتحسين التعرف على المفردات الخاصة بالمجال الخاصة بالتطبيق من خلال توفير بيانات نصية لتدريب النموذج. يمكن استخدامه أيضاً لتحسين التعرف استناداً إلى الظروف الصوتية المحددة للتطبيق من خلال توفير بيانات صوتية مع نسخ مكتوبة مرجعية.

يمكنك أيضا تدريب نموذج مع نص منظم عندما تتبع البيانات نمطا، لتحديد النطق المخصص، وتخصيص تنسيق نص العرض مع تسوية النص المعكوس المخصص وإعادة الكتابة المخصصة وتصفية الألفاظ النابية المخصصة.

كيف تعمل هذه الوظيفة؟

باستخدام الكلام المخصص، يمكنك تحميل بياناتك الخاصة، واختبار نموذج مخصص وتدريبه، ومقارنة الدقة بين النماذج، ونشر نموذج إلى نقطة نهاية مخصصة.

Diagram that highlights the components that make up the custom speech area of the Speech Studio.

فيما يلي مزيد من المعلومات حول تسلسل الخطوات الموضحة في الرسم التخطيطي السابق:

  1. إنشاء مشروع واختيار نموذج. استخدم مورد الكلام الذي تقوم بإنشائه في مدخل Microsoft Azure. إذا قمت بتدريب نموذج مخصص مع بيانات صوتية، فاختر منطقة مورد الكلام مع أجهزة مخصصة لتدريب البيانات الصوتية. لمزيد من المعلومات، راجع الحواشي السفلية في جدول المناطق .
  2. تحميل بيانات الاختبار. تحميل بيانات الاختبار لتقييم عرض الكلام إلى نص للتطبيقات والأدوات والمنتجات.
  3. جودة التعرف على الاختبار. استخدم Speech Studio لتشغيل الصوت الذي تم تحميله مرة أخرى وفحص جودة التعرف على الكلام لبيانات الاختبار الخاصة بك.
  4. نموذج الاختبار كمياً. تقييم وتحسين دقة نموذج الكلام إلى النص. توفر خدمة Speech معدل خطأ كمي للكلمات (WER)، والذي يمكنك استخدامه لتحديد ما إذا كان هناك حاجة إلى المزيد من التدريب.
  5. تدريب نموذج. توفير النسخ المكتوبة والنص ذي الصلة، جنباً إلى جنب مع البيانات الصوتية المقابلة. يُعد اختبار نموذج قبل التدريب وبعده اختيارياً لكن يوصى به.

    إشعار

    تدفع مقابل استخدام نموذج الكلام المخصص واستضافة نقطة النهاية. سيتم أيضا تحصيل رسوم منك مقابل تدريب نموذج الكلام المخصص إذا تم إنشاء النموذج الأساسي في 1 أكتوبر 2023 والإصدارات الأحدث. لا تتم محاسبتك على التدريب إذا تم إنشاء النموذج الأساسي قبل أكتوبر 2023. لمزيد من المعلومات، راجع Azure الذكاء الاصطناعي Speech pricing وقسم Charge for adaptation في دليل الترحيل speech to text 3.2.

  6. نشر نموذج. بمجرد أن تكون راضياً عن نتائج الاختبار، انشر النموذج إلى نقطة نهاية مخصصة. باستثناء النسخ الدفعي، يجب نشر نقطة نهاية مخصصة لاستخدام نموذج كلام مخصص.

    تلميح

    لا يلزم وجود نقطة نهاية نشر مستضافة لاستخدام الكلام المخصص مع واجهة برمجة تطبيقات النسخ الدفعي. يمكنك الحفاظ على الموارد إذا تم استخدام نموذج الكلام المخصص فقط للنسخ الدفعي. لمزيد من المعلومات، راجع أسعار خدمة Speech.

الذكاء الاصطناعي المسؤول

لا يتضمن نظام الذكاء الاصطناعي التكنولوجيا فحسب، بل يشمل أيضا الأشخاص الذين يستخدمونها، والأشخاص المتأثرين بها، والبيئة التي يتم نشرها فيها. اقرأ ملاحظات الشفافية للتعرف على الذكاء الاصطناعي المسؤولة واستخدامها ونشرها في أنظمتك.

الخطوات التالية