فحص بيانات أدوات تخصيص الكلام
يتيح لك "الكلام المخصص" فحص جودة التعرف على نموذج ما في "استوديو الكلام" بصريا. يمكنك تشغيل الصوت الذي تم تحميله وتحديد ما إذا كانت نتيجة التعرف المقدمة صحيحة. تساعدك هذه الأداة على فحص جودة نموذج تحويل الكلام إلى نص الأساسي من Microsoft، أو فحص نموذج مخصص مدرب، أو مقارنة النسخ بواسطة نموذجين.
توضح هذه المقالة كيفية فحص جودة نموذج تحويل الكلام إلى نص الأساسي من Microsoft أو النماذج المخصصة التي قمت بتدريبها بشكل مرئي. سترى أيضا كيفية استخدام محرر النسخ عبر الإنترنت لإنشاء مجموعات بيانات صوتية مصنفة وتحسينها.
المتطلبات الأساسية
لقد قرأت إعداد بيانات الاختبار للكلام المخصص وقمت بتحميل مجموعة بيانات للفحص.
إنشاء اختبار
اتبع هذه الإرشادات لإنشاء اختبار:
سجل الدخول إلى استوديو الكلام.
انتقل إلى Speech StudioCustom>Speech وحدد اسم مشروعك من القائمة.
حدد نماذج>الاختبارإنشاء اختبار جديد.
حدد فحص الجودة (بيانات الصوت فقط)>التالي.
اختر مجموعة بيانات صوتية تريد استخدامها للاختبار، ثم حدد التالي.
اختر نموذجا أو نموذجين لتقييم الدقة ومقارنتها.
أدخل اسم الاختبار ووصفه، ثم حدد التالي.
راجع إعداداتك، ثم حدد حفظ وإغلاق.
بعد إنشاء اختبار بنجاح، يمكنك معرفة كيفية نسخ نموذج لمجموعة البيانات الصوتية التي حددتها، أو مقارنة النتائج من نموذجين جنبا إلى جنب.
ملاحظة
عند الاختبار ، سيقوم النظام بإجراء نسخ. من المهم أن نضع ذلك في اعتبارنا ، حيث تختلف الأسعار حسب عرض الخدمة ومستوى الاشتراك. ارجع دائما إلى أسعار Azure Cognitive Services الرسمية - خدمة الكلام للحصول على أحدث التفاصيل.
مقارنات النماذج جنبا إلى جنب
عند نجاح حالة الاختبار، حدد اسم عنصر الاختبار للاطلاع على تفاصيل الاختبار. تسرد صفحة التفاصيل هذه جميع الألفاظ في مجموعة البيانات الخاصة بك، وتعرض نتائج التعرف على النموذجين اللذين تقوم بمقارنتهما.
للمساعدة في فحص المقارنة جنبا إلى جنب، يمكنك تبديل أنواع الأخطاء المختلفة بما في ذلك الإدراج والحذف والاستبدال. من خلال الاستماع إلى الصوت ومقارنة نتائج التعرف في كل عمود (تظهر النسخ المسمى بشريا ونتائج نموذجين لتحويل الكلام إلى نص) ، يمكنك تحديد النموذج الذي يلبي احتياجاتك وأين هناك حاجة إلى تحسينات.
يعد اختبار النموذج جنبا إلى جنب مفيدا للتحقق من صحة نموذج التعرف على الكلام الأفضل للتطبيق. للحصول على مقياس موضوعي للدقة، يتطلب صوتا منسوخفا، اتبع الإرشادات الموجودة في تقييم الدقة.
محرر النسخ عبر الإنترنت
يتيح لك محرر النسخ عبر الإنترنت العمل بسهولة مع النسخ الصوتية في Custom Speech. حالات الاستخدام الرئيسية للمحرر هي كما يلي:
- لديك بيانات صوتية فقط ، ولكنك تريد إنشاء مجموعات بيانات صوتية دقيقة + تصنيف بشري من الصفر لاستخدامها في تدريب النماذج.
- لديك بالفعل مجموعات بيانات صوتية + مصنفة من قبل الإنسان، ولكن هناك أخطاء أو عيوب في النسخ. يسمح لك المحرر بتعديل النسخ بسرعة للحصول على أفضل دقة تدريبية.
الشرط الوحيد لاستخدام محرر النسخ هو تحميل البيانات الصوتية (إما الصوت فقط ، أو الصوت + النسخ).
استيراد مجموعات البيانات إلى المحرر
لاستيراد البيانات إلى المحرر، انتقل أولا إلى محرر مجموعات > بيانات الكلام > المخصص [مشروعك] >
بعد ذلك، اتبع الخطوات التالية لاستيراد البيانات.
- حدد استيراد البيانات
- إنشاء مجموعة (مجموعات) بيانات جديدة وإعطائها وصفا
- حدد مجموعات البيانات. يمكنك تحديد بيانات الصوت فقط، أو الصوت + البيانات المصنفة على أنه بشري، أو كليهما.
- بالنسبة للبيانات الصوتية فقط، يمكنك استخدام الطرز الافتراضية لإنشاء نسخ آلي تلقائيا بعد الاستيراد إلى المحرر.
- تحديد استيراد
بعد استيراد البيانات بنجاح، يمكنك تحديد مجموعات البيانات وبدء التحرير.
تلميح
يمكنك أيضا استيراد مجموعات البيانات إلى المحرر مباشرة عن طريق تحديد مجموعات البيانات وتحديد تصدير إلى المحرر
تحرير النسخ من خلال الاستماع إلى الصوت
بعد نجاح تحميل البيانات، حدد اسم كل عنصر للاطلاع على تفاصيل البيانات. يمكنك أيضا استخدام السابقوالتالي للتنقل بين كل ملف.
تسرد صفحة التفاصيل جميع المقاطع في كل ملف صوتي ، ويمكنك تحديد النطق المطلوب. لكل نطق ، يمكنك تشغيل الصوت وفحص النصوص ، وتحرير النسخ إذا وجدت أي أخطاء في الإدراج أو الحذف أو الاستبدال. راجع كيفية تقييم البيانات للحصول على مزيد من التفاصيل حول أنواع الأخطاء.
بعد إجراء التعديلات، حدد حفظ.
تصدير مجموعات البيانات من المحرر
لتصدير مجموعات البيانات مرة أخرى إلى علامة التبويب بيانات، انتقل إلى صفحة تفاصيل البيانات وحدد تصدير لتصدير جميع الملفات كمجموعة بيانات جديدة. يمكنك أيضا تصفية الملفات حسب آخر وقت تم تحريره ، ومدد الصوت ، وما إلى ذلك لتحديد الملفات المطلوبة جزئيا.
سيتم استخدام الملفات المصدرة إلى البيانات كمجموعة بيانات جديدة تماما ولن تؤثر على أي من كيانات البيانات / التدريب / الاختبار الحالية.