ما هي درجة بلو؟

BLEU (تقييم ثنائي اللغة قيد الدراسة) هو قياس للاختلافات بين الترجمة الآلية وواحدة أو أكثر من الترجمات المرجعية التي أنشأها الإنسان لنفس الجملة المصدر.

عملية تسجيل النقاط

تقارن خوارزمية BLEU العبارات المتتالية للترجمة الآلية مع العبارات المتتالية التي تجدها في الترجمة المرجعية ، وتحسب عدد التطابقات ، بطريقة مرجحة. هذه المباريات مستقلة عن الموقف. تشير درجة المطابقة الأعلى إلى درجة أعلى من التشابه مع الترجمة المرجعية ، ودرجة أعلى. لا تؤخذ في الاعتبار الوضوح والصواب النحوي.

كيف يعمل بلو؟

تكمن قوة BLEU في أنها ترتبط بشكل جيد بالحكم البشري من خلال حساب متوسط أخطاء الحكم الفردي على مجموعة اختبار ، بدلا من محاولة ابتكار الحكم البشري الدقيق لكل جملة.

مناقشة أكثر شمولا لدرجات BLEU هنا.

تعتمد نتائج BLEU بشدة على اتساع نطاقك واتساق بيانات الاختبار مع بيانات التدريب والضبط ومقدار البيانات المتوفرة لديك للتدريب. إذا تم تدريب نماذجك على نطاق ضيق، وكانت بيانات التدريب الخاصة بك متسقة مع بيانات الاختبار الخاصة بك، فيمكنك توقع الحصول على درجة BLEU عالية.

ملاحظة

لا يمكن تبرير المقارنة بين درجات BLEU إلا عندما تتم مقارنة نتائج BLEU بنفس مجموعة الاختبار ونفس زوج اللغات ونفس محرك MT. لا بد أن تكون درجة BLEU من مجموعة اختبار مختلفة مختلفة.