بناء مستندات التدريب وإدارتها

يمكنك المترجم المخصص من إنشاء نماذج ترجمة تعكس المصطلحات والأنماط الخاصة بالأعمال والصناعة والمجال. يعد تدريب نموذج مخصص وتوزيعه أمرا سهلا ولا يتطلب أي مهارات برمجة. يسمح لك المترجم المخصص بتحميل ملفات متوازية أو ملفات ذاكرة الترجمة أو ملفات zip.

المستندات المتوازية هي أزواج من المستندات حيث يكون أحدها (الهدف) ترجمة للأخرى (المصدر). يحتوي مستند واحد في الزوج على جمل باللغة المصدر ويحتوي المستند الآخر على تلك الجمل المترجمة إلى اللغة الهدف.

قبل تحميل المستندات، راجع تنسيقات المستندات وإرشادات اصطلاح التسمية للتأكد من أن تنسيق الملف معتمد من قبل المترجم المخصص.

كيفية إنشاء مجموعات المستندات

غالبًا ما يكون العثور على بيانات ذات جودة داخل المجال مهمة صعبة تختلف استنادًا إلى تصنيف المستخدم. فيما يلي بعض الأسئلة التي يمكنك طرحها على نفسك أثناء تقييم البيانات التي قد تكون متاحة لك:

  • غالبًا ما يكون لدى المؤسسات ثروة من بيانات الترجمة التي تراكمت على مدى سنوات عديدة من استخدام الترجمة البشرية. هل لدى شركتك بيانات ترجمة سابقة متوفرة يمكنك استخدامها؟

  • هل لديك كمية هائلة من البيانات أحادية اللغة؟ البيانات أحادية اللغة هي بيانات بلغة واحدة فقط. إذا كان الأمر كذلك، فهل يمكنك الحصول على ترجمات لهذه البيانات؟

  • هل يمكنك تتبع ارتباطات المداخل عبر الإنترنت لجمع الجمل المصدر وتجميع الجمل المستهدفة؟

مواد تدريبية لكل أنواع المستندات

المصدر وظيفته القواعد التي يجب اتباعها
وثائق التدريب ثنائية اللغة يعلم النظام مصطلحاتك وأسلوبك. كن ليبراليا. أي ترجمة بشرية في المجال أفضل من الترجمة الآلية. إضافة المستندات وإزالتها أثناء التنقل ومحاولة تحسين درجة BLEU.
ضبط المستندات تدريب معلمات الترجمة الآلية العصبية. كن صارمًا. قم بإنشائها لتكون ممثلًا على النحو الأمثل لما ستترجمه في المستقبل.
اختبار المستندات حساب درجة BLEU. كن صارمًا. قم بإنشاء مستندات اختبار لتكون ممثلا على النحو الأمثل لما تخطط لترجمته في المستقبل.
قاموس العبارة يفرض الترجمة المحددة 100% من الوقت. كن مقيدًا. يعد قاموس العبارة حساسًا لحالة الأحرف ويتم ترجمة أي كلمة أو عبارة مدرجة بالطريقة التي تحددها. في كثير من الحالات، من الأفضل عدم استخدام قاموس العبارة والسماح للنظام بالتعلم.
قاموس الجملة يفرض الترجمة المحددة 100% من الوقت. كن صارمًا. قاموس الجملة غير حساس لحالة الأحرف وجيد للجمل القصيرة الشائعة في المجال. لكي يحدث تطابق قاموس الجملة، يجب أن تتطابق الجملة المرسلة بالكامل مع إدخال القاموس المصدر. إذا تطابق جزء فقط من الجملة، فلن يتطابق الإدخال.

كيفية تحميل المستندات

ترتبط أنواع المستندات بزوج اللغة المحدد عند إنشاء مشروع.

  1. تسجيل الدخول إلى مدخل المترجم المخصص. يتم تحميل مساحة العمل الافتراضية وعرض قائمة المشاريع التي تم إنشاؤها مسبقًا.

  2. حدد اسم المشروع المطلوب. بشكل افتراضي، يتم تحديد جزء إدارة المستندات ويتم عرض قائمة بالمستندات التي تم تحميلها مسبقًا.

  3. حدد إضافة مجموعة مستندات واختر نوع المستند:

    • مجموعة التدريب
    • مجموعة الاختبارات
    • مجموعة الضبط
    • مجموعة القاموس:
      • قاموس العبارة
      • قاموس الجملة
  4. حدد "Next".

    لقطة شاشة توضح رابط تحميل المستند.

    ملاحظة

    اختيار عمليات تشغيل مجموعة القاموساختر نوع مربع حوار القاموس. اختر واحدًا وحدد التالي

  5. حدد تنسيق المستندات من الأزرار التبادلية.

    لقطة شاشة توضح صفحة تحميل المستند.

    • بالنسبة للمستندات المتوازيةDocument set name، املأ وحدد استعراض الملفات لتحديد المستندات المصدر والهدف.
    • بالنسبة إلى ملف ذاكرة الترجمة (TM) أو تحميل مجموعات متعددة باستخدام ZIP، حدد استعراض الملفات لتحديد الملف
  6. حدد Upload.

في هذه المرحلة، يقوم المترجم المخصص بمعالجة مستنداتك ومحاولة استخراج الجمل كما هو موضح في إعلام التحميل. بمجرد الانتهاء من المعالجة، سترى إعلام التحميل الناجح.

لقطة شاشة توضح نافذة حوار معالجة تحميل المستند.

عرض محفوظات التحميل

في صفحة مساحة العمل، يمكنك عرض محفوظات جميع تفاصيل تحميلات المستندات مثل نوع المستند وزوج اللغة وحالة التحميل وما إلى ذلك.

  1. من صفحة مساحة عمل مدخل المترجم المخصص ، انقر فوق علامة التبويب محفوظات التحميل لعرض المحفوظات.

    لقطة شاشة تعرض علامة تبويب محفوظات التحميل.

  2. تعرض هذه الصفحة حالة جميع عمليات التحميل السابقة. يعرض التحميلات من الأحدث إلى الأقل حداثة. لكل تحميل، يعرض اسم المستند وحالة التحميل وتاريخ التحميل وعدد الملفات التي تم تحميلها ونوع الملف الذي تم تحميله وزوج اللغة للملف وإنشاء بواسطة. يمكنك استخدام عامل التصفية للعثور بسرعة على المستندات حسب الاسم والحالة واللغة ونطاق التاريخ.

    لقطة شاشة تعرض صفحة محفوظات التحميل.

  3. حدد أي سجل تاريخ تحميل. في صفحة تفاصيل محفوظات التحميل، يمكنك عرض الملفات التي تم تحميلها كجزء من التحميل وحالة التحميل للملف ولغة الملف ورسالة الخطأ (إذا كان هناك أي خطأ في التحميل).

الخطوات التالية