تشغيل سريع: البناء والنشر والترجمة باستخدام نماذج مخصصة

Translator هي خدمة ترجمة آلية عصبية مستندة إلى السحابة تعد جزءا من مجموعة خدمات Azure الذكاء الاصطناعي لواجهة برمجة تطبيقات REST التي يمكن استخدامها مع أي نظام تشغيل. يقوم المترجم بصلاحيات العديد من منتجات Microsoft وخدماتها التي تستخدمها آلاف الشركات في جميع أنحاء العالم لإجراء ترجمة اللغة والعمليات الأخرى المتعلقة باللغة. في هذا التشغيل السريع، تعلم كيفية إنشاء حلول مخصصة لتطبيقاتك عبر جميع اللغات المدعومة.

المتطلبات الأساسية

لاستخدام مدخل المترجم المخصص ، تحتاج إلى الموارد التالية:

  • حساب Microsoft.

  • اشتراك Azure - إنشاء اشتراك مجاني

  • بمجرد أن يكون لديك اشتراك Azure، قم بإنشاء مورد «المترجم» في مدخل Azure للحصول على المفتاح ونقطة النهاية. وبعد توزيعه، حدد انتقل إلى المورد.

    • أنت بحاجة إلى المفتاح ونقطة النهاية من المورد لتوصيل تطبيقك بخدمة المترجم. الصق المفتاح ونقطة النهاية في التعليمات البرمجية لاحقا في التشغيل السريع. يمكنك العثور على هذه القيم على صفحة Keys and Endpoint

      لقطة شاشة: مفاتيح مدخل Azure وصفحة نقطة النهاية.

لمزيد من المعلومات، راجعكيفية إنشاء مورد Translator.

مدخل المترجم مخصص

بمجرد أن يكون لديك المتطلبات الأساسية المذكورة أعلاه، سجل الدخول إلى مدخل المترجم المخصص لإنشاء مساحات عمل، وبناء المشاريع، وتحميل الملفات، وتدريب النماذج، ونشر الحل المخصص الخاص بك.

يمكنك قراءة نظرة عامة على الترجمة والترجمة المخصصة، وتعلم بعض النصائح، ومشاهدة فيديو البدء في مدونة Azure الذكاء الاصطناعي التقنية.

موجز المعالجة

  1. إنشاء مساحة عمل. مساحة العمل تعني منطقة عمل لتأليف وبناء نظام الترجمة المخصص الخاص بك. يمكن أن تحتوي مساحة العمل على العديد من المشاريع والنماذج والوثائق. كل العمل الذي تقوم به في المترجم المخصص يتم داخل مساحة عمل محددة.

  2. إنشاء مشروع . المشروع عبارة عن برنامج تضمين للنماذج والوثائق والاختبارات. يتضمن كل مشروع جميع المستندات التي يتم تحميلها في مساحة العمل هذه مع زوج اللغة الصحيح. على سبيل المثال، إذا كان لديك مشروع من الإنجليزية إلى الإسبانية ومشروع من الإسبانية إلى الإنجليزية، يتم تضمين نفس المستندات في كلا المشروعين.

  3. تحميل الوثائق الموازية. الوثائق الموازية هي أزواج من الوثائق إذ يكون (الهدف) هو ترجمة الآخر (المصدر). تحتوي إحدى الوثائق في الزوج على جمل بلغة المصدر والوثيقة الأخرى تحتوي على جمل مترجمة إلى اللغة المستهدفة. لا يهم اللغة التي تم تمييزها على أنها «مصدر» واللغة التي تم تمييزها على أنها «هدف»—يمكن استخدام مستند موازٍ لتدريب نظام الترجمة في أي من الاتجاهين.

  4. درب نموذجك. النموذج يعني النظام الذي يوفر الترجمة لثنائي لغة معين. نتيجة التدريب الناجح هي نموذج. عندما تقوم بتدريب نموذج، هناك حاجة إلى ثلاثة أنواع مستندات متعارضة: التدريب والضبط والاختبار. إذا تم توفير بيانات التدريب فقط عند وضع التدريب في قائمة الانتظار، يقوم المترجم المخصص تلقائيا بتجميع بيانات الضبط والاختبار. يستخدم مجموعة فرعية عشوائية من الجمل من مستندات التدريب الخاصة بك، ويستبعد هذه الجمل من بيانات التدريب نفسها. تعد الـ 10000 جملة متوازية الحد الأدنى من المتطلبات لتدريب النموذج.

  5. اختبار (تقييم الإنسان) نموذجك. تُستخدم مجموعة الاختبار لحساب درجة BLEU . تُشير هذه النتيجة إلى جودة نظام الترجمة الخاص بك.

  6. انشر (وزع) نموذجك المدرب . نموذجك المخصص متاح لطلبات الترجمة وقت التشغيل.

  7. ترجمة النص. استخدم المترجم من Microsoft القائم على السحابة والآمن وصاحب الأداء العالي والقابل للتطوير بدرجة عالية بواجهة برمجة التطبيقات النص إصدار 3 لتقديم طلبات الترجمة.

إنشاء مساحة عمل

  1. بعد تسجيل الدخول إلى المترجم المخصص، سيُطلب منك الإذن بقراءة ملفك الشخصي من منصة هوية Microsoft لطلب رمز وصول المستخدم الخاص بك وتحديثه. كلا الرمزين مطلوبان للمصادقة وللتأكد من عدم تسجيل خروجك أثناء جلستك الحية أو أثناء تدريب عارضاتك.
    ثم حدد نعم.

    لقطة شاشة توضح كيفية إنشاء مساحة عمل.

  2. حدد مساحات العمل الخاصة بي.

  3. حدد "Create a new workspace".

  4. اكتب نماذج Contoso MTلاسم مساحة العمل وحدد التالي.

  5. حدد «Global» في حدد منطقة الموارد من القائمة المنسدلة.

  6. نسخ/لصق مفتاح خدمات المترجم الخاص بك.

  7. حدد "Next".

  8. حدد ⁧⁩Done⁧⁩.

    ملاحظة

    ويجب أن تتناسب المنطقة مع المنطقة التي تم اختيارها أثناء إنشاء الموارد. يمكنك استخدام KEY 1 أو KEY 2.

    لقطة شاشة توضح مفتاح المورد.

    لقطة شاشة توضح إنشاء مساحة العمل.

قم بإنشاء مشروع

بمجرد إنشاء مساحة العمل بنجاح، يتم نقلك إلى صفحة المشاريع .

يمكنك إنشاء مشروع من الإنجليزية إلى الألمانية لتدريب نموذج مخصص بنوع مستند تدريب فقط.

  1. حدد ⁧⁩Create project⁧⁩.

  2. اكتب من الإنجليزية إلى الألمانية لـ اسم المشروع .

  3. اختر الإنجليزية كـ لغة مصدر من القائمة المنسدلة.

  4. اختر الألمانية على أنها لغة الهدف من القائمة المنسدلة.

  5. حدد عام لـ المجال من القائمة المنسدلة.

  6. حدد ⁧⁩«إنشاء مشروع»⁧⁩.

    لقطة شاشة توضح كيفية إنشاء مشروع.

تحميل المستندات

من أجل إنشاء نموذج مخصص، تحتاج إلى تحميل كل أنواع مستندات التدريب ، و الضبط ، و الاختبار ، و القاموس أو مجموعة منها.

في هذا التشغيل السريع، ستقوم بتحميل مستندات التدريب للتخصيص.

ملاحظة

يمكنك استخدام مجموعة بيانات قواميس العبارات والجمل الخاصة بنا، عينة العملاء من مجموعات البيانات الإنجليزية إلى الألمانية ، لهذه البداية السريعة. ومع ذلك، بالنسبة للإنتاج، من الأفضل تحميل مجموعة بيانات التدريب الخاصة بك.

  1. اختر اسم المشروع من الإنجليزية إلى الألمانية .

  2. حدد إدارة المستندات من قائمة التنقل اليسرى.

  3. حدد أضف مجموعة المستندات .

  4. تحقق من مربع مجموعة التدريب واختر التالي .

  5. احتفظ بـ مستندات متوازية مدققة واكتب عينة إنجليزية-ألمانية .

  6. ضمن ملف المصدر (إنجليزي - إنجليزي) ، حدد تصفح الملفات وحدد sample-English-German-Training-en.txt .

  7. ضمن ملف اللغة الهدف (الألمانية - الإنجليزية) ، حدد تصفح الملفات واختر sample-English-German-Training-de.txt.

  8. حدد Upload

    ملاحظة

    يمكنك تحميل مجموعة بيانات عبارة العينة وقواميس الجمل. هذه الخطوة متروكة لك لتكملها.

    لقطة شاشة توضح كيفية تحميل المستندات.

درّب نموذجك

الآن أنت مستعد لتدريب نموذج الإنجليزية إلى الألمانية.

  1. حدد نموذج التدريب من قائمة التنقل اليسرى.

  2. اكتب en-de باستخدام بيانات العينة لـ اسم النموذج .

  3. تحقق من التدريب الكامل.

  4. ضمن حدد المستندات ، تحقق من عينة-إنجليزية-ألمانية واستعرض تكلفة التدريب المرتبطة بالعدد المختار من الجمل.

  5. حدد تدريب الآن.

  6. حدد تدريب للتأكيد.

    ملاحظة

    الإعلامات تعرض نموذج التدريب الجاري، على سبيل المثال، حالة تقديم البيانات . يستغرق نموذج التدريب بضع ساعات، رهنًا بعدد الجمل المختارة.

    للقطة شاشة توضح كيفية إنشاء نموذج.

  7. بعد تدريب النموذج الناجح، حدد تفاصيل النموذج من قائمة التنقل اليسرى.

  8. حدد اسم النموذج en-de مع بيانات العينة. راجع تاريخ/وقت التدريب، وإجمالي وقت التدريب، وعدد الجمل المستخدمة للتدريب، والضبط، والاختبار، والقاموس. تحقق مما إذا كان النظام قد أنشأ مجموعات الاختبار والضبط. يمكنك استخدام Category ID لتقديم طلبات الترجمة.

  9. قم بتقييم نموذج بدرجة BLEU . درجة BLEU لمجموعة الاختبار هي درجة النموذج المخصصة و Baseline BLEU هو نموذج الأساس المدرب مسبقا المستخدم للتخصيص. تعني درجة BLEU أعلى أن جودة الترجمة أعلى باستخدام النموذج المخصص.

    ملاحظة

    إذا قمت بالتدريب باستخدام مجموعات بيانات عينات العملاء المشتركة، فستكون درجة BLEU مختلفة عن الصورة.

    لقطة شاشة توضح تفاصيل النموذج.

اختبار النموذج الخاص بك

بمجرد الانتهاء من تدريبك بنجاح، تفقد مجموعة الاختبار الجمل المترجمة.

  1. حدد نموذج الاختبار من قائمة التنقل اليسرى.
  2. اختر "en-de with sample data"
  3. تقييم الإنسان للترجمة من نموذج جديد (نموذج مخصص)، ونموذج الأساس (خط الأساس المدرب مسبقا المستخدم للتخصيص) مقابل المرجع (الترجمة الهدف من مجموعة الاختبار)

نشر النموذج

إن نشر نموذجك يجعله متاحًا للاستخدام مع واجهة برمجة تطبيقات المترجم. قد يكون للمشروع نموذج واحد أو العديد من النماذج المدربة بنجاح. يمكنك فقط نشر نموذج واحد لكل مشروع؛ ومع ذلك، يمكنك نشر نموذج في منطقة واحدة أو عدة مناطق اعتمادًا على احتياجاتك. لمزيد من المعلومات، انظر تسعير المترجم .

  1. حدد نشر النموذج من قائمة التنقل اليسرى.

  2. حدد en-de مع بيانات العينة واختر نشر.

  3. قم بالتحقق من المنطقة (المناطق) المطلوبة.

  4. حدد نشر. يجب أن ينتقل الوضع من يتم التوزيع إلى تم التوزيع.

    لقطة شاشة توضح كيفية نشر نموذج مدرب.

ترجمة النص

  1. يجب على المطورين استخدام Category ID عند تقديم طلبات الترجمة باستخدام واجهة برمجة التطبيقات النص إصدار 3 لدى المترجم من Microsoft. يمكن العثور على مزيد من المعلومات حول واجهة برمجة تطبيقات Translator Text على صفحة الويب مرجع واجهة برمجة التطبيقات.

  2. قد يرغب مستخدمو الأعمال في تنزيل وتثبيت تطبيق DocumentTranslator المجاني الخاص بنا لـ Windows .

الخطوات التالية