ماذا يُقصد بترجمة المستندات؟

ترجمة المستندات هي ميزة ترجمة آلية مستندة إلى السحابة لخدمة Azure الذكاء الاصطناعي المترجم. يمكنك ترجمة مستندات متعددة ومعقدة عبر جميع اللغات واللهجات المدعومة مع الحفاظ على بنية المستند الأصلي وتنسيق البيانات. تدعم واجهة برمجة تطبيقات ترجمة المستندات عمليتين للترجمة:

  • تدعم ترجمة مستندات الدفعات غير المتزامنة المعالجة غير المتزامنة لمستندات متعددة وملفات كبيرة. تتطلب عملية الترجمة الدفعية حساب تخزين Azure Blob مع حاويات للمستندات المصدر والمترجمة.

  • تدعم ترجمة المستندات المتزامنة المعالجة المتزامنة لترجمات الملفات الفردية. لا تتطلب عملية ترجمة الملفات حساب تخزين Azure Blob. تحتوي الاستجابة النهائية على المستند المترجم ويتم إرجاعها مباشرة إلى العميل المتصل.

ترجمة دفعية غير متزامنة

استخدم معالجة المستندات غير المتزامنة لترجمة مستندات متعددة وملفات كبيرة.

ميزات مفتاح الدفعة

ميزة ‏‏الوصف
ترجمة الملفات الكبيرة ترجمة المستندات بالكامل بشكل غير متزامن.
ترجمة العديد من الملفات ترجمة ملفات متعددة عبر جميع اللغات واللهجات المعتمدة مع الحفاظ على بنية الوثيقة وتنسيق البيانات.
الاحتفاظ بالعرض التقديمي للملف المصدر ترجمة الملفات مع الحفاظ على التخطيط الأصلي والتنسيق.
تطبيق الترجمة المخصصة ترجمة المستندات باستخدام نماذج الترجمة العامة والمخصصة.
تطبيق المسردات المخصصة ترجمة المستندات باستخدام مسردات مخصصة.
الكشف عن لغة المستند تلقائيًا دع خدمة ترجمة المستندات تحدد لغة المستند.
ترجمة المستندات ذات المحتوى بلغات متعددة استخدم ميزة "الاحتواء التلقائي" لترجمة المستندات ذات المحتوى بلغات متعددة إلى اللغة المستهدفة.

خيارات تطوير الدفعات

يمكنك إضافة ترجمة المستند إلى التطبيقات باستخدام REST API أو SDK مكتبة العميل:

  • استخدام REST API. هي واجهة حيادية للغة تتيح لك إنشاء طلبات HTTP ورؤوس التفويض لترجمة المستندات.

  • SDKs مكتبة العميل هي فئات خاصة باللغة والكائنات والأساليب والتعليمات البرمجية التي يمكنك استخدامها بسرعة عن طريق إضافة مرجع في مشروعك. حاليا ترجمة الوثائق لديها دعم لغة البرمجة لC #/.NETوPython.

تنسيقات المستندات المدعومة من Batch

يقوم أسلوب الحصول على تنسيقات المستندات المدعومة بإرجاع قائمة بتنسيقات المستندات المعتمدة من قبل خدمة ترجمة المستندات. تتضمن القائمة امتداد الملف الشائع ونوع المحتوى في حالة استخدام واجهة برمجة تطبيقات التحميل.

نوع الملف امتداد الملف ‏‏الوصف
Adobe PDF pdf تنسيق ملف مستند قابل للنقل. يستخدم المترجم المستند تقنية التعرف البصري على الحروف (OCR) لاستخراج النص وترجمته في مستند PDF الممسوح ضوئياً مع الاحتفاظ بالتخطيط الأصلي.
‏‏قيم مفصولة بفواصل csv ملف بيانات خام محدد بفاصلة تستخدمه برامج جداول البيانات.
HTML html, htm لغة ترميز النصوص التشعبية.
تنسيق ملف تبادل التعريب xlf تنسيق مستند متوازٍ، تصدير أنظمة ذاكرة الترجمة. يتم تعريف اللغات المستخدمة داخل الملف.
Markdown markdown، ، mkdnmdown، md، mkd، mdwn، mdtxt، ، mdtext،rmd لغة ترميز خفيفة لإنشاء نص منسق.
Mhtml mthml, mht تنسيق أرشيف صفحة ويب يستخدم للجمع بين تعليمات HTML البرمجية والموارد المصاحبة لها.
Microsoft Excel xls, xlsx ملف جدول بيانات لتحليل البيانات والوثائق.
Microsoft Outlook msg رسالة بريد إلكتروني تم إنشاؤها أو حفظها داخل Microsoft Outlook.
Microsoft PowerPoint (.pptx) ppt, pptx ملف عرض تقديمي يستخدم لعرض المحتوى بتنسيق عرض شرائح.
Microsoft Word doc, docx ملف مستند نصي.
نص OpenDocument odt ملف مستند نصي مفتوح المصدر.
عرض تقديمي OpenDocument odp ملف عرض تقديمي مفتوح المصدر.
جدول بيانات OpenDocument ods ملف جدول بيانات مفتوح المصدر.
تنسيق النص المنسق rtf مستند نصي يحتوي على تنسيق.
القيم مفصولة بعلامات تبويب/علامة تبويب tsv/tab ملف بيانات بسيطة محدد بعلامات التبويب تستخدمه برامج جداول البيانات.
النص txt مستند نصي غير منسق.

أنواع الملفات القديمة للدفعة

يتم الاحتفاظ لأنواع الملفات المصدر أثناء ترجمة المستند مع الاستثناءات التالية:

ملحق الملف المصدر ملحق الملف المترجم
.doc و.odt و.rtf .docx
.xls و.ods xlsx.
.ppt و.odp pptx.

تنسيقات مسرد المصطلحات المدعومة من Batch

تدعم Document Translation أنواع ملفات المسرد التالية:

نوع الملف امتداد الملف ‏‏الوصف
‏‏قيم مفصولة بفواصل csv ملف بيانات خام محدد بفاصلة تستخدمه برامج جداول البيانات.
تنسيق ملف تبادل التعريب xlf , xliff تنسيق مستند متوازٍ، تصدير أنظمة ذاكرة الترجمة يتم تعريف اللغات المستخدمة داخل الملف.
القيم مفصولة بعلامات تبويب/علامة تبويب tsv, tab ملف بيانات بسيطة محدد بعلامات التبويب تستخدمه برامج جداول البيانات.

الترجمة المتزامنة

استخدم معالجة الترجمة المتزامنة لإرسال مستند كجزء من نص طلب HTTP وتلقي المستند المترجم في استجابة HTTP.

ميزات مفتاح الترجمة المتزامنة

ميزة ‏‏الوصف
ترجمة ملفات من صفحة واحدة يقبل الطلب المتزامن مستندا واحدا فقط كمدخل.
الاحتفاظ بالعرض التقديمي للملف المصدر ترجمة الملفات مع الحفاظ على التخطيط الأصلي والتنسيق.
تطبيق الترجمة المخصصة ترجمة المستندات باستخدام نماذج الترجمة العامة والمخصصة.
تطبيق المسردات المخصصة ترجمة المستندات باستخدام مسردات مخصصة.
ترجمة لغة واحدة الترجمة من وإلى لغة واحدة مدعومة.
الكشف عن لغة المستند تلقائيًا دع خدمة ترجمة المستندات تحدد لغة المستند.
تطبيق المسردات المخصصة ترجمة مستند باستخدام مسرد مخصص.

تنسيقات المستندات المدعومة بشكل متزامن

نوع الملف امتداد الملف نوع المحتوى ‏‏الوصف
نص عادي .txt text/plain مستند نصي غير منسق.
قيم مفصولة بعلامات الجدولة .txv
.tab
text/tab-separated-values تنسيق ملف نصي يستخدم علامات التبويب لفصل القيم والخطوط الجديدة لفصل السجلات.
قيم مفصولة بفواصل .csv text/csv تنسيق ملف نصي يستخدم الفواصل كمحدد بين القيم.
لغة تمييز النص التشعبي .html
.htm
text/html HTML هي لغة ترميز قياسية تستخدم لهيكلة صفحات الويب والمحتوى.
Mhtml .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
تنسيق ملف أرشيف صفحة ويب.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation تنسيق ملف مستند إلى XML يستخدم في عروض PowerPoint التقديمية لعرض الشرائح.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet تنسيق ملف مستند إلى XML يستخدم في جداول بيانات Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document تنسيق ملف مستند إلى XML يستخدم لمستندات Word.
Microsoft Outlook .msg application/vnd.ms-outlook تنسيق ملف يستخدم لكائنات رسائل بريد Outlook المخزنة.
تبادل ترجمة Xml .xlf
.xliff
application/xliff+xml تنسيق ملف قياسي يستند إلى XML يستخدم على نطاق واسع في معالجة برامج الترجمة والترجمة.

تنسيقات المسرد المعتمدة المتزامنة

تدعم Document Translation أنواع ملفات المسرد التالية:

نوع الملف امتداد الملف ‏‏الوصف
قيم مفصولة بفواصل csv ملف بيانات خام محدد بفاصلة تستخدمه برامج جداول البيانات.
XmlLocalizationInterchange xlf , xliff تنسيق يستند إلى XML مصمم لتوحيد كيفية تمرير البيانات أثناء عملية الترجمة.
قيم الجدولة tsv, tab ملف بيانات بسيطة محدد بعلامات التبويب تستخدمه برامج جداول البيانات.

حدود طلب ترجمة المستندات

للحصول على معلومات مفصلة حول حدود طلب خدمة Azure الذكاء الاصطناعي المترجم، راجعحدود طلب ترجمة المستندات.

موقع بيانات ترجمة المستندات

يعتمد موقع بيانات ترجمة المستندات على منطقة Azure حيث تم إنشاء مورد المترجم الخاص بك:

✔️ الميزة: نقطة نهاية خدمة ترجمة ✔️
المستندات: مخصص: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

المنطقة التي تم إنشاؤها بواسطة المورد طلب مركز بيانات المعالجة
العالميه أقرب مركز بيانات متوفر.
الامريكتين شرق الولايات المتحدة 2 • غرب الولايات المتحدة 2
منطقة آسيا المطلة على المحيط الهادئ شرق اليابان • جنوب شرق آسيا
أوروبا (باستثناء سويسرا) فرنسا الوسطى • غرب أوروبا
سويسرا شمال سويسرا • غرب سويسرا

الخطوات التالية

في التشغيل السريع، ستتعلم كيفية البدء بسرعة في استخدام ترجمة المستندات. للبدء، تحتاج إلى حساب Azure نشط. إذا لم يكن لديك حساب، يمكنك إنشاء حساب مجاني.