تحديد المحتوى متعدد اللغات وتدوينه تلقائيا
يدعم Azure Video Indexer (المعروف سابقا ب Azure Video Analyzer for Media) التعرف التلقائي على اللغة وكتابتها في المحتوى متعدد اللغات. تتضمن هذه العملية تحديد اللغة المنطوقة تلقائيا في مقاطع مختلفة من الصوت، وإرسال كل مقطع من ملف الوسائط ليتم نسخه ودمج النسخ مرة أخرى إلى نسخة واحدة موحدة.
اختيار تعريف متعدد اللغات على الفهرسة باستخدام المدخل
يمكنك اختيار الكشف متعدد اللغات عند تحميل الفيديو وفهرسته. بدلا من ذلك، يمكنك اختيار الكشف متعدد اللغات عند إعادة فهرسة الفيديو. تصف الخطوات التالية كيفية إعادة التنشيط:
استعرض للوصول إلى موقع Azure Video Indexer على الويب وسجل الدخول.
انتقل إلى صفحة المكتبة وقم بالمرور فوق اسم الفيديو الذي تريد إعادة نسخه.
في الزاوية اليمنى السفلية، انقر فوق زر إعادة فهرسة الفيديو .
في مربع الحوار إعادة فهرسة الفيديو ، اختر الكشف متعدد اللغات من مربع القائمة المنسدلة لغة مصدر الفيديو .
- عند فهرسة مقطع فيديو على أنه متعدد اللغات، ستتضمن صفحة نتيجة التحليلات هذا الخيار، وسيظهر نوع نتيجة تحليلات إضافي، ما يمكن المستخدم من عرض المقطع الذي يتم نسخه باللغة "اللغة المنطوقة".
- الترجمة إلى جميع اللغات متاحة بالكامل من النسخة متعددة اللغات.
- ستظهر جميع الرؤى الأخرى باللغة الرئيسية التي تم اكتشافها - وهي اللغة التي ظهرت أكثر في الصوت.
- تتوفر التسمية التوضيحية المغلقة على اللاعب بلغات متعددة أيضا.

اختيار تعريف متعدد اللغات على الفهرسة باستخدام واجهة برمجة التطبيقات
عند فهرسة فيديو أو إعادة فهرسته باستخدام واجهة برمجة التطبيقات، اختر multi-language detection الخيار في المعلمة sourceLanguage .
إخراج النموذج
سيقوم النموذج باسترداد جميع اللغات التي تم الكشف عنها في الفيديو في قائمة واحدة
"sourceLanguage": null,
"sourceLanguages": [
"es-ES",
"en-US"
],
بالإضافة إلى ذلك، سيتضمن كل مثيل في قسم النسخ اللغة التي تم نسخها بها
{
"id": 136,
"text": "I remember well when my youth Minister took me to hear Doctor King I was a teenager.",
"confidence": 0.9343,
"speakerId": 1,
"language": "en-US",
"instances": [
{
"adjustedStart": "0:21:10.42",
"adjustedEnd": "0:21:17.48",
"start": "0:21:10.42",
"end": "0:21:17.48"
}
]
},
المبادئ الإرشادية والقيود
- مجموعة من اللغات المدعومة: الإنجليزية والفرنسية والألمانية والإسبانية.
- دعم المحتوى متعدد اللغات مع ما يصل إلى ثلاث لغات مدعومة.
- إذا كان الصوت يحتوي على لغات أخرى غير القائمة المعتمدة أعلاه، فإن النتيجة غير متوقعة.
- الحد الأدنى لطول المقطع للكشف عن كل لغة - 15 ثانية.
- إزاحة الكشف عن اللغة هي 3 ثوان في المتوسط.
- ومن المتوقع أن يكون الكلام مستمرا. قد تؤثر التناوبات المتكررة بين اللغات على أداء النماذج.
- قد يؤثر كلام المتحدثين غير الأصليين على أداء النموذج (على سبيل المثال، عندما يستخدم المتحدثون لغتهم الأصلية ويتحولون إلى لغة أخرى).
- تم تصميم النموذج للتعرف على الكلام التلقائي للمحادثة مع الصوتيات الصوتية المعقولة (وليس الأوامر الصوتية، والغرد، وما إلى ذلك).
- لا يتوفر حاليا Project الإنشاء والتحرير لمقاطع الفيديو متعددة اللغات.
- لا تتوفر نماذج اللغات المخصصة عند استخدام الكشف متعدد اللغات.
- إضافة الكلمات الأساسية غير معتمدة.
- عند تصدير ملفات التسمية التوضيحية المغلقة، لن يظهر مؤشر اللغة.
- لا تدعم واجهة برمجة تطبيقات نسخة التحديث ملفات لغات متعددة.