الترحيل من مفهرس الوسائط ومفهرس الوسائط 2 إلى محلل الفيديو للوسائط

media services logo


هام

من المستحسن أن يقوم العملاء بالترحيل من Indexer v1 وفهرس الإصدار 2 إلى استخدام الوضع الأساسي ل Media Services v3 AudioAnalyzerPreset. يتم إيقاف معالج وسائط Azure Media Indexer ومعالجات وسائط Azure Media Indexer 2 Preview . للحصول على تواريخ الإيقاف، راجع موضوع المكونات القديمة هذا.

تم إنشاء Azure Video Analyzer for Media على Azure Media Analytics وAzure Cognitive Search والخدمات المعرفية (مثل واجهة برمجة تطبيقات Face المترجم من Microsoft وواجهة برمجة تطبيقات Computer Vision وخدمة الكلام المخصصة). يمكنك هذا التطبيق من استخراج نتيجة التحليلات من مقاطع الفيديو الخاصة بك باستخدام محلل الفيديو لنماذج مقاطع الصوت والفيديو للوسائط. لمعرفة السيناريوهات التي يمكن استخدام Video Analyzer for Media فيها، والميزات التي يقدمها وكيفية البدء، راجع Video Analyzer for Media ونماذج الفيديو والصوت.

يمكنك استخراج الرؤى من ملفات الفيديو والصوت باستخدام الإعدادات المسبقة لمحلل Azure Media Services v3 أو مباشرة باستخدام واجهات برمجة تطبيقات محلل الفيديو للوسائط. حاليا، هناك تداخل بين الميزات التي تقدمها واجهات برمجة تطبيقات محلل الفيديو للوسائط وواجهات برمجة تطبيقات خدمات الوسائط v3.

ملاحظة

لفهم الاختلافات بين الإعدادات المسبقة لمحلل الفيديو للوسائط مقابل محلل خدمات الوسائط، راجع مستند المقارنة.

تتناول هذه المقالة خطوات الترحيل من Azure Media Indexer وAzure Media Indexer 2 إلى Video Analyzer for Media.

خيارات الترحيل

إذا كنت بحاجة إلى ثم
حل يوفر كتابة الكلام إلى نص لأي تنسيق ملف وسائط بتنسيق ملف تسمية توضيحية مغلقة: VTT أو SRT أو TTML
بالإضافة إلى رؤى صوتية إضافية مثل: الكلمات الأساسية، واستنتاج الموضوع، والأحداث الصوتية، وتدوين المحاضر، واستخراج الكيانات والترجمة
قم بتحديث تطبيقاتك لاستخدام قدرات Video Analyzer for Media من خلال Video Analyzer for Media v2 REST API أو Azure Media Services v3 Audio Analyzer preset.
قدرات تحويل الكلام إلى نص استخدم واجهة برمجة تطبيقات الكلام للخدمات المعرفية مباشرة.

بدء استخدام Video Analyzer for Media

يشير القسم التالي إلى الارتباطات ذات الصلة: كيف يمكنني البدء باستخدام Video Analyzer for Media؟

بدء استخدام واجهات برمجة تطبيقات خدمات الوسائط الإصدار 3

تمكنك واجهة برمجة تطبيقات Azure Media Services v3 من استخراج الرؤى من ملفات الفيديو والصوت من خلال الإعدادات المسبقة لمحلل Azure Media Services v3.

يتيح لك AudioAnalyzerPreset استخراج رؤى صوتية متعددة من ملف صوت أو فيديو. يتضمن الإخراج ملف VTT أو TTML للنسخة الصوتية وملف JSON (مع جميع الرؤى الصوتية الإضافية). تتضمن رؤى الصوت الكلمات الأساسية وفهرسة المتحدث وتحليل توجه الكلام. يدعم AudioAnalyzerPreset أيضا الكشف عن اللغة للغات معينة. للحصول على معلومات مفصلة، راجع التحويلات.

الشروع في العمل

للبدء، راجع:

بدء استخدام Cognitive Services Speech Services

توفر خدمات Azure المعرفية خدمة تحويل الكلام إلى نص التي تنسخ تدفقات الصوت إلى نص في الوقت الفعلي يمكن للتطبيقات أو الأدوات أو الأجهزة استهلاكها أو عرضها. يمكنك استخدام تحويل الكلام إلى نص لتخصيص النموذج الصوتي أو نموذج اللغة أو نموذج النطق. لمزيد من المعلومات، راجع تحويل الكلام إلى نص للخدمات المعرفية.

ملاحظة

لا تأخذ خدمة تحويل الكلام إلى نص تنسيقات ملفات الفيديو ولا تأخذ سوى تنسيقات صوت معينة.

لمزيد من المعلومات حول خدمة تحويل النص إلى كلام وكيفية البدء، راجع ما هو تحويل الكلام إلى نص؟

الاختلافات المعروفة عن الخدمات المهملة

ستجد أن خدمات Video Analyzer for Media وAzure Media Services v3 AudioAnalyzerPreset و Cognitive Services Speech Services أكثر موثوقية وتنتج إخراجا أفضل جودة من معالجات Azure Media Indexer 1 وAzure Media Indexer 2 المتوقفة.

تتضمن بعض الاختلافات المعروفة ما يلي:

  • لا تدعم Cognitive Services Speech Services استخراج الكلمة الأساسية. ومع ذلك، يقدم Video Analyzer for Media and Media Services v3 AudioAnalyzerPreset مجموعة أكثر قوة من الكلمات الأساسية بتنسيق ملف JSON.

الدعم

يمكنك فتح تذكرة دعم بالانتقال إلى طلب دعم جديد