ما هو نموذج الهمس؟

نموذج الهمس هو نموذج كلام إلى نص من OpenAI يمكنك استخدامه لنسخ الملفات الصوتية. يتم تدريب النموذج على مجموعة بيانات كبيرة من الصوت والنص باللغة الإنجليزية. تم تحسين النموذج لتحويل الملفات الصوتية التي تحتوي على الكلام باللغة الإنجليزية. يمكن أيضا استخدام النموذج لنسخ الملفات الصوتية التي تحتوي على كلام بلغات أخرى. إخراج النموذج هو نص إنجليزي.

تتوفر نماذج الهمس عبر خدمة Azure OpenAI أو عبر Azure الذكاء الاصطناعي Speech. تختلف الميزات لتلك العروض. في Azure الذكاء الاصطناعي Speech، الهمس هو مجرد واحد من العديد من نماذج الكلام إلى النص التي يمكنك استخدامها.

قد تسأل:

  • هل نموذج الهمس هو خيار جيد للسيناريو الخاص بي، أم أن نموذج Azure الذكاء الاصطناعي Speech أفضل؟ ما هي مقارنات واجهة برمجة التطبيقات بين نوعي النماذج؟

  • إذا كنت أرغب في استخدام نموذج الهمس، فهل يجب استخدامه عبر خدمة Azure OpenAI أو عبر Azure الذكاء الاصطناعي Speech؟ ما هي السيناريوهات التي ترشدني إلى استخدام واحد أو آخر؟

نموذج الهمس أو نماذج الكلام الذكاء الاصطناعي Azure

إما نموذج الهمس أو نماذج الكلام الذكاء الاصطناعي Azure مناسبة اعتمادا على السيناريوهات الخاصة بك. إذا قررت استخدام Azure الذكاء الاصطناعي Speech، يمكنك الاختيار من بين عدة نماذج، بما في ذلك نموذج الهمس. يقارن الجدول التالي الخيارات مع التوصيات حول مكان البدء.

السيناريو نموذج الهمس نماذج Azure الذكاء الاصطناعي Speech
النسخ والتسميات التوضيحية والترجمات في الوقت الحقيقي للصوت والفيديو. غير متوفرة مستحسن
النسخ والتسميات التوضيحية وشرائط الترجمة للصوت والفيديو المسجلين مسبقا. يوصى بنموذج الهمس عبر Azure OpenAI للمعالجة السريعة للملفات الصوتية الفردية. يوصى باستخدام نموذج الهمس عبر Azure الذكاء الاصطناعي Speech لمعالجة دفعات الملفات الكبيرة. لمزيد من المعلومات، راجع نموذج الهمس عبر Azure الذكاء الاصطناعي Speech أو عبر خدمة Azure OpenAI؟ يوصى به لمعالجة دفعات الملفات الكبيرة، واليوميات، والطوابع الزمنية على مستوى الكلمات.
نسخة من تسجيلات المكالمات الهاتفية والتحليلات مثل ملخص المكالمات والمشاعر والموضوعات الرئيسية والرؤى المخصصة. متاح مستحسن
النسخ والتحليلات في الوقت الحقيقي لمساعدة وكلاء مركز الاتصال مع أسئلة العملاء. غير متوفرة مستحسن
نسخة من تسجيلات الاجتماع وتحليلاته مثل ملخص الاجتماع وفصول الاجتماع واستخراج عنصر الإجراء. متاح مستحسن
إدخال النص في الوقت الحقيقي وإنشاء المستند من خلال الإملاء الصوتي. غير متوفرة مستحسن
الوكيل الصوتي لمركز الاتصال: توجيه المكالمات والاستجابة الصوتية التفاعلية لمراكز الاتصال. متاح مستحسن
المساعد الصوتي: مساعد صوتي خاص بالتطبيق لمربع معين، وتطبيق الأجهزة المحمولة، وفي السيارة، وسيناريوهات أخرى. متاح مستحسن
تقييم النطق: تقييم نطق صوت المتحدث. غير متوفرة مستحسن
ترجمة الصوت المباشر من لغة إلى أخرى. غير متوفرة يوصى باستخدام واجهة برمجة تطبيقات ترجمة الكلام
ترجمة الصوت المسجل مسبقا من لغات أخرى إلى اللغة الإنجليزية. مستحسن متوفر عبر واجهة برمجة تطبيقات ترجمة الكلام
ترجمة الصوت المسجل مسبقا إلى لغات أخرى غير الإنجليزية. غير متوفرة يوصى باستخدام واجهة برمجة تطبيقات ترجمة الكلام

هل تهمس النموذج عبر Azure الذكاء الاصطناعي Speech أو عبر خدمة Azure OpenAI؟

إذا قررت استخدام نموذج الهمس، فلديك خياران. يمكنك اختيار ما إذا كنت تريد استخدام نموذج الهمس عبر Azure OpenAI أو عبر Azure الذكاء الاصطناعي Speech. وفي كلتا الحالتين، تكون قابلية قراءة النص المكتوب هي نفسها. يمكنك إدخال صوت لغة مختلطة والإخراج باللغة الإنجليزية.

قد يكون نموذج الهمس عبر خدمة Azure OpenAI هو الأفضل ل:

  • نسخ الملفات الصوتية بسرعة واحدا تلو الآخر
  • ترجمة الصوت من لغات أخرى إلى اللغة الإنجليزية
  • توفير مطالبة للنموذج لتوجيه الإخراج
  • تنسيقات الملفات المدعومة: mp3 وmp4 وmpweg وmpga وm4a وwav وwebm

قد يكون نموذج الهمس عبر Azure الذكاء الاصطناعي Speech هو الأفضل ل:

  • تحويل الملفات التي يزيد حجمها عن 25 ميغابايت (حتى 1 غيغابايت). حد حجم الملف لنموذج Azure OpenAI هامس هو 25 ميغابايت.
  • تحويل دفعات كبيرة من الملفات الصوتية
  • يوميات للتمييز بين المتحدثين المختلفين المشاركين في المحادثة. توفر خدمة الكلام معلومات حول المتحدث الذي كان يتحدث جزءا معينا من الكلام المنسوخ. لا يدعم نموذج الهمس عبر Azure OpenAI اليوميات.
  • الطوابع الزمنية على مستوى Word
  • تنسيقات الملفات المدعومة: mp3 وwav وogg
  • تخصيص نموذج قاعدة الهمس لتحسين الدقة للسيناريو الخاص بك (قريبا)

والدعم الإقليمي هو اعتبار آخر.

  • يتوفر نموذج الهمس عبر خدمة Azure OpenAI في المناطق التالية: EastUS 2، وجنوب الهند، وشمال وسط النرويج، وشرق النرويج، ووسط السويد، وغرب أوروبا.
  • يتوفر نموذج الهمس عبر Azure الذكاء الاصطناعي Speech في المناطق التالية: شرق أستراليا وشرق الولايات المتحدة وشمال وسط الولايات المتحدة وجنوب وسط الولايات المتحدة وجنوب شرق آسيا وجنوب المملكة المتحدة وغرب أوروبا.

الخطوات التالية