تركيب الترجمات

مكتمل

يقوم TranslationRecognizer بإرجاع النصوص المنطوقة المترجمة من المدخلات المنطوقة، أي ترجمة الكلام المسموع إلى نص بشكل أساسي.

يمكنك أيضًا تركيب الترجمة على هيئة كلام لإنشاء حلول ترجمة تحويل الكلام إلى كلام. هناك طريقتان لتحقيق ذلك.

تركيب قائم على الحدث

عندما تريد إجراء ترجمة من لغة إلى أخرى (الترجمة من لغة مصدر واحدة إلى لغة هدف واحدة)، يمكنك استخدام التركيب المستند إلى الحدث لتسجيل الترجمة كتدفق صوتي. لإجراء ذلك، يجب عليك القيام بما يلي:

  1. حدد الصوت المطلوب للكلام المترجم في TranslationConfig.
  2. إنشاء معالج الأحداث لحدث Synthesizing للكائن TranslationRecognizer.
  3. في معالج الأحداث، استخدم الأسلوب GetAudio() للمعلمة Result لاستعادة دفق البايت من الصوت المترجم.

تختلف التعليمات البرمجية المحددة المستخدمة لتنفيذ معالج أحداث استنادًا إلى لغة البرمجة التي تستخدمها. راجع أمثلة C#‎ وPython في وثائق SPEECH SDK.

تركيب يدوي

التركيب اليدوي هو نهج بديل للتركيب المستند إلى الحدث ولا يتطلب منك تنفيذ معالج الأحداث. يمكنك استخدام التركيب اليدوي لإنشاء ترجمات صوتية لواحدة أو أكثر من اللغات المستهدفة.

التركيب اليدوي للترجمات هو في الأساس مجرد مزيج من عمليتين منفصلتين تقوم فيهما بما يلي:

  1. استخدام TranslationRecognizer لترجمة الإدخال المنطوق إلى نصوص منطوقة بلغة هدف واحدة أو أكثر.
  2. التكرار من خلال قاموس Translations في نتيجة عملية الترجمة، وذلك باستخدام SpeechSynthesizer لتجميع دفق الصوت لكل لغة.