نظرة عامة على لغة ترميز تركيب الكلام (SSML)

لغة ترميز تركيب الكلام (SSML) هي لغة ترميز مستندة إلى XML يمكنك استخدامها لضبط النص إلى سمات إخراج الكلام مثل درجة الصوت والنطق ومعدل التحدث ومستوى الصوت والمزيد. فهو يمنحك تحكما ومرونة أكبر من إدخال النص العادي.

تلميح

يمكنك سماع الأصوات بأنماط وعلامات ترويجية مختلفة تقرأ نص مثال باستخدام معرض الصوت.

سيناريوهات حالة الاستخدام

تم تصميم SSML لمنحك المرونة في الطريقة التي تريد بها صوت إخراج الكلام، ويوفر خصائص مختلفة لكيفية تخصيص هذا الإخراج. يمكنك استخدام SSML من أجل:

  • حدد بنية نص الإدخال التي تحدد بنية النص إلى إخراج الكلام ومحتواه وخصائصه الأخرى. على سبيل المثال، يمكنك استخدام SSML لتعريف فقرة أو جملة أو فاصل أو إيقاف مؤقت أو صمت. يمكنك التفاف النص مع علامات الحدث، مثل إشارة مرجعية أو viseme، يمكن للتطبيق الخاص بك معالجته لاحقا. Viseme هو الوصف المرئي لهاتف، أصوات الكلام الفردية، باللغة المنطوقة.
  • اختر الصوت واللغة والاسم والنمط والدور. يمكنك استخدام أصوات متعددة في مستند SSML واحد. يمكنك أيضا ضبط التركيز ومعدل التحدث والمستوى ومستوى الصوت. يمكن ل SSML أيضا إدراج صوت مسجل مسبقا، مثل تأثير صوتي أو ملاحظة موسيقية.
  • التحكم في نطق صوت الإخراج. على سبيل المثال، يمكنك استخدام SSML مع الهواتف ومعجم مخصص لتحسين النطق. يمكنك أيضا استخدام SSML لتحديد كيفية نطق كلمة أو تعبير رياضي.

طرق العمل مع SSML

تتوفر وظيفة SSML في أدوات مختلفة قد تناسب حالة الاستخدام الخاصة بك.

هام

تتم محاسبتك على كل حرف يتم تحويله إلى كلام، بما في ذلك علامات الترقيم. على الرغم من أن مستند SSML نفسه غير قابل للفوترة، فإن الخدمة تحسب العناصر الاختيارية التي تستخدمها لضبط كيفية تحويل النص إلى كلام، مثل الرسائل الهاتفية والنص الترويجي، كأحرف قابلة للفوترة. لمزيد من المعلومات، راجع ملاحظة التسعير.

يمكنك استخدام SSML بالطرق التالية:

الخطوات التالية