نظرة عامة على لغة ترميز تركيب الكلام (SSML)
لغة ترميز تركيب الكلام (SSML) هي لغة ترميز مستندة إلى XML يمكنك استخدامها لضبط النص إلى سمات إخراج الكلام مثل درجة الصوت والنطق ومعدل التحدث ومستوى الصوت والمزيد. فهو يمنحك تحكما ومرونة أكبر من إدخال النص العادي.
تلميح
يمكنك سماع الأصوات بأنماط وعلامات ترويجية مختلفة تقرأ نص مثال باستخدام معرض الصوت.
سيناريوهات حالة الاستخدام
تم تصميم SSML لمنحك المرونة في الطريقة التي تريد بها صوت إخراج الكلام، ويوفر خصائص مختلفة لكيفية تخصيص هذا الإخراج. يمكنك استخدام SSML من أجل:
- حدد بنية نص الإدخال التي تحدد بنية النص إلى إخراج الكلام ومحتواه وخصائصه الأخرى. على سبيل المثال، يمكنك استخدام SSML لتعريف فقرة أو جملة أو فاصل أو إيقاف مؤقت أو صمت. يمكنك التفاف النص مع علامات الحدث، مثل إشارة مرجعية أو viseme، يمكن للتطبيق الخاص بك معالجته لاحقا. Viseme هو الوصف المرئي لهاتف، أصوات الكلام الفردية، باللغة المنطوقة.
- اختر الصوت واللغة والاسم والنمط والدور. يمكنك استخدام أصوات متعددة في مستند SSML واحد. يمكنك أيضا ضبط التركيز ومعدل التحدث والمستوى ومستوى الصوت. يمكن ل SSML أيضا إدراج صوت مسجل مسبقا، مثل تأثير صوتي أو ملاحظة موسيقية.
- التحكم في نطق صوت الإخراج. على سبيل المثال، يمكنك استخدام SSML مع الهواتف ومعجم مخصص لتحسين النطق. يمكنك أيضا استخدام SSML لتحديد كيفية نطق كلمة أو تعبير رياضي.
طرق العمل مع SSML
تتوفر وظيفة SSML في أدوات مختلفة قد تناسب حالة الاستخدام الخاصة بك.
هام
تتم محاسبتك على كل حرف يتم تحويله إلى كلام، بما في ذلك علامات الترقيم. على الرغم من أن مستند SSML نفسه غير قابل للفوترة، فإن الخدمة تحسب العناصر الاختيارية التي تستخدمها لضبط كيفية تحويل النص إلى كلام، مثل الرسائل الهاتفية والنص الترويجي، كأحرف قابلة للفوترة. لمزيد من المعلومات، راجع ملاحظة التسعير.
يمكنك استخدام SSML بالطرق التالية:
- تتيح لك أداة إنشاء محتوى الصوت تأليف نص عادي وSSML في Speech Studio. يمكنك الاستماع إلى صوت الإخراج وضبط SSML لتحسين تركيب الكلام. لمزيد من المعلومات، راجع تركيب الكلام باستخدام أداة إنشاء محتوى الصوت.
- تقبل واجهة برمجة تطبيقات تجميع الدفعات SSML عبر الخاصية
inputs
. - يقبل Speech CLI SSML عبر وسيطة
spx synthesize --ssml SSML
سطر الأوامر. - يقبل Speech SDK SSML عبر أسلوب SSML "speak" عبر اللغات المختلفة المدعومة.