Beszédszintézis korrektúranyelv (SSML) áttekintése

Cikk
01/22/2024

A Beszédszintézis korrektúranyelv (SSML) egy XML-alapú korrektúranyelv, amellyel a szöveg finomhangolható a beszédkimeneti attribútumokra, például a hangmagasságra, a kiejtésre, a beszédsebességre, a hangerőre stb. Nagyobb vezérlést és rugalmasságot biztosít, mint az egyszerű szöveges bevitel.

Tipp.

A Hangtár használatával különböző stílusokban és hangmagasságokban hallhatja a példaszöveget olvasó hangokat.

Használati helyzetek

Az SSML úgy lett kialakítva, hogy rugalmasan hangozzon a beszédkimenet, és különböző tulajdonságokat biztosít a kimenet testreszabásához. Az SSML-t a következőre használhatja:

Határozza meg a bemeneti szöveg struktúráját , amely meghatározza a szöveg és a beszéd kimenetének szerkezetét, tartalmát és egyéb jellemzőit. Az SSML használatával például definiálhat bekezdést, mondatot, szünetet, szünetet vagy csendet. Az alkalmazás később feldolgozható eseménycímkékkel(például könyvjelzőkkel vagy viseme-ekkel) tördelheti a szöveget. A viseme a telefon képi leírása, az egyes beszédhangok beszélt nyelven.
Válassza ki a hangot, a nyelvet, a nevet, a stílust és a szerepkört. Egyetlen SSML-dokumentumban több hang is használható. A hangsúly, a beszédsebesség, a hangmagasság és a hangerő is módosítható. Az SSML előre rögzített hangokat is beszúrhat, például hangeffektust vagy zenei megjegyzést.
A kimeneti hang kiejtésének szabályozása. Használhatja például az SSML-t telefonnal és egyéni lexikonnal a kiejtés javítására. Az SSML használatával azt is meghatározhatja, hogy egy szó vagy matematikai kifejezés hogyan legyen kimondva.

Az SSML-vel való munka módjai

Az SSML-funkciók különböző eszközökben érhetők el, amelyek illeszkedhetnek a használati esethez.

Fontos

A rendszer minden beszédgé konvertált karakter után kiszámláz, beleértve az írásjeleket is. Bár maga az SSML-dokumentum nem számlázható, a szolgáltatás számlálja azokat a választható elemeket, amelyeket a szöveg beszédgé alakításához használ, például a hangmagasságot és a hangmagasságot számlázható karakterként. További információkért tekintse meg a díjszabási megjegyzést.

Az SSML a következő módokon használható:

A hangtartalom-létrehozó eszközzel egyszerű szöveget és SSML-t készíthet a Speech Studióban. Meghallgathatja a kimeneti hangot, és módosíthatja az SSML-t a beszédszintézis javítása érdekében. További információ: Beszédszintézis a Hangtartalom létrehozása eszközzel.
A batch synthesis API a tulajdonságon keresztül fogadja el az SSML-t inputs .
A Speech CLI a parancssori argumentumon keresztül fogadja el az spx synthesize --ssml SSML SSML-t.
A Speech SDK a "speak" SSML metóduson keresztül fogadja el az SSML-t a különböző támogatott nyelvek között.

Beszédszintézis korrektúranyelv (SSML) áttekintése

Használati helyzetek

Az SSML-vel való munka módjai

További lépések

További források