Mi az a Speech Studio?

A Speech Studio egy felhasználói felületi eszközök készlete, amelyekkel az Azure AI Speech szolgáltatás funkcióit építheti ki és integrálhatja az alkalmazásokban. A Speech Studióban kód nélküli megközelítéssel hozhat létre projekteket, majd a Speech SDK, a Speech CLI vagy a REST API-k használatával hivatkozhat az alkalmazásokban lévő eszközökre.

Tipp.

A Speech Studióban bármilyen kód regisztrálása és írása nélkül is kipróbálhatja a beszédet szöveggé és szöveggé.

Speech Studio-forgatókönyvek

Néhány gyakori használati eset mintakódjának megismerése, kipróbálása és megtekintése.

  • Feliratozás: Válasszon ki egy minta videoklipet a valós idejű vagy offline feldolgozású képaláírás eredmények megtekintéséhez. Megtudhatja, hogyan szinkronizálhatja a képaláírás a bemeneti hanggal, hogyan alkalmazhat trágár szűrőket, kaphat részleges eredményeket, alkalmazhat testreszabásokat, és azonosíthat beszélt nyelveket többnyelvű forgatókönyvekhez. További információkért tekintse meg a képaláírás rövid útmutatót.

  • Call Center: Bemutató megtekintése arról, hogyan használható a Language and Speech services a call center-beszélgetések elemzésére. Valós időben átírhatja a hívásokat, vagy feldolgozhat egy hívásköteget, személyre szabott azonosítási adatokat hozhat létre, és olyan megállapításokat nyerhet ki, mint a hangulat, amelyek segítenek a call center használati ügyében. További információkért tekintse meg a telefonos ügyfélszolgálat rövid útmutatóját.

A Speech Studióban bemutatott forgatókönyvek bemutatásához tekintse meg ezt a bevezető videót.

A Speech Studio funkciói

A Speech Studióban a következő Speech service-funkciók érhetők el projekttípusokként:

  • Valós idejű szövegfelolvasás: A hangfájlok ide húzásával gyorsan tesztelheti a szöveghez való beszédet anélkül, hogy bármilyen kódot kellene használnia. A Speech Studio egy bemutató eszközzel mutatja be, hogyan működik a szövegfelolvasás a hangmintákon. A teljes funkció megismeréséhez tekintse meg a Szöveg beszéde című témakört.

  • Batch speech to text: A batch-átírási képességek gyors tesztelése nagy mennyiségű hang átviteléhez a tárolóban, és aszinkron módon fogadja az eredményeket. A Batch Beszéd szöveggé funkcióval kapcsolatos további információkért tekintse meg a Batch beszédről szövegre című áttekintését.

  • Egyéni beszéd: Meghatározott szókészletekre és beszédstílusokra szabott beszédfelismerési modellek létrehozása. Az alapszintű beszédfelismerési modellel ellentétben az egyéni beszédmodellek az egyedi versenyelőny részét képezik, mivel nem érhetők el nyilvánosan. Ha egyéni beszédmodell létrehozásához szeretne mintahangot feltölteni, tekintse meg a betanítási és tesztelési adathalmazok feltöltését ismertető szakaszt.

  • Kiejtési értékelés: A beszéd kiejtésének kiértékelése és a beszélők visszajelzése a beszélt hang pontosságáról és folyékonyságáról. A Speech Studio egy tesztkörnyezetet biztosít a funkció gyors, kód nélküli teszteléséhez. Ha a funkciót a Speech SDK-val szeretné használni az alkalmazásokban, tekintse meg a kiejtésértékelési cikket.

  • Beszédfordítás: Gyorsan tesztelheti és lefordíthatja a beszédet más, ön által választott nyelvekre, alacsony késéssel. A teljes funkció megismeréséhez tekintse meg a beszédfordítást.

  • Hanggaléria: Olyan alkalmazások és szolgáltatások létrehozása, amelyek természetesen beszélnek. Nyelvek, hangok és változatok széles választéka közül választhat. A forgatókönyveket rendkívül kifejező és emberszerű neurális hangokkal keltheti életre.

  • Egyéni hang: Egyéni, egyedi hangokat hozhat létre a szövegfelolvasáshoz. A Speech Studióban hangfájlokat adhat meg, és megfelelő átiratokat hozhat létre, majd használhatja az egyéni hangokat az alkalmazásokban. Ha egyéni hangokat szeretne létrehozni és használni végpontokon keresztül, olvassa el a hangmodell létrehozása és használata című témakört.

  • Hangtartalmak létrehozása: A szöveg és a beszédszintézis kód nélküli megközelítése. Használhatja a kimeneti hangokat, vagy kiindulási pontként a további testreszabáshoz. Rendkívül természetes hangtartalmakat hozhat létre különböző forgatókönyvekhez, például hangoskönyvekhez, hírközvetítésekhez, video narrációkhoz és csevegőrobotokhoz. További információkért tekintse meg a hangtartalom-létrehozás dokumentációját.

  • Egyéni kulcsszó: Az egyéni kulcsszó egy szó vagy rövid kifejezés, amellyel hangalapúan aktiválhat egy terméket. Létrehozhat egy egyéni kulcsszót a Speech Studióban, majd létrehoz egy bináris fájlt, amelyet a Speech SDK-val használhat az alkalmazásokban.

  • Egyéni parancsok: Egyszerűen készíthet gazdag, hangparancsokat tartalmazó alkalmazásokat, amelyek hangalapú interakciós élményre vannak optimalizálva. Az egyéni parancsok kód nélküli szerzői élményt nyújtanak a Speech Studióban, egy automatikus üzemeltetési modellben és viszonylag alacsonyabb összetettségben. A funkció segítségével a hangvezérlési forgatókönyvek legjobb megoldásának kialakítására összpontosíthat. További információkért tekintse meg az Egyéni parancsok fejlesztése alkalmazásokat ismertető útmutatót. Lásd még: Integrálás ügyfélalkalmazással a Speech SDK használatával.

Következő lépések