Introduction
Az AI beszédfunkciói lehetővé teszik, hogy hangutasításokkal kezeljük az otthoni és az automatikus rendszereket, válaszokat kapjunk a számítógépektől a beszélt kérdésekre, képaláírás hozzunk létre a hangból, és még sok mást.
Az ilyen interakciókhoz az AI-rendszernek két képességet kell támogatnia:
- Beszédfelismerés – a beszélt bemenet észlelésének és értelmezésének képessége
- Beszédszintézis – a beszélt kimenet létrehozásának képessége
Az Azure AI Speech beszédfelismeréssel és -szintézissel biztosít beszéd- és szövegfelismerési képességeket. Az előre összeállított és egyéni Speech service-modellek számos különböző feladathoz használhatók, a hang és a szöveg nagy pontosságú átírásától a beszélgetések beszélőinek azonosításáig, egyéni hangok létrehozásáig stb. A következő lépésben megismerheti az AI beszédfunkcióinak működését.