Introduction

Befejeződött

Az AI beszédfunkciói lehetővé teszik, hogy hangutasításokkal kezeljük az otthoni és az automatikus rendszereket, válaszokat kapjunk a számítógépektől a beszélt kérdésekre, képaláírás hozzunk létre a hangból, és még sok mást.

Az ilyen interakciókhoz az AI-rendszernek két képességet kell támogatnia:

  • Beszédfelismerés – a beszélt bemenet észlelésének és értelmezésének képessége
  • Beszédszintézis – a beszélt kimenet létrehozásának képessége

Az Azure AI Speech beszédfelismeréssel és -szintézissel biztosít beszéd- és szövegfelismerési képességeket. Az előre összeállított és egyéni Speech service-modellek számos különböző feladathoz használhatók, a hang és a szöveg nagy pontosságú átírásától a beszélgetések beszélőinek azonosításáig, egyéni hangok létrehozásáig stb. A következő lépésben megismerheti az AI beszédfunkcióinak működését.