Bevezetés

Befejeződött

Az Azure AI Speech olyan API-kat biztosít, amelyekkel beszédalapú alkalmazásokat hozhat létre. Ide tartoznak az alábbiak:

  • Beszéd–szöveg: Olyan API, amely lehetővé teszi a beszédfelismerést , amelyben az alkalmazás elfogadhatja a beszélt bemenetet.
  • Szövegről beszédre: Olyan API, amely lehetővé teszi a beszédszintézist , amelyben az alkalmazás képes beszédkimenetet biztosítani.
  • Beszédfordítás: Olyan API, amellyel a beszélt bemenetet több nyelvre is lefordíthatja.
  • Speaker Recognition: Egy API, amely lehetővé teszi az alkalmazás számára, hogy felismerje az egyes hangszórókat a hangjuk alapján.
  • Szándékfelismerés: Olyan API, amely beszélgetési nyelvfelismeréssel határozza meg a beszélt bemenet szemantikai jelentését.

Ez a modul a beszédfelismerésre és a beszédszintézisre összpontosít, amelyek a beszédalapú alkalmazások alapvető képességei.

Ebben a modulban a következőket sajátíthatja el:

  • Azure-erőforrás kiépítése az Azure AI Speech szolgáltatáshoz
  • Beszédfelismerés implementálása a Speech to text API használatával
  • Beszédszintézis implementálása a Text to Speech API használatával
  • Hangformátum és hangok konfigurálása
  • Beszédszintézis korrektúranyelv (SSML) használata

A modul egységei fontos elméleti információkat tartalmaznak az Azure AI Speechről, valamint arról, hogyan használhatja az API-t az egyik támogatott szoftverfejlesztői készleten (SDK-n) keresztül, amely után gyakorlati gyakorlatban kipróbálhatja az Azure AI Speechet. A gyakorlati gyakorlat elvégzéséhez Microsoft Azure-előfizetésre lesz szüksége. Ha még nem rendelkezik előfizetéssel, regisztrálhat az ingyenes próbaverzióra a következő címen:https://azure.com/free.