Beszédszöveg-átírási folyamat használata a rögzített beszélgetések elemzéséhez

Azure AI Speech
Azure AI-nyelv
Azure AI services
Azure Synapse Analytics
Azure Logic Apps

A rögzített ügyfélhívások beszédfelismerése és elemzése értékes információkat nyújt a vállalatnak az aktuális trendekről, a termék hiányosságairól és a sikerekről.

A cikkben ismertetett példamegoldás egy megismételhető folyamatot vázol fel a beszélgetési adatok átviteléhez és elemzéséhez.

Architektúra

Az architektúra két folyamatból áll: egy átírási folyamatból, a hang szöveggé alakításához, valamint egy bővítési és vizualizációs folyamatból.

Átírási folyamat

A beszéd betöltését és szöveggé alakítását szemléltető ábra az Azure AI-szolgáltatások használatával.

Töltse le az architektúra Visio-fájlját.

Adatfolyam

  1. A hangfájlok bármilyen támogatott módszerrel feltölthetők egy Azure Storage-fiókba. Használhat egy UI-alapú eszközt, például az Azure Storage Explorert , vagy használhat tárolási SDK-t vagy API-t.
  2. Az Azure Storage-ba való feltöltés elindít egy Azure-logikai alkalmazást. A logikai alkalmazás hozzáfér a szükséges hitelesítő adatokhoz az Azure Key Vaultban, és kérést küld a Speech szolgáltatás kötegelt átírási API-jára.
  3. A logikai alkalmazás elküldi a hangfájlok hívását a Speech szolgáltatásnak, beleértve a hangszóró-diarizálás opcionális beállításait is.
  4. A Speech szolgáltatás befejezi a kötegelt átírást, és betölti az átírási eredményeket a Storage-fiókba.

Bővítési és vizualizációs folyamat

A bővítési és vizualizációs folyamatot bemutató ábra.

Töltse le az architektúra Visio-fájlját.

Adatfolyam

  1. Egy Azure Synapse Analytics-folyamat fut az átírt hangszöveg lekéréséhez és feldolgozásához.
  2. A folyamat egy API-híváson keresztül küld feldolgozott szöveget a Language service-nek. A szolgáltatás különböző természetes nyelvi feldolgozásokat (NLP) végez, például hangulat- és véleménybányászatot, összegzést, egyéni és előre összeállított entitásfelismerést.
  3. A feldolgozott adatok egy Azure Synapse Analytics SQL-készletben vannak tárolva, ahol olyan vizualizációs eszközökhöz, mint a Power BI.

Összetevők

  • Azure Blob Storage. Nagymértékben skálázható és biztonságos objektumtárolás natív felhőbeli számítási feladatokhoz, archívumokhoz, adattavakhoz, nagy teljesítményű számítástechnikához és gépi tanuláshoz. Ebben a megoldásban tárolja a hangfájlokat és az átirati eredményeket, és adattóként szolgál az alsóbb rétegbeli elemzésekhez.
  • Azure Logic Apps. Egy olyan integrációs platform szolgáltatásként (iPaaS), amely egy tárolóalapú futtatókörnyezetre épül. Ebben a megoldásban a tárolási és beszéd AI-szolgáltatásokat integrálja.
  • AI Speech szolgáltatás. Egy AI-alapú API, amely olyan beszédfelismerési képességeket biztosít, mint a szövegfelolvasás, a szövegfelolvasás, a beszédfordítás és a Speaker Recognition. Ebben a megoldásban a kötegelt átírási funkciót használják.
  • AI nyelv. Egy AI-alapú felügyelt szolgáltatás, amely olyan természetes nyelvi képességeket biztosít, mint a hangulatelemzés, az entitások kinyerése és az automatizált kérdések megválaszolása.
  • Azure Synapse Analytics. Adatintegrációt, vállalati adattárházat és big data-elemzést biztosító szolgáltatáscsomag. Ebben a megoldásban átalakítja és gazdagítja az átírási adatokat, és adatokat szolgáltat az alsóbb rétegbeli vizualizációs eszközöknek.
  • Power BI. Adatmodellezési és vizualizációelemzési eszköz. Ebben a megoldásban átírt hangelemzéseket jelenít meg a felhasználók és a döntéshozók számára.

Alternatívák

A megoldásarchitektúra néhány alternatív megközelítése:

  • Fontolja meg a Blob Storage-fiók hierarchikus névtér használatára való konfigurálását. Ez a konfiguráció hozzáférés-vezérlési listát (ACL)-alapú biztonsági vezérlőket biztosít, és javíthatja bizonyos big data számítási feladatok teljesítményét.
  • A számítási feladat méretétől és méretétől függően előfordulhat, hogy az Azure Functionst a Logic Apps vagy az Azure Synapse-folyamatok helyett kódelső integrációs eszközként használhatja.

Forgatókönyv részletei

Az ügyfélszolgálati központok számos iparág számos vállalkozásának sikerének szerves részét képezik. Ez a megoldás az Azure AI-szolgáltatások Speech API-ját használja a rögzített ügyfélhívások hangátírásához és diarizálásához. Az Azure Synapse Analytics olyan NLP-feladatok feldolgozására és végrehajtására szolgál, mint a hangulatelemzés és az egyéni elnevezett entitásfelismerés API-hívásokon keresztül az AI-nyelvre.

Az itt leírt szolgáltatások és folyamatok segítségével feldolgozhatja az átírt szöveget a bizalmas információk felismeréséhez és eltávolításához, hangulatelemzéshez és egyebekhez. A szolgáltatásokat és a folyamatot bármilyen mennyiségű rögzített adathoz skálázhatja.

Lehetséges használati esetek

Ez a megoldás számos iparágban, köztük a távközlésben, a pénzügyi szolgáltatásokban és a közigazgatásban is értéket biztosíthat a szervezetek számára. Minden olyan szervezetre vonatkozik, amely beszélgetéseket rögzít. Különösen az ügyféloldali vagy belső call centerek vagy támogatási pultok használhatják ki a megoldásból származó megállapításokat.

Megfontolások

Ezek a szempontok implementálják az Azure Well-Architected Framework alappilléreit, amely a számítási feladatok minőségének javítására használható vezérelvek készlete. További információ: Microsoft Azure Well-Architected Framework.

Biztonság

A biztonság biztosítékokat nyújt a szándékos támadások és az értékes adatokkal és rendszerekkel való visszaélés ellen. További információ: A biztonsági pillér áttekintése.

  • A Speech API-nak küldött kérés tartalmazhat egy közös hozzáférésű jogosultságkód (SAS) URI-t egy céltárolóhoz az Azure Storage-ban. Az SAS URI lehetővé teszi, hogy a Speech szolgáltatás közvetlenül a tároló helyére adja ki az átiratfájlokat. Ha a szervezet nem engedélyezi az SAS URI-k használatát a tároláshoz, akkor olyan függvényt kell implementálnia, amely rendszeres időközönként lekérdezi a Speech API-t a befejezett objektumokhoz.
  • A hitelesítő adatokat, például a fiók- vagy API-kulcsokat titkos kulcsként kell tárolni az Azure Key Vaultban. Konfigurálja a logikai alkalmazásokat és az Azure Synapse-folyamatokat a kulcstartóhoz való hozzáféréshez felügyelt identitások használatával, hogy elkerülje a titkos kulcsok tárolását az alkalmazásbeállításokban vagy a kódban.
  • A blobban tárolt hangfájlok bizalmas ügyféladatokat tartalmazhatnak. Ha több ügyfél is használja a megoldást, korlátoznia kell a fájlokhoz való hozzáférést. Használjon hierarchikus névteret a tárfiókon, és kényszerítse ki a mappa- és fájlszintű engedélyeket, hogy csak a szükséges Microsoft Entra-példányra korlátozza a hozzáférést.

Költségoptimalizálás

A költségoptimalizálás a szükségtelen kiadások csökkentésének és a működési hatékonyság javításának módjairól szól. További információ: A költségoptimalizálási pillér áttekintése.

Az architektúrában leírt összes Azure-szolgáltatás lehetővé teszi a használatalapú fizetéses számlázást, így a megoldás költségei lineárisan skálázhatók.

Az Azure Synapse lehetővé teszi a kiszolgáló nélküli SQL-készletek használatát, így az adattárház számítási feladatainak számítási feladatai igény szerint felpöröghetnek. Ha nem az Azure Synapse-t használja más alsóbb rétegbeli használati esetek kiszolgálására, fontolja meg a kiszolgáló nélküli használatot a költségek csökkentése érdekében.

További költségoptimalizálási stratégiákért tekintse meg a költségoptimalizálási pillér áttekintését.

Az itt javasolt szolgáltatások díjszabását az Azure díjkalkulátorában találja.

Teljesítmény hatékonysága

A teljesítménybeli hatékonyság lehetővé teszi, hogy a számítási feladatok hatékonyan méretezhetők legyenek a felhasználók igényei szerint. További információ: Teljesítményhatékonysági pillér áttekintése.

A Batch Speech API nagy mennyiségre van tervezve, de más Azure AI-szolgáltatások API-jai esetében előfordulhat, hogy az egyes előfizetési szintekre vonatkozó kéréskorlátok vannak érvényben. Fontolja meg ezeknek az API-knak a tárolóba való tárolását a nagy mennyiségű feldolgozás szabályozásának elkerülése érdekében. A tárolók rugalmas üzembe helyezést biztosítanak a felhőben vagy a helyszínen. Az új verziók bevezetésének mellékhatásait tárolók használatával is enyhítheti. További információ: Tárolótámogatás az Azure AI-szolgáltatásokban.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerzők:

Egyéb közreműködő:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Következő lépések