Analýza zaznamenaných konverzací pomocí kanálu přepisu řeči na text

Azure AI Speech
Jazyk Azure AI
Azure AI services
Azure Synapse Analytics
Azure Logic Apps

Rozpoznávání řeči a analýza zaznamenaných zákaznických hovorů může vaší firmě poskytnout cenné informace o aktuálních trendech, nedostatkůch produktů a úspěchu.

Ukázkové řešení popsané v tomto článku popisuje opakovatelný kanál pro přepis a analýzu dat konverzace.

Architektura

Architektura se skládá ze dvou kanálů: kanál přepisu pro převod zvuku na text a kanálu rozšiřování a vizualizace.

Kanál přepisu

Diagram znázorňující, jak ingestovat řeč a převést ji na text pomocí služeb Azure AI

Stáhněte si soubor aplikace Visio s touto architekturou.

Tok dat

  1. Zvukové soubory se nahrají do účtu Služby Azure Storage prostřednictvím libovolné podporované metody. Můžete použít nástroj založený na uživatelském rozhraní, jako je Průzkumník služby Azure Storage nebo použít sadu SDK nebo rozhraní API úložiště.
  2. Nahrání do Azure Storage aktivuje aplikaci logiky Azure. Aplikace logiky přistupuje ke všem nezbytným přihlašovacím údajům ve službě Azure Key Vault a odešle žádost do rozhraní API pro dávkové přepisy služby Speech.
  3. Aplikace logiky odešle do služby Speech volání zvukových souborů, včetně volitelných nastavení pro diarizaci mluvčího.
  4. Služba Speech dokončí dávkový přepis a načte výsledky přepisu do účtu úložiště.

Kanál rozšiřování a vizualizace

Diagram znázorňující kanál rozšiřování a vizualizace

Stáhněte si soubor aplikace Visio s touto architekturou.

Tok dat

  1. Kanál Azure Synapse Analytics se spustí pro načtení a zpracování přepisovaného zvukového textu.
  2. Kanál odesílá zpracovaný text prostřednictvím volání rozhraní API do služby Language. Služba provádí různé rozšiřování přirozeného jazyka (NLP), jako je dolování mínění a názorů, sumarizace a vlastní a předem sestavené rozpoznávání pojmenovaných entit.
  3. Zpracovávaná data se ukládají do fondu SQL Azure Synapse Analytics, kde je můžete obsluhovat do vizualizačních nástrojů, jako je Power BI.

Komponenty

  • Azure Blob Storage. Široce škálovatelné a zabezpečené úložiště objektů pro úlohy nativní pro cloud, archivy, datová jezera, vysokovýkonné výpočetní prostředí a strojové učení. V tomto řešení ukládá zvukové soubory a výsledky přepisu a slouží jako datové jezero pro podřízenou analýzu.
  • Azure Logic Apps. Integrační platforma jako služba (iPaaS), která je založená na kontejnerizovaném modulu runtime. V tomto řešení integruje úložiště a služby speech AI.
  • Služba AI Speech Rozhraní API založené na umělé inteligenci, které poskytuje funkce řeči, jako je řeč na text, text na řeč, překlad řeči a rozpoznávání mluvčího. V tomto řešení se používá funkce dávkového přepisu.
  • Jazyk AI. Spravovaná služba založená na umělé inteligenci, která poskytuje funkce přirozeného jazyka, jako je analýza mínění, extrakce entit a automatizované odpovědi na otázky.
  • Azure Synapse Analytics. Sada služeb, které poskytují integraci dat, skladování podnikových dat a analýzu velkých objemů dat. V tomto řešení transformuje a rozšiřuje data přepisu a obsluhuje data do podřízených vizualizačních nástrojů.
  • Power BI. Nástroj pro modelování dat a vizuální analýzu V tomto řešení prezentuje uživatelům a rozhodovacím pravomocím přepisované zvukové přehledy.

Alternativy

Tady je několik alternativních přístupů k této architektuře řešení:

  • Zvažte konfiguraci účtu služby Blob Storage tak, aby používal hierarchický obor názvů. Tato konfigurace poskytuje kontrolní mechanismy zabezpečení založené na seznamu řízení přístupu (ACL) a může zlepšit výkon některých úloh s velkými objemy dat.
  • V závislosti na velikosti a škálování úlohy můžete službu Azure Functions používat jako integrační nástroj pro první kód místo kanálů Logic Apps nebo Azure Synapse.

Podrobnosti scénáře

Centra péče o zákazníky jsou nedílnou součástí úspěchu mnoha firem v mnoha odvětvích. Toto řešení používá rozhraní Speech API ze služeb Azure AI k přepisu zvuku a diarizaci zaznamenaných volání zákazníků. Azure Synapse Analytics se používá ke zpracování a provádění úloh NLP, jako je analýza mínění a rozpoznávání vlastních pojmenovaných entit prostřednictvím volání rozhraní API do jazyka AI.

Pomocí zde popsaných služeb a kanálu můžete zpracovávat přepisovaný text a rozpoznávat a odebírat citlivé informace, provádět analýzu mínění a provádět další informace. Služby a kanál můžete škálovat tak, aby vyhovovaly libovolnému objemu zaznamenaných dat.

Potenciální případy použití

Toto řešení může poskytovat hodnotu organizacím v mnoha odvětvích, včetně telekomunikačních, finančních služeb a státní správy. Platí pro každou organizaci, která zaznamenává konverzace. Zejména z přehledů odvozených z tohoto řešení můžou těžit zákaznická nebo interní call centra nebo oddělení podpory.

Důležité informace

Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které můžete použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.

Zabezpečení

Zabezpečení poskytuje záruky proti záměrným útokům a zneužití cenných dat a systémů. Další informace najdete v tématu Přehled pilíře zabezpečení.

  • Požadavek na rozhraní Speech API může obsahovat identifikátor URI sdíleného přístupového podpisu (SAS) pro cílový kontejner ve službě Azure Storage. Identifikátor URI SAS umožňuje službě Speech přímo vypisovat soubory přepisu do umístění kontejneru. Pokud vaše organizace nepovoluje použití identifikátorů URI SAS pro úložiště, musíte implementovat funkci, která bude pravidelně dotazovat rozhraní Speech API na dokončené prostředky.
  • Přihlašovací údaje, jako jsou účty nebo klíče rozhraní API, by se měly ukládat ve službě Azure Key Vault jako tajné kódy. Nakonfigurujte aplikace logiky a kanály Azure Synapse pro přístup k trezoru klíčů pomocí spravovaných identit, abyste se vyhnuli ukládání tajných kódů do nastavení aplikace nebo kódu.
  • Zvukové soubory uložené v objektu blob můžou obsahovat citlivá zákaznická data. Pokud řešení používá více klientů, musíte omezit přístup k těmto souborům. V účtu úložiště použijte hierarchický obor názvů a vynucujte oprávnění na úrovni složky a souboru, abyste omezili přístup pouze na potřebnou instanci Microsoft Entra.

Optimalizace nákladů

Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.

Všechny služby Azure popsané v této architektuře poskytují možnost fakturace průběžných plateb, takže náklady na řešení se škáluje lineárně.

Azure Synapse nabízí možnost pro bezserverové fondy SQL, takže výpočetní prostředky pro úlohy datových skladů se dají rozmístit na vyžádání. Pokud nepoužíváte Azure Synapse k poskytování dalších případů použití podřízených dat, zvažte snížení nákladů bez serveru.

Další strategie optimalizace nákladů najdete v přehledu pilíře optimalizace nákladů.

Informace o cenách služeb navrhovaných tady najdete v tomto odhadu v cenové kalkulačce Azure.

Efektivita výkonu

Efektivita výkonu je schopnost úlohy škálovat se tak, aby efektivním způsobem splňovala požadavky, které na ni kladou uživatelé. Další informace najdete v tématu Přehled pilíře efektivity výkonu.

Rozhraní API služby Batch Speech je navržené pro velké objemy, ale jiná rozhraní API služeb Azure AI můžou mít omezení požadavků pro každou úroveň předplatného. Zvažte kontejnerizaci těchto rozhraní API, abyste se vyhnuli omezování zpracování velkých objemů. Kontejnery poskytují flexibilitu při nasazení, v cloudu nebo v místním prostředí. Pomocí kontejnerů můžete také zmírnit vedlejší účinky zavedení nových verzí. Další informace najdete v tématu Podpora kontejnerů ve službách Azure AI.

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autoři:

Další přispěvatel:

Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.

Další kroky