Služby Speech

Řeč

Nápad řešení

Pokud se chcete podívat, jak nás rozšířit tento článek o další informace, podrobnosti implementace, doprovodné materiály nebo příklady kódu, dejte nám vědět s názory na GitHubu.

Se službami Speech je snadné přepisovat každé volání. Indexování přepisu pro fulltextové vyhledávání nebo použití Analýza textu rozpoznávání mínění, jazyka a klíčových frází pro přehledy Pokud nahrávky z call centra zahrnují specializovanou terminologii, jako jsou názvy produktů nebo žargon IT, vytvořte vlastní jazykový model, který službu Speech Services naučí slovník. Vlastní akustický model pomáhá službám Speech porozumět mluvčím i díky šumu na pozadí nebo špatným telefonním připojením.

Další informace najdete v tématu o tom, jak dávkový přepis funguje se službami Speech.

Architektura

Diagram architektury Stáhněte si SVG této architektury.

Data Flow

  1. Přizpůsobení modelu pro vaši doménu a nasazení tohoto modelu
  2. Nahrání nahrávek do kontejneru objektů blob
  3. Vytvoření požadavku POST na dávkový přepis
  4. Služba Speech naplánuje úlohu přepisu.
  5. Stereo soubory jsou rozdělené do dvou kanálů.
  6. Mono files undergo diarization to distinguish between speakers
  7. Stažení přepisu pomocí ID přepisu

Komponenty

Další kroky