Share via


Inmatningsklient med Azure AI-tjänster

Inmatningsklienten är ett verktyg som släppts av Microsoft på GitHub och som hjälper dig att snabbt distribuera en transkriptionslösning för callcenter till Azure utan kod.

Dricks

Du kan använda verktyget och den resulterande lösningen i produktion för att bearbeta en hög volym ljud.

Inmatningsklienten använder Azure AI Language, Azure AI Speech, Azure Storage och Azure Functions.

Kom igång med inmatningsklienten

Ett Azure-konto och en Azure AI-tjänstresurs med flera tjänster krävs för att köra inmatningsklienten.

Se komma igång-guiden för inmatningsklienten på GitHub för att lära dig hur du konfigurerar och använder verktyget.

Inmatningsklientfunktioner

Inmatningsklienten fungerar genom att ansluta ett dedikerat Azure-lagringskonto till anpassade Azure Functions på ett serverlöst sätt för att skicka transkriptionsbegäranden till tjänsten. De transkriberade ljudfilerna hamnar i den dedikerade Azure Storage-containern.

Viktigt!

Prissättningen varierar beroende på åtgärdsläget (batch jämfört med realtid) samt den Valda Azure-funktions-SKU:n. Som standard skapar verktyget en Premium Azure-funktions-SKU för att hantera stora volymer. Mer information finns på sidan Prissättning .

Internt använder verktyget tal- och språktjänster och följer bästa praxis för att hantera uppskalning, återförsök och redundans. Följande schema beskriver resurserna och anslutningarna.

Diagram that shows the Ingestion Client Architecture.

Följande Speech-tjänstfunktion används av inmatningsklienten:

  • Batchtal till text: Transkribera stora mängder ljudfiler asynkront, inklusive talardiarisering och används vanligtvis i analysscenarier efter samtal. Diarisering är processen att känna igen och separera högtalare i monokanalsljuddata.

Här följer några språktjänstfunktioner som används av inmatningsklienten:

  • Extrahering och redigering av personligt identifierbar information (PII): Identifiera, kategorisera och redigera känslig information i konversationstranskription.
  • Attitydanalys och åsiktsutvinning: Analysera transkriptioner och associera positiva, neutrala eller negativa sentiment på yttrande- och konversationsnivå.

Förutom Azure AI-tjänster används dessa Azure-produkter för att slutföra lösningen:

  • Azure Storage: Används för att lagra telefonidata och de transkriptioner som batch-transkriptions-API:et returnerar. Det här lagringskontot bör använda meddelanden, särskilt när nya filer läggs till. Dessa meddelanden används för att utlösa transkriptionsprocessen.
  • Azure Functions: Används för att skapa SAS-URI (signatur för delad åtkomst) för varje inspelning och utlösa HTTP POST-begäran för att starta en transkription. Dessutom använder du Azure Functions för att skapa begäranden för att hämta och ta bort transkriptioner med hjälp av Batch Transcription-API:et.

Anpassning av verktyg

Verktyget är skapat för att visa kundernas resultat snabbt. Du kan anpassa verktyget till önskade SKU:er och konfiguration. SKU:erna kan redigeras från Azure-portalen och själva koden är tillgänglig på GitHub.

Kommentar

Vi föreslår att du skapar resurserna i samma dedikerade resursgrupp för att förstå och spåra kostnader enklare.

Nästa steg