Een pijplijn voor spraak-naar-teksttranscriptie gebruiken om opgenomen gesprekken te analyseren

Azure AI Speech
Azure AI-taal
Azure AI services
Azure Synapse Analytics
Azure Logic Apps

Spraakherkenning en analyse van opgenomen klantgesprekken kunnen uw bedrijf waardevolle informatie bieden over huidige trends, producttekortkomingen en successen.

De voorbeeldoplossing die in dit artikel wordt beschreven, bevat een herhaalbare pijplijn voor het transcriberen en analyseren van gespreksgegevens.

Architectuur

De architectuur bestaat uit twee pijplijnen: een transcriptiepijplijn om audio naar tekst te converteren en een verrijkings- en visualisatiepijplijn.

Transcriptiepijplijn

Diagram dat laat zien hoe u spraak opneemt en converteert naar tekst met behulp van Azure AI-services.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

  1. Audiobestanden worden via elke ondersteunde methode geüpload naar een Azure Storage-account. U kunt een hulpprogramma op basis van de gebruikersinterface gebruiken, zoals Azure Storage Explorer , of een opslag-SDK of API gebruiken.
  2. Tijdens het uploaden naar Azure Storage wordt een logische Azure-app geactiveerd. De logische app opent alle benodigde referenties in Azure Key Vault en doet een aanvraag naar de batchtranscriptie-API van de Speech-service.
  3. De logische app verzendt de audiobestanden-aanroep naar de Speech-service, inclusief optionele instellingen voor sprekerverwijdering.
  4. De Speech-service voltooit de batchtranscriptie en laadt de transcriptieresultaten naar het opslagaccount.

Verrijking en visualisatiepijplijn

Diagram dat de verrijkings- en visualisatiepijplijn illustreert.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

  1. Een Azure Synapse Analytics-pijplijn wordt uitgevoerd om de getranscribeerde audiotekst op te halen en te verwerken.
  2. De pijplijn verzendt verwerkte tekst via een API-aanroep naar de Language-service. De service voert verschillende verrijkingen voor natuurlijke taalverwerking (NLP) uit, zoals sentiment- en meninganalyse, samenvatting en aangepaste en vooraf gebouwde herkenning van benoemde entiteiten.
  3. De verwerkte gegevens worden opgeslagen in een Azure Synapse Analytics SQL-pool, waar deze kunnen worden geleverd aan visualisatiehulpprogramma's zoals Power BI.

Onderdelen

  • Azure Blob Storage. Zeer schaalbare en veilige objectopslag voor cloudeigen workloads, archieven, data lakes, high performance computing en machine learning. In deze oplossing worden de audiobestanden en transcriptieresultaten opgeslagen en fungeert deze als data lake voor downstreamanalyses.
  • Azure Logic Apps. Een integratieplatform als een service (iPaaS) dat is gebouwd op een gecontaineriseerde runtime. In deze oplossing worden opslag- en spraak-AI-services geïntegreerd.
  • AI Speech-service. Een OP AI gebaseerde API die spraakmogelijkheden biedt, zoals spraak-naar-tekst, tekst-naar-spraak, spraakomzetting en Sprekerherkenning. De batchtranscriptiefunctionaliteit wordt in deze oplossing gebruikt.
  • AI-taal. Een op AI gebaseerde beheerde service die mogelijkheden voor natuurlijke taal biedt, zoals sentimentanalyse, entiteitextractie en geautomatiseerde vragen beantwoorden.
  • Azure Synapse Analytics. Een suite met services die gegevensintegratie, zakelijke datawarehousing en big data-analyses bieden. In deze oplossing worden transcriptiegegevens getransformeerd en verrijkt en worden ze gebruikt voor downstreamvisualisatiehulpprogramma's.
  • Power BI. Een hulpprogramma voor gegevensmodellering en visuele analyse. In deze oplossing worden getranscribeerde audio-inzichten gepresenteerd aan gebruikers en besluitvormers.

Alternatieven

Hier volgen enkele alternatieve benaderingen voor deze oplossingsarchitectuur:

  • Overweeg om het Blob Storage-account te configureren voor het gebruik van een hiërarchische naamruimte. Deze configuratie biedt beveiligingsmaatregelen op basis van ACL (Access Control List) en kan de prestaties voor sommige big data-workloads verbeteren.
  • Mogelijk kunt u Azure Functions gebruiken als een hulpprogramma voor integratie van code eerst in plaats van Logic Apps of Azure Synapse-pijplijnen, afhankelijk van de grootte en schaal van de workload.

Scenariodetails

Klantenservicecentra vormen een integraal onderdeel van het succes van veel bedrijven in veel branches. Deze oplossing maakt gebruik van de Speech-API van Azure AI-services voor de audiotranscriptie en het diariseren van opgenomen klantoproepen. Azure Synapse Analytics wordt gebruikt om NLP-taken zoals sentimentanalyse en aangepaste entiteitsherkenning te verwerken en uit te voeren via API-aanroepen naar AI Language.

U kunt de services en pijplijn die hier worden beschreven, gebruiken om getranscribeerde tekst te verwerken om gevoelige informatie te herkennen en te verwijderen, sentimentanalyses uit te voeren en meer. U kunt de services en pijplijn schalen om ruimte te bieden aan elk volume van opgenomen gegevens.

Potentiële gebruikscases

Deze oplossing kan organisaties in veel branches waarde bieden, waaronder telecommunicatie, financiële dienstverlening en overheid. Dit geldt voor elke organisatie die gesprekken registreert. Met name klantgerichte of interne callcenters of ondersteuningsmedewerkers kunnen profiteren van de inzichten die zijn afgeleid van deze oplossing.

Overwegingen

Met deze overwegingen worden de pijlers van het Azure Well-Architected Framework geïmplementeerd. Dit is een set richtlijnen die u kunt gebruiken om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

Beveiliging

Beveiliging biedt garanties tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

  • De aanvraag voor de Speech-API kan een SAS-URI (Shared Access Signature) bevatten voor een doelcontainer in Azure Storage. Met een SAS-URI kan de Speech-service de transcriptiebestanden rechtstreeks uitvoeren naar de containerlocatie. Als uw organisatie het gebruik van SAS-URI's voor opslag niet toestaat, moet u een functie implementeren om periodiek de Speech-API te peilen voor voltooide assets.
  • Referenties zoals account- of API-sleutels moeten als geheimen worden opgeslagen in Azure Key Vault. Configureer uw logische apps en Azure Synapse-pijplijnen voor toegang tot de sleutelkluis met behulp van beheerde identiteiten om te voorkomen dat geheimen in toepassingsinstellingen of code worden opgeslagen.
  • De audiobestanden die zijn opgeslagen in de blob kunnen gevoelige klantgegevens bevatten. Als meerdere clients de oplossing gebruiken, moet u de toegang tot deze bestanden beperken. Gebruik hiërarchische naamruimte in het opslagaccount en dwing machtigingen op map- en bestandsniveau af om de toegang tot alleen het benodigde Microsoft Entra-exemplaar te beperken.

Kostenoptimalisatie

Kostenoptimalisatie gaat over manieren om onnodige uitgaven te verminderen en operationele efficiëntie te verbeteren. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

Alle Azure-services die in deze architectuur worden beschreven, bieden een optie voor betalen per gebruik-facturering, zodat de kosten van oplossingen lineair worden geschaald.

Azure Synapse biedt een optie voor serverloze SQL-pools, zodat de rekenkracht voor de datawarehousingworkload op aanvraag kan worden uitgebreid. Als u Azure Synapse niet gebruikt voor andere downstreamgebruiksscenario's, kunt u serverloos gebruiken om de kosten te verlagen.

Zie Overzicht van de pijler kostenoptimalisatie voor meer strategieën voor kostenoptimalisatie.

Zie deze schatting in de Azure-prijscalculator voor prijzen voor de services die hier worden voorgesteld.

Prestatie-efficiëntie

Prestatie-efficiëntie is de mogelijkheid om op efficiënte wijze uw werkbelasting te schalen om te voldoen aan de vereisten die gebruikers eraan stellen. Zie overzicht van de pijler Prestatie-efficiëntie voor meer informatie.

De batch speech-API is ontworpen voor een groot volume, maar andere API's van Azure AI-services hebben mogelijk aanvraaglimieten voor elke abonnementslaag. Overweeg om deze API's te containeriseren om te voorkomen dat grote volumes worden verwerkt. Containers bieden u flexibiliteit in de implementatie, in de cloud of on-premises. U kunt ook bijwerkingen van nieuwe versie-implementaties beperken met behulp van containers. Zie Containerondersteuning in Azure AI-services voor meer informatie.

Medewerkers

Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.

Belangrijkste auteurs:

Andere inzender:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen