Condividi tramite


Client di inserimento con i servizi di intelligenza artificiale di Azure

Il client di inserimento è uno strumento rilasciato da Microsoft su GitHub che consente di distribuire rapidamente una soluzione di trascrizione del call center in Azure con un approccio senza codice.

Suggerimento

È possibile usare lo strumento e la soluzione risultante nell'ambiente di produzione per elaborare un volume elevato di audio.

Il client di inserimento usa il linguaggio di intelligenza artificiale di Azure, il riconoscimento vocale di Intelligenza artificiale di Azure, l'archiviazione di Azure e Funzioni di Azure.

Introduzione al client di inserimento

Per eseguire il client di inserimento sono necessari un account Azure e una risorsa di servizi di intelligenza artificiale di Azure multiservizio.

Per informazioni su come configurare e usare lo strumento, vedere la Guida introduttiva per il client di inserimento in GitHub.

Funzionalità client di inserimento

Il client di inserimento funziona connettendo un account di archiviazione di Azure dedicato a Funzioni di Azure personalizzate in modo serverless per passare le richieste di trascrizione al servizio. I file audio trascritti arrivano nel contenitore di Archiviazione di Azure dedicato.

Importante

I prezzi variano a seconda della modalità di funzionamento (batch e in tempo reale) e dello SKU della funzione di Azure selezionato. Per impostazione predefinita, lo strumento creerà uno SKU della funzione di Azure Premium per gestire volumi di grandi dimensioni. Per altre informazioni, visitare la pagina dei prezzi.

Internamente, lo strumento usa i servizi voce e lingua e segue le procedure consigliate per gestire la scalabilità orizzontale, i tentativi e il failover. Lo schema seguente descrive le risorse e le connessioni.

Diagram that shows the Ingestion Client Architecture.

La funzionalità del servizio Voce seguente viene usata dal client di inserimento:

  • Riconoscimento vocale in batch: trascrivere grandi quantità di file audio in modo asincrono, inclusa la diarizzazione dell'altoparlante, e viene in genere usata in scenari di analisi post-chiamata. La diarizzazione è il processo di riconoscimento e separazione dei parlanti nei dati audio mono canale.

Ecco alcune funzionalità del servizio di linguaggio usate dal client di inserimento:

Oltre ai servizi di Intelligenza artificiale di Azure, questi prodotti Azure vengono usati per completare la soluzione:

  • Archiviazione di Azure: usata per archiviare i dati di telefonia e le trascrizioni restituite dall'API di trascrizione batch. Questo account di archiviazione deve usare le notifiche, in particolare quando vengono aggiunti nuovi file. Queste notifiche vengono usate per attivare il processo di trascrizione.
  • Funzioni di Azure: usate per creare l'URI di firma di accesso condiviso per ogni registrazione e attivare la richiesta POST HTTP per avviare una trascrizione. Inoltre, Funzioni di Azure consente di creare richieste per recuperare ed eliminare trascrizioni usando l'API di trascrizione batch.

Personalizzazione degli strumenti

Lo strumento è progettato per mostrare rapidamente i risultati dei clienti. È possibile personalizzare lo strumento in base agli SKU e alla configurazione preferiti. Gli SKU possono essere modificati dal portale di Azure e il codice stesso è disponibile in GitHub.

Nota

È consigliabile creare le risorse nello stesso gruppo di risorse dedicato per comprendere e tenere traccia dei costi più facilmente.

Passaggi successivi