Che cos'è la classificazione del testo personalizzata (anteprima)?

La classificazione del testo personalizzata è una delle funzionalità offerte da Servizi cognitivi di Azure per la lingua. Si tratta di un servizio API basato sul cloud che applica l'intelligenza di Machine Learning per consentire di creare modelli personalizzati per le attività di classificazione del testo.

La classificazione del testo personalizzata viene offerta come parte delle funzionalità personalizzate all'interno di Cognitive for Language di Azure. Questa funzionalità consente agli utenti di creare modelli di intelligenza artificiale personalizzati per classificare il testo in categorie personalizzate predefinite dall'utente. Creando un progetto di classificazione del testo personalizzato, gli sviluppatori possono contrassegnarlo in modo iterativo, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderlo disponibile per l'utilizzo. La qualità dei dati con tag influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in questa guida introduttiva.

La classificazione del testo personalizzata supporta due tipi di progetti:

  • Classificazione con etichetta singola : è possibile assegnare una singola classe per ogni file del set di dati. Ad esempio, uno script di film può essere classificato solo come "Azione" o "Thriller".
  • Classificazione di più etichette : è possibile assegnare più classi per ogni file del set di dati. Ad esempio, uno script di film può essere classificato come "Azione" o "Azione e Thriller".

Questa documentazione contiene i tipi di articolo seguenti:

Scenari di utilizzo di esempio

Messaggi di posta elettronica/valutazione automatica dei ticket

I centri di supporto di tutti i tipi ricevono migliaia di migliaia di messaggi di posta elettronica/ticket contenenti testo non strutturato, in formato libero e allegati. La revisione, il riconoscimento e il routing tempestivi agli esperti in materia all'interno dei team interni è fondamentale. Tuttavia, la valutazione della posta elettronica su questa scala coinvolge le persone a rivedere e instradare i reparti giusti richiede tempo e risorse preziose. La classificazione del testo personalizzata può essere usata per analizzare la valutazione del testo in ingresso e classificare il contenuto da instradare automaticamente al reparto pertinente per eseguire le azioni necessarie.

La ricerca è fondamentale per le app che visualizzano contenuto di testo agli utenti, con scenari comuni, tra cui: ricerca di cataloghi o documenti, ricerca di prodotti al dettaglio o knowledge mining per data science. Molte aziende in vari settori stanno cercando di creare un'esperienza di ricerca avanzata su contenuti privati ed eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare la classificazione del testo personalizzata per classificare il testo in classi rilevanti per il proprio settore. Le classi stimate possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

ciclo di vita di sviluppo Project

La creazione di un progetto di classificazione del testo personalizzato prevede in genere diversi passaggi.

The development lifecycle

Per sfruttare al meglio il modello, seguire questa procedura:

  1. Definire lo schema: conoscere i dati e identificare le classi tra cui distinguere, evitare ambiguità.

  2. Dati tag: la qualità dell'assegnazione di tag ai dati è un fattore chiave per determinare le prestazioni del modello. Contrassegnare tutti i file da includere nel training. I file che appartengono alla stessa classe devono avere sempre la stessa classe, se è presente un file che può rientrare in due classi usano più progetti di classificazione classi. Evitare ambiguità di classe, assicurarsi che le classi siano chiaramente separabili l'una dall'altra, in particolare con i progetti di classificazione di classi Single.

  3. Eseguire il training del modello: il modello inizia l'apprendimento dai dati con tag.

  4. Visualizzare i dettagli di valutazione del modello: visualizzare i dettagli di valutazione per il modello per determinare il grado di prestazioni quando vengono introdotti nuovi dati.

  5. Migliorare il modello: è possibile migliorare le prestazioni del modello esaminando le stime del modello non corrette ed esaminando la distribuzione dei dati.

  6. Distribuire il modello: la distribuzione di un modello lo rende disponibile per l'uso tramite l'API Analizza.

  7. Classificare il testo: usare il modello personalizzato per le attività di classificazione del testo.

Passaggi successivi