Come usare l'analisi automatica per la classificazione del testo personalizzata

Il processo di etichettatura è una parte importante della preparazione del set di dati. Poiché questo processo richiede molto tempo e impegno, è possibile usare la funzionalità di creazione automatica delle etichette per etichettare automaticamente i documenti con le classi in cui vuoi classificarle. È attualmente possibile avviare processi di compilazione automatica in base a un modello usando modelli GPT in cui è possibile attivare immediatamente un processo di compilazione automatica senza alcun training del modello precedente. Questa funzionalità consente di risparmiare tempo e impegno per l'etichettatura manuale dei documenti.

Prerequisiti

Prima di poter usare illabeling automatico con GPT, è necessario:

  • Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato.
  • Dati di testo caricati nell'account di archiviazione.
  • Nomi di classe significativi. I modelli GPT etichettano i documenti in base ai nomi delle classi fornite.
  • I dati etichettati non sono obbligatori.
  • Una risorsa e una distribuzione di Azure OpenAI.

Attivare un processo di compilazione automatica

Quando si attiva un processo di compilazione automatica con GPT, viene addebitato l'addebito per la risorsa OpenAI di Azure in base al consumo. Viene addebitata una stima del numero di token in ogni documento etichettata automaticamente. Fare riferimento alla pagina dei prezzi di Azure OpenAI per una suddivisione dettagliata dei prezzi per token di modelli diversi.

  1. Nel menu di spostamento a sinistra selezionare Etichettatura dati.

  2. Selezionare il pulsante Etichetta automatica nel riquadro Attività a destra della pagina.

    Screenshot che mostra come attivare un processo autotag dal riquadro attività.

  3. Scegliere Etichetta automatica con GPT e selezionare Avanti.

    Screenshot che mostra la scelta del modello per l'etichettatura automatica.

  4. Scegliere la risorsa e la distribuzione di Azure OpenAI. Per continuare, è necessario creare una risorsa OpenAI di Azure e distribuire un modello .

    Screenshot che mostra come scegliere la risorsa e le distribuzioni OpenAI

  5. Selezionare le classi da includere nel processo di formattazione automatica. Per impostazione predefinita, vengono selezionate tutte le classi. È consigliabile avere nomi descrittivi per le classi e includere esempi per ogni classe per ottenere un'etichettatura di qualità ottimale con GPT.

    Screenshot che mostra le etichette da includere nel processo autotag.

  6. Scegliere i documenti da etichettare automaticamente. È consigliabile scegliere i documenti senza etichetta dal filtro.

    Nota

    • Se un documento è stato etichettato automaticamente, ma questa etichetta è già stata definita dall'utente, viene usata solo l'etichetta definita dall'utente.
    • È possibile visualizzare i documenti facendo clic sul nome del documento.

    Screenshot che mostra i documenti da includere nel processo autotag.

  7. Selezionare Avvia processo per attivare il processo di compilazione automatica. Si dovrebbe essere indirizzati alla pagina di compilazione automatica in cui vengono visualizzati i processi di creazione automatica dellabazione automatica avviati. La creazione automatica dei processi può richiedere da pochi secondi a pochi minuti, a seconda del numero di documenti inclusi.

    Screenshot che mostra la schermata di revisione per un processo autotag.


Esaminare i documenti con etichetta automatica

Al termine del processo di compilazione automatica, è possibile visualizzare i documenti di output nella pagina Etichettatura dati di Language Studio. Selezionare Rivedi documenti con etichette automatici per visualizzare i documenti con il filtro etichettato automaticamente applicato.

Screenshot che mostra i documenti con etichetta automatica

I documenti classificati automaticamente hanno etichette suggerite nel riquadro attività evidenziato in viola. Ogni etichetta suggerita ha due selettori (un segno di spunta e un'icona di annullamento) che consentono di accettare o rifiutare l'etichetta automatica.

Una volta accettata un'etichetta, il colore viola passa a quello blu predefinito e l'etichetta viene inclusa in qualsiasi altro training del modello diventando un'etichetta definita dall'utente.

Dopo aver accettato o rifiutato le etichette per i documenti etichettati automaticamente, selezionare Salva etichette per applicare le modifiche.

Nota

  • È consigliabile convalidare i documenti etichettati automaticamente prima di accettarli.
  • Tutte le etichette non accettate vengono eliminate durante il training del modello.

Screenshot che mostra come accettare e rifiutare documenti con etichetta automatica.

Passaggi successivi