Che cos'è il riconoscimento delle entità denominato personalizzato (NER) (anteprima)?

Il NER personalizzato è una delle funzionalità offerte dal servizio cognitivo di Azure per la lingua. Si tratta di un servizio API basato sul cloud che applica l'intelligence di Machine Learning per consentire di creare modelli personalizzati per le attività di NER personalizzate.

Il NER personalizzato viene offerto come parte delle funzionalità personalizzate all'interno del servizio cognitivo di Azure per il linguaggio. Questa funzionalità consente agli utenti di creare modelli di intelligenza artificiale personalizzati per estrarre entità specifiche del dominio dal testo non strutturato, ad esempio contratti o documenti finanziari. Creando un progetto NER personalizzato, gli sviluppatori possono contrassegnarli in modo iterativo, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderlo disponibile per l'utilizzo. La qualità dei dati contrassegnati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente con il servizio seguendo i passaggi descritti in questa guida introduttiva.

Questa documentazione contiene i tipi di articolo seguenti:

  • Le guide introduttive sono istruzioni introduttive per guidare le richieste al servizio.
  • I concetti forniscono spiegazioni delle funzionalità e delle funzionalità del servizio.
  • Le guide su come contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.

Scenari di utilizzo di esempio

Estrazione di informazioni

Molte organizzazioni finanziarie e legali estraggono e normalizzare i dati da migliaia di testo non strutturati complessi, ad esempio dichiarazioni bancarie, accordi legali o moduli bancari su base giornaliera. Invece di elaborare manualmente questi moduli, il NER personalizzato può aiutare ad automatizzare questo processo e risparmiare costi, tempo e sforzo.

La ricerca è fondamentale per qualsiasi app che superfici contenuto di testo agli utenti, con scenari comuni, tra cui la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il data mining per l'analisi scientifica dei dati. Molte aziende in vari settori stanno esaminando un'esperienza di ricerca ricca su contenuti privati, eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare custom NER per estrarre entità dal testo pertinenti al proprio settore. Queste entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Controllo e conformità

Anziché esaminare manualmente i file di testo significativamente lunghi per controllare e applicare criteri, i reparti IT nelle aziende finanziarie o legali possono usare il NER personalizzato per creare soluzioni automatizzate. Queste soluzioni consentono di applicare i criteri di conformità e di configurare le regole aziendali necessarie in base alle pipeline di data mining di conoscenza che elaborano contenuti strutturati e non strutturati.

Ciclo di vita dello sviluppo di applicazioni

L'uso di Custom NER prevede in genere diversi passaggi.

The development lifecycle

  1. Definire lo schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.

  2. Contrassegnare i dati: l'assegnazione di tag ai dati è un fattore chiave per determinare le prestazioni del modello. Contrassegna esattamente, coerentemente e completamente.

    1. Tag precisamente: contrassegnare ogni entità al proprio tipo corretto sempre. Includere solo ciò che si vuole estrarre, evitare dati non necessari nel tag.
    2. Tag in modo coerente: la stessa entità deve avere lo stesso tag in tutti i file.
    3. Tag completamente: contrassegna tutte le istanze dell'entità in tutti i file.
  3. Eseguire il training del modello: il modello inizia a imparare dai dati contrassegnati.

  4. Visualizzare i dettagli della valutazione del modello: dopo aver completato il training, visualizzare i dettagli di valutazione del modello e le relative prestazioni.

  5. Migliorare il modello: dopo aver esaminato i dettagli della valutazione del modello, è possibile procedere e imparare a migliorare il modello.

  6. Distribuire il modello: la distribuzione di un modello consiste nel renderla disponibile per l'uso.

  7. Estrarre entità: usare i modelli personalizzati per le attività di estrazione delle entità.

Passaggi successivi