Che cos'è il riconoscimento delle entità denominato personalizzato?

Articolo
12/19/2023

Il NER personalizzato è una delle funzionalità personalizzate offerte dal linguaggio di intelligenza artificiale di Azure. Si tratta di un servizio API basato sul cloud che applica l'intelligence di Machine Learning per consentire di creare modelli personalizzati per attività di riconoscimento delle entità denominate personalizzate.

Il NER personalizzato consente agli utenti di creare modelli di intelligenza artificiale personalizzati per estrarre entità specifiche del dominio dal testo non strutturato, ad esempio contratti o documenti finanziari. Creando un progetto NER personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderlo disponibile per l'utilizzo. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente con il servizio seguendo i passaggi descritti in questa guida introduttiva.

Questa documentazione contiene i tipi di articolo seguenti:

Le guide introduttive sono istruzioni introduttive per guidare le richieste al servizio.
I concetti forniscono spiegazioni delle funzionalità e delle funzionalità del servizio.
Le guide su come contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.

Esempi di scenari d'uso

Il riconoscimento personalizzato delle entità denominato può essere usato in più scenari in diversi settori:

Estrazione di informazioni

Molte organizzazioni finanziarie e legali estraggono e normalizzano i dati da migliaia di origini di testo complesse e non strutturate su base giornaliera. Tali fonti includono dichiarazioni bancarie, contratti legali o moduli bancari. Ad esempio, l'estrazione dei dati dell'applicazione ipoteca eseguita manualmente dai revisori umani può richiedere diversi giorni per estrarre. L'automazione di questi passaggi creando un modello NER personalizzato semplifica il processo e consente di risparmiare costi, tempo e sforzo.

Knowledge mining per migliorare/arricchire la ricerca semantica

La ricerca è fondamentale per qualsiasi app che superfici il contenuto di testo agli utenti. Gli scenari comuni includono la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il data mining per l'analisi scientifica dei dati. Molte aziende in vari settori vogliono creare un'esperienza di ricerca avanzata su contenuti privati, eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare il NER personalizzato per estrarre entità dal testo pertinente al proprio settore. Queste entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Controllo e conformità

Anziché esaminare manualmente i file di testo significativamente lunghi per controllare e applicare criteri, i reparti IT nelle aziende finanziarie o legali possono usare il NER personalizzato per creare soluzioni automatizzate. Queste soluzioni possono essere utili per applicare i criteri di conformità e configurare regole aziendali necessarie in base alle pipeline di knowledge mining che elaborano contenuti strutturati e non strutturati.

Ciclo di vita dello sviluppo del progetto

L'uso di NER personalizzato prevede in genere diversi passaggi.

Definire lo schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.
Etichettare i dati: l'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. Etichettare esattamente, coerentemente e completamente.
1. Etichettare esattamente: etichettare ogni entità nel tipo corretto sempre. Includere solo gli elementi da estrarre, evitando dati non necessari nelle etichette.
2. Etichetta in modo coerente: la stessa entità deve avere la stessa etichetta in tutti i file.
3. Etichetta completamente: etichettare tutte le istanze dell'entità in tutti i file.
Eseguire il training del modello: il modello inizia a imparare dai dati etichettati.
Visualizzare le prestazioni del modello: dopo aver completato il training, visualizzare i dettagli di valutazione del modello, le relative prestazioni e indicazioni su come migliorarlo.
Distribuire il modello: la distribuzione di un modello lo rende disponibile per l'uso tramite l'API Analizza.
Estrarre entità: usare i modelli personalizzati per le attività di estrazione delle entità.

Documentazione di riferimento e esempi di codice

Quando si usa NER personalizzato, vedere la documentazione di riferimento e gli esempi seguenti per Il linguaggio di intelligenza artificiale di Azure:

Opzione di sviluppo/linguaggio	Documentazione di riferimento	Esempi
API REST (creazione)	Documentazione dell'API REST
API REST (Runtime)	Documentazione dell'API REST
C# (runtime)	Documentazione di C#	Esempi per C#
Java (Runtime)	Documentazione java	Esempi di Java
JavaScript (Runtime)	Documentazione di JavaScript	Esempi JavaScript
Python (runtime)	Documentazione di Python	Esempi per Python

IA responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo useranno, le persone che saranno interessate da esso e l'ambiente in cui viene distribuito. Leggere la nota sulla trasparenza per il NER personalizzato per informazioni sull'uso e la distribuzione dell'intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere anche gli articoli seguenti:

Passaggi successivi

Usare l'articolo di avvio rapido per iniziare a usare il riconoscimento di entità denominato personalizzato.
Durante il ciclo di vita dello sviluppo del progetto, vedere il glossario per altre informazioni sui termini usati in tutta la documentazione per questa funzionalità.
Ricordarsi di visualizzare i limiti del servizio per informazioni quali disponibilità a livello di area.

Share via