riconoscimento modulo modello di documento generale (anteprima)

Il modello generale di anteprima dei documenti combina potenti funzionalità OCR (Optical Character Recognition) con modelli di Deep Learning per estrarre coppie chiave-valore ed entità dai documenti. Il documento generale è disponibile solo con l'API di anteprima (v3.0). Per altre informazioni sull'uso dell'API di anteprima (v3.0), vedere la guida alla migrazione.

L'API documento generale supporta la maggior parte dei tipi di modulo e analerà i documenti e associerà i valori alle chiavi e alle voci alle tabelle individuate. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.

Funzionalità generali dei documenti

  • Non è necessario eseguire il training di un modello personalizzato per estrarre coppie chiave-valore.

  • Una singola API viene usata per estrarre coppie chiave-valore, entità, testo, tabelle e struttura dai documenti.

  • Si tratta di un modello con training preliminare di cui verrà eseguito periodicamente il training sui nuovi dati per migliorare la copertura e l'accuratezza.

  • Il modello di documento generale supporta dati strutturati, semistrutturati e non strutturati.

Documento di esempio elaborato in riconoscimento modulo Studio

Screenshot: general document analysis in the Form Recognizer Studio.

Opzioni di sviluppo

Le risorse seguenti sono supportate da riconoscimento modulo v3.0:

Funzionalità Risorse
🆕 modello di documento Generale

Provare Riconoscimento modulo

Vedere come i dati, incluse tabelle, valori ed entità, vengono estratti da moduli e documenti usando riconoscimento modulo Studio o lo strumento di etichettatura di esempio. Sono necessari gli elementi seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Istanza riconoscimento modulo nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave API e l'endpoint.

Screenshot: keys and endpoint location in the Azure portal.

riconoscimento modulo Studio (anteprima)

Nota

riconoscimento modulo Studio e il modello di documento generale sono disponibili con l'API di anteprima (v3.0).

  1. Nella pagina riconoscimento modulo Studio home page selezionare Documenti generali

  2. È possibile analizzare il documento di esempio o selezionare il pulsante + Aggiungi per caricare il proprio esempio.

  3. Selezionare il pulsante Analizza:

    Screenshot: analyze general document menu.

Coppie chiave-valore

Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un formato strutturato, potrebbe trattarsi dell'etichetta e del valore immesso dall'utente per il campo o in un documento non strutturato, a seconda della data in cui è stato eseguito un contratto in base al testo di un paragrafo. Il training del modello di intelligenza artificiale consente di estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documenti, formati e strutture.

Le chiavi possono anche esistere in isolamento quando il modello rileva l'esistenza di una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un secondo campo del nome può essere lasciato vuoto in un modulo in alcuni casi. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento e se si dispone di documenti in cui lo stesso valore è descritto in modi diversi, ad esempio un cliente o un utente, la chiave associata sarà cliente o utente in base al contenuto del documento.

Entità

I modelli di elaborazione del linguaggio naturale possono identificare parti del parlato e classificare ogni token o parola. Il modello di riconoscimento delle entità denominate è in grado di identificare entità come persone, località e date per offrire un'esperienza più ricca. L'identificazione di entità consente di distinguere tra tipi di clienti, ad esempio un singolo utente o un'organizzazione. Il modello di estrazione della coppia di valori chiave e il modello di identificazione dell'entità vengono eseguiti in parallelo sull'intero documento e non solo sui valori delle coppie chiave-valore estratte. Ciò garantisce che le strutture complesse in cui non è possibile identificare una chiave siano ancora arricchite identificando le entità a cui si fa riferimento. È comunque possibile associare chiavi o valori alle entità in base agli offset degli intervalli identificati.

  • Il documento generale è un modello con training preliminare e può essere richiamato direttamente tramite l'API REST.

  • Il modello di documento generale supporta il riconoscimento di entità denominate (NER) per diverse categorie di entità. NER è la possibilità di identificare entità diverse nel testo e classificarle in classi o tipi predefiniti, ad esempio: persona, posizione, evento, prodotto e organizzazione. L'estrazione di entità può essere utile negli scenari in cui si vogliono convalidare i valori estratti. Le entità vengono estratte dall'intero contenuto e non solo dai valori estratti.

Estrazione dei dati del modello di documento generale

Modello Estrazione di testo Coppie chiave-valore Segni di selezione Tabelle Entità
Documento generale

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
  • Formati di file supportati: JPEG, PNG, BMP, TIFF e PDF (incorporati o analizzati). I FILE PDF incorporati nel testo sono la soluzione migliore per eliminare la possibilità di errori nell'estrazione e nella posizione dei caratteri.
  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
  • Le dimensioni del file devono essere inferiori a 50 MB.
  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10000 x 10000 pixel.
  • Le dimensioni pdf sono fino a 17 x 17 pollici, corrispondenti al formato carta Legal o A3 o inferiori.
  • Le dimensioni totali dei dati di training sono pari o inferiori a 500 pagine.
  • Se i FILE PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
  • Per l'apprendimento senza supervisione (senza dati etichettati):
    • I dati devono contenere chiavi e valori.
    • Le chiavi devono essere visualizzate sopra o a sinistra dei valori. non possono essere visualizzate sotto o a destra.

Lingue e impostazioni locali supportate

Modellare Lingua: codice delle impostazioni locali Predefinito
Documento generale
  • Inglese (Stati Uniti)—en-US
Inglese (Stati Uniti)—en-US

Categorie di riconoscimento di entità denominate (NER)

Category Type Descrizione
Persona string Nome parziale o completo di una persona.
PersonType string Tipo di lavoro o ruolo di una persona.
Posizione string Luoghi naturali, strutture, caratteristiche geografiche ed entità geopolitiche.
Organization string Aziende, gruppi politiche, bande musicali, club dello sport, enti pubblici e organizzazioni pubbliche.
Evento string Eventi cronologici, sociali e naturali.
Prodotto string Oggetti fisici di varie categorie.
Competenza string Funzionalità, competenza o competenza.
Indirizzo string Indirizzi postali completi.
Numero di telefono string Telefono numeri.
E-mail string Indirizzo di posta elettronica.
URL string URL e collegamenti del sito Web.
Indirizzo IP string Indirizzi IP di rete.
Datetime string Date e ore del giorno.
Quantità string Misure e unità numeriche.

Considerazioni

  • L'estrazione di entità può essere utile negli scenari in cui si vogliono convalidare i valori estratti. Le entità vengono estratte sull'intero contenuto dei documenti e non solo sui valori estratti.

  • Le chiavi sono intervalli di testo estratti dal documento. Per i documenti semistrutturati potrebbe essere necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.

  • Si prevede di visualizzare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.

Passaggi successivi