Modello di documento generale di Intelligence sui documenti
Importante
A partire dalle versioni di Document Intelligence 2024-02-29-preview, 2023-10-31-preview e in futuro, il modello di documento generale (precompilt-document) è deprecato. Per estrarre coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti, usare i modelli seguenti:
Funzionalità | versione | Model ID |
---|---|---|
Layout modello con il parametro features=keyValuePairs facoltativo della stringa di query abilitato. |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Modello Documento generale | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versione precedente:v3.0
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1
Il modello di documento Generale combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per estrarre coppie chiave-valore, tabelle e segni di selezione dai documenti. Il documento generale è disponibile con le API v3.1 e v3.0. Per altre informazioni, vedere la guida alla migrazione.
Funzionalità del documento generale
Il modello di documento generale è un modello già sottoposto a training che non richiede etichette o training.
Una singola API estrae coppie chiave/valore, segni di selezione, tabelle e struttura dai documenti.
Il modello di documento generale supporta documenti strutturati, semistrutturati e non strutturati.
I segni di selezione vengono identificati come campi con un valore pari
:selected:
a o:unselected:
.
Documento di esempio elaborato in Document Intelligence Studio
Estrazione di coppie chiave-valore
L'API del documento generale supporta la maggior parte dei tipi di modulo e analizza i documenti, quindi estrae le chiavi e i valori associati. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.
Opzioni di sviluppo
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento generale | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-document |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento generale | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-document |
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
Estrazione dei dati generali del modello di documento
Provare a estrarre dati da moduli e documenti usando Document Intelligence Studio.
Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Nota
Document Intelligence Studio e il modello di documento generale sono disponibili con l'API v3.0.
Nella home page di Document Intelligence Studio selezionare Documenti generali.
È possibile analizzare il documento di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:
Coppie chiave-valore
Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un modulo strutturato, queste coppie possono essere l'etichetta e il valore immessi dall'utente per tale campo. In un documento non strutturato, possono essere la data di esecuzione di un contratto o possono essere basate sul testo di un paragrafo. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi, formati e strutture di documenti.
Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave senza alcun valore associato o quando vengono elaborati campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).
Estrazione dei dati
Modello | Estrazione di testo | Coppie chiave-valore | Segni di selezione | Tabelle | Nomi comuni |
---|---|---|---|---|---|
Documento generale | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* - Disponibile solo nelle versioni API (versione 3.1 ga) e versioni successive dell'API 2023-07-31
.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina Supporto linguistico - Modelli di analisi dei documenti.
Considerazioni
Poiché le chiavi sono intervalli di testo estratti dal documento, per documenti semistrutturati, è necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.
È possibile riscontrare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.