Modello di ricevuta di Intelligence sui documenti

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
  • La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
  • L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali2
  • Europa occidentale

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)segno di spunta bluv3.0 (GA)segno di spunta bluv2.1 (GA)

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav3.0 (GA) | Versioni più recenti:segno di spunta violav4.0 (anteprima)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav2.1 | Versione più recente:segno di spunta bluv4.0 (anteprima)

Il modello di ricevuta di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati.

Tipi di ricevuta supportati:

  • Termica
  • Carta di credito
  • Gas
  • Parcheggio
  • Hotel
  • Trasporto
  • Comunicazione
  • Entertainment
  • Biglietto aereo
  • Formazione
  • Farmacia/Medico

Estrazione dati ricevuta

La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie digitalizzate, fotografate e stampate, in un formato digitale per un'elaborazione downstream semplificata. Alcuni esempi includono gestione delle spese, analisi del comportamento dei consumatori, automazione fiscale e così via. L'uso di Document Intelligence con la tecnologia OCR (Optical Character Recognition) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L'elaborazione di Intelligence sui documenti semplifica il processo di conversione, ma riduce notevolmente il tempo e il lavoro richiesto, semplificando così una gestione efficiente dei dati e il recupero.

Conferma di esempio elaborata con Document Intelligence Studio:

Screenshot di una ricevuta di esempio elaborata in Document Intelligence Studio.

Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio di Document Intelligence:

Screenshot di una ricevuta di esempio elaborata con lo strumento Di etichettatura di esempio modulo.

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta predefinita

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta predefinita

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta predefinita

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di ricevuta Strumento di etichettatura
di Document Intelligence• API
REST• SDK
della libreria client• Contenitore Docker di Document Intelligence

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • Supporto per pdf e TIFF: Document Intelligence può elaborare fino a 2.000 pagine per sottoscrittori di livello standard o solo le prime due pagine per i sottoscrittori di livello gratuito.
  • Dimensioni del file supportate: minore di 50 MB; pixel minimo 50 x 50 px; pixel massimi 10.000 x 10.000 px.

Estrazione dei dati del modello di ricevuta

Scopri in che modo Document Intelligence estrae i dati, inclusi l'ora e la data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.

  1. Nella home page di Document Intelligence Studio selezionare Ricevute.

  2. È possibile analizzare la ricevuta di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa percorso di origine.

  6. Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.

    Screenshot del menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione di campi

Nome Tipo Descrizione Output standardizzato
ReceiptType String Tipo di ricevuta di vendita Dettagliata
MerchantName String Nome del commerciante che emette la ricevuta
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante +1 xxx xxx xxx xxxx
MerchantAddress String Indirizzo elencato del commerciante
TransactionDate Data Data di emissione della ricevuta aaaa-mm-gg
TransactionTime Time Ora di emissione della ricevuta hh-mm-ss (24 ore)
Totale Numero (USD) Totale totale transazioni di ricezione Float a due decimali
Subtotale Numero (USD) Subtotale della ricevuta, spesso prima dell'applicazione delle imposte Float a due decimali
Imposta Numero (USD) Imposta totale sulla ricevuta (spesso iva o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30. Float a due decimali
Suggerimento Numero (USD) Suggerimento incluso dall'acquirente Float a due decimali
Articoli Matrice di oggetti Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto
Nome string Descrizione dell'elemento. Rinominato in "Description" nella versione 2022-06-30.
Quantità Numero Quantità di ogni articolo Float a due decimali
Price Numero Prezzo singolo di ogni unità articolo Float a due decimali
TotalPrice Numero Prezzo totale della voce Float a due decimali

Document Intelligence v3.0 e versioni successive introducono diverse nuove funzionalità e funzionalità. Oltre alle ricevute termiche, il modello Di ricevuta supporta l'elaborazione delle ricevute di hotel a pagina singola e l'estrazione dei dettagli fiscali per tutti i tipi di ricevuta.

Document Intelligence v4.0 e versioni successive introduce il supporto per la valuta per tutti i campi correlati al prezzo per le ricevute termiche e alberghiere.

Ricevuta

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-3210
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
TransactionDate date Data di emissione della ricevuta 6 giugno 2019
TransactionTime time Ora di emissione della ricevuta 14:49
Subtotal number Subtotale della ricevuta, spesso prima dell'applicazione delle imposte $12,34
TotalTax number Imposta sulla ricevuta, spesso iva o equivalente $2,00
Tip number Suggerimento incluso dall'acquirente $ 1,00
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Surface Pro 6
Items.*.Quantity number Quantità di ogni articolo 1
Items.*.Price number Prezzo singolo di ogni unità articolo $ 999,00
Items.*.ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Items.*.QuantityUnit string Unità di quantità di ogni articolo
TaxDetails array
TaxDetails.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
TaxDetails.*.Amount currency Importo del dettaglio fiscale $ 999,00

receipt.retailMeal

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-3210
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
TransactionDate date Data di emissione della ricevuta 6 giugno 2019
TransactionTime time Ora di emissione della ricevuta 14:49
Subtotal number Subtotale della ricevuta, spesso prima dell'applicazione delle imposte $12,34
TotalTax number Imposta sulla ricevuta, spesso iva o equivalente $2,00
Tip number Suggerimento incluso dall'acquirente $ 1,00
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Surface Pro 6
Items.*.Quantity number Quantità di ogni articolo 1
Items.*.Price number Prezzo singolo di ogni unità articolo $ 999,00
Items.*.ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Items.*.QuantityUnit string Unità di quantità di ogni articolo
TaxDetails array
TaxDetails.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
TaxDetails.*.Amount currency Importo del dettaglio fiscale $ 999,00

receipt.creditCard

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-3210
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
TransactionDate date Data di emissione della ricevuta 6 giugno 2019
TransactionTime time Ora di emissione della ricevuta 14:49
Subtotal number Subtotale della ricevuta, spesso prima dell'applicazione delle imposte $12,34
TotalTax number Imposta sulla ricevuta, spesso iva o equivalente $2,00
Tip number Suggerimento incluso dall'acquirente $ 1,00
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Surface Pro 6
Items.*.Quantity number Quantità di ogni articolo 1
Items.*.Price number Prezzo singolo di ogni unità articolo $ 999,00
Items.*.ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Items.*.QuantityUnit string Unità di quantità di ogni articolo
TaxDetails array
TaxDetails.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
TaxDetails.*.Amount currency Importo del dettaglio fiscale $ 999,00

receipt.gas

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-3210
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
TransactionDate date Data di emissione della ricevuta 6 giugno 2019
TransactionTime time Ora di emissione della ricevuta 14:49
Subtotal number Subtotale della ricevuta, spesso prima dell'applicazione delle imposte $12,34
TotalTax number Imposta sulla ricevuta, spesso iva o equivalente $2,00
Tip number Suggerimento incluso dall'acquirente $ 1,00
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Surface Pro 6
Items.*.Quantity number Quantità di ogni articolo 1
Items.*.Price number Prezzo singolo di ogni unità articolo $ 999,00
Items.*.ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Items.*.QuantityUnit string Unità di quantità di ogni articolo
TaxDetails array
TaxDetails.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
TaxDetails.*.Amount currency Importo del dettaglio fiscale $ 999,00

receipt.parking

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-3210
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
TransactionDate date Data di emissione della ricevuta 6 giugno 2019
TransactionTime time Ora di emissione della ricevuta 14:49
Subtotal number Subtotale della ricevuta, spesso prima dell'applicazione delle imposte $12,34
TotalTax number Imposta sulla ricevuta, spesso iva o equivalente $2,00
Tip number Suggerimento incluso dall'acquirente $ 1,00
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Surface Pro 6
Items.*.Quantity number Quantità di ogni articolo 1
Items.*.Price number Prezzo singolo di ogni unità articolo $ 999,00
Items.*.ProductCode string Codice prodotto, numero di prodotto o SKU associato all'elemento di riga specifico A123
Items.*.QuantityUnit string Unità di quantità di ogni articolo
TaxDetails array
TaxDetails.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
TaxDetails.*.Amount currency Importo del dettaglio fiscale $ 999,00

receipt.hotel

Campo Tipo Descrizione Esempio
MerchantName string Nome del commerciante che emette la ricevuta Contoso
MerchantPhoneNumber phoneNumber Numero di telefono elencato del commerciante 987-654-310
MerchantAddress address Indirizzo elencato del commerciante 123 Main St. Redmond, Washington 98052
Total number Totale totale transazioni di ricezione $14,34
ArrivalDate date Data di arrivo 27Mar21
DepartureDate date Data di partenza 28Mar21
Currency string Unità valuta degli importi ricevuti (ISO 4217) o 'MIXED' se vengono trovati più valori USD
MerchantAliases array
MerchantAliases.* string Nome alternativo del commerciante Contoso (R)
Items array
Items.* object Voce estratta 1
Surface Pro 6
$ 999,00
$ 999,00
Items.*.TotalPrice number Prezzo totale della voce $ 999,00
Items.*.Description string Descrizione articolo Addebito sala
Items.*.Date date Data articolo 27Mar21
Items.*.Category string Categoria di elementi Club

Guida alla migrazione e API REST v3.1

  • Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.1 nelle applicazioni e nei flussi di lavoro.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.

  • Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.