Condividi tramite


Modello di biglietto da visita di Document Intelligence

Importante

A partire da Document Intelligence v4.0 (anteprima) e in futuro, il modello di biglietto da visita (predefinito-businessCard) è deprecato. Per estrarre i dati dai formati di biglietti da visita, usare quanto segue:

Funzionalità versione Model ID
Modello di biglietto da visita • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav3.0 (GA) | Versioni più recenti:segno di spunta violav4.0 (anteprima)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav2.1 | Versione più recente:segno di spunta bluv4.0 (anteprima)

Il modello di biglietto da visita di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre dati da immagini di biglietti da visita. L'API analizza i biglietti da visita stampati; estrae informazioni chiave come nome, cognome, nome della società, indirizzo di posta elettronica e numero di telefono; e restituisce una rappresentazione di dati JSON strutturata.

Estrazione di dati dai biglietti da visita

I biglietti da visita sono un ottimo modo per rappresentare un'azienda o un professionista. Il logo aziendale, i tipi di carattere e le immagini di sfondo presenti nei biglietti da visita aiutano a promuovere il marchio aziendale e a distinguerlo dagli altri. L'applicazione di tecniche basate su OCR e apprendimento automatico per automatizzare la digitalizzazione dei biglietti da visita è uno scenario comune di elaborazione delle immagini. I sistemi aziendali usati dai team di vendita e marketing in genere integrano la funzionalità di estrazione dei dati di biglietti da visita a vantaggio degli utenti.

Biglietto da visita di esempio elaborato con Document Intelligence Studio

Screenshot di un biglietto da visita di esempio analizzato in Document Intelligence Studio.

Opzioni di sviluppo

Document Intelligence v3.1:2023-07-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di biglietto da visita Document Intelligence Studio
API REST
SDK C#
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Document Intelligence v3.0:2022-08-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di biglietto da visita Document Intelligence Studio
API REST
SDK C#
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Document Intelligence v2.1 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di biglietto da visita Strumento di etichettatura di Document Intelligence
API REST
SDK della libreria client
Contenitore Docker di Document Intelligence

Provare l'estrazione di dati dai biglietti da visita

Vedere in che modo i dati, tra cui nome, posizione, indirizzo, posta elettronica e nome dell'azienda, vengono estratti dai biglietti da visita. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Document Intelligence Studio

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0.

  1. Nella home page di Document Intelligence Studio selezionare Biglietti da visita.

  2. È possibile analizzare il biglietto da visita di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

  1. Passare allo strumento di esempio di intelligence per i documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

  3. Selezionare il Tipo di modulo da analizzare nel menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa percorso di origine.

  6. Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.

  7. Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.

    Screenshot del menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di biglietti da visita.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.

Requisiti di input

  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB con un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF
  • PDF e TIFF, vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
  • Le dimensioni del file devono essere inferiori a 50 MB e le dimensioni devono essere comprese tra almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Supporto lingua .

Estrazione dei campi

Nome Tipo Descrizione Output standardizzato
ContactNames Matrice di oggetti Nome contatto
Nome String Nome proprio del contatto
Cognome String Cognome del contatto
CompanyNames Matrice di stringhe Nome della società
Reparti Matrice di stringhe Reparto o organizzazione del contatto
JobTitles Matrice di stringhe Posizione del contatto
Messaggi e-mail Matrice di stringhe Contact email address (Indirizzo di posta elettronica del contatto)
Siti Web Matrice di stringhe Sito Web della società
Indirizzi Matrice di stringhe Indirizzo estratto dal biglietto da visita
MobilePhones Matrice di numeri di telefono Numero di telefono cellulare dal biglietto da visita +1 xxx xxx xxxx
Fax Matrice di numeri di telefono Numero di telefono fax dal biglietto da visita +1 xxx xxx xxxx
WorkPhones Matrice di numeri di telefono Numero di telefono aziendale dal biglietto da visita +1 xxx xxx xxxx
OtherPhones Matrice di numeri di telefono Altro numero di telefono dal biglietto da visita +1 xxx xxx xxxx

Campi estratti

Nome Tipo Descrizione Testo
ContactNames matrice di oggetti Nome del contatto estratto dal biglietto da visita [{ "FirstName": "John", "LastName": "Doe" }]
Nome string Nome proprio del contatto "John"
Cognome string Cognome del contatto "Doe"
CompanyNames matrice di stringhe Nome dell'azienda estratto dal biglietto da visita ["Contoso"]
Reparti matrice di stringhe Reparto o organizzazione del contatto ["R&D"]
JobTitles matrice di stringhe Posizione del contatto ["Software Engineer"]
Messaggi e-mail matrice di stringhe Indirizzo di posta elettronica del contatto estratto dal biglietto da visita [""johndoe@contoso.com]
Siti Web matrice di stringhe Sito Web estratto dal biglietto da visita ["https://www.contoso.com"]
Indirizzi matrice di stringhe Indirizzo estratto dal biglietto da visita ["123 Main Street, Redmond, Washington 98052"]
MobilePhones Matrice di numeri di telefono Numero di telefono cellulare estratto del biglietto da visita ["+19876543210"]
Fax Matrice di numeri di telefono Numero di fax estratto del biglietto da visita ["+19876543211"]
WorkPhones Matrice di numeri di telefono Numero di telefono ufficio estratto del biglietto da visita ["+19876543231"]
OtherPhones Matrice di numeri di telefono Altro numero di telefono estratto del biglietto da visita ["+19876543233"]

Impostazioni locali supportate

I biglietti da visita predefiniti v2.1 supportano le impostazioni locali seguenti:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

Guida alla migrazione e API REST v3.1

  • Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.