Introduzione: Document Intelligence Studio

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)segno di spunta bluv3.0 (GA)

Document Intelligence Studio è uno strumento online per esplorare, comprendere e integrare visivamente le funzionalità del servizio Document Intelligence nelle applicazioni. È possibile iniziare esplorando i modelli già sottoposti a training con esempi o documenti personalizzati. È anche possibile creare progetti per creare modelli personalizzati e farvi riferimento nelle applicazioni usando Python SDK e altre guide di avvio rapido.

Prerequisiti per i nuovi utenti

Suggerimento

Creare una risorsa dei servizi di intelligenza artificiale di Azure se si prevede di accedere a più servizi di intelligenza artificiale di Azure con un singolo endpoint/chiave. Solo per l'accesso a Document Intelligence, creare una risorsa di Document Intelligence. Si noti che è necessaria una risorsa a servizio singolo se si intende usare l'autenticazione Microsoft Entra.

Assegnazioni di ruolo di Azure

Per l'analisi dei documenti e i modelli predefiniti, sono necessarie le assegnazioni di ruolo seguenti per scenari diversi.

  • Base
    • Utente di Servizi cognitivi: è necessario questo ruolo per documentare intelligence o la risorsa dei servizi di intelligenza artificiale di Azure per immettere la pagina di analisi.
  • Avanzate
    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse, un servizio Di Intelligence documenti o una risorsa dei servizi di intelligenza artificiale di Azure.

Modelli

I modelli predefiniti consentono di aggiungere funzionalità di Document Intelligence alle app senza dover compilare, eseguire il training e pubblicare modelli personalizzati. È possibile scegliere tra diversi modelli predefiniti, ognuno dei quali ha un proprio set di campi dati supportati. La scelta del modello da usare per l'operazione di analisi dipende dal tipo di documento da analizzare. Document Intelligence supporta attualmente i modelli predefiniti seguenti:

Analisi dei documenti

  • Layout: consente di estrarre testo, tabelle, indicatori di selezione e informazioni sulla struttura da documenti (PDF, TIFF) e immagini (JPG, PNG, BMP).
  • Lettura: consente di estrarre righe di testo, parole, le relative posizioni, le lingue rilevate e lo stile di scrittura a mano se rilevato da documenti (PDF, TIFF) e immagini (JPG, PNG, BMP).

Predefinito

  • Fattura: consente di estrarre testo, indicatori di selezione, tabelle, coppie chiave-valore e informazioni chiave dalle fatture.
  • Ricevuta: consente di estrarre testo e informazioni chiave dalle ricevute.
  • Tessera sanitaria: consente di estrarre assicuratore, membro, prescrizione, numero di gruppo e altre informazioni chiave dalle tessere sanitarie USA.
  • W-2: consente di estrarre testo e informazioni chiave dai moduli fiscali W-2.
  • Documento di identità: consente di estrarre testo e informazioni chiave da patenti di guida e passaporti internazionali.

Personalizzazione

  • Modelli di estrazione personalizzati: consentono di estrarre informazioni da moduli e documenti con modelli di estrazione personalizzati. Eseguire rapidamente il training di un modello etichettando fino a cinque documenti di esempio.
  • Modello di classificazione personalizzato: consente di eseguire il training di un classificatore personalizzato per distinguere i diversi tipi di documento all'interno delle applicazioni. Eseguire rapidamente il training di un modello con solo due classi e cinque esempi per classe.

Dopo aver completato i prerequisiti, passare a Document Intelligence Studio.

  1. Selezionare una funzionalità del servizio Document Intelligence nella home page di Studio.

  2. Questo passaggio è un processo che viene eseguito una sola volta, a meno che non sia già stata selezionata la risorsa del servizio da un uso precedente. Selezionare la sottoscrizione di Azure, il gruppo di risorse e la risorsa. È possibile modificare le risorse in qualsiasi momento in "Impostazioni" nel menu in alto. Rivedere e confermare le selezioni.

  3. Selezionare il pulsante Analizza per eseguire l'analisi del documento di esempio o provare il proprio documento usando il comando Aggiungi.

  4. Usare i controlli nella parte inferiore dello schermo per ingrandire, ridurre e ruotare la visualizzazione del documento.

  5. Osservare il contenuto estratto evidenziato nella visualizzazione del documento. Passare il puntatore del mouse sulle chiavi e sui valori per visualizzare i dettagli.

  6. Nella scheda Risultato della sezione di output esplorare l'output JSON per comprendere il formato della risposta del servizio.

  7. Nella scheda Codice esplorare il codice di esempio per l'integrazione. Copiare e scaricare per iniziare.

Aggiunta di prerequisiti per i progetti personalizzati

Oltre all'account Azure e a una risorsa di Document Intelligence o ai servizi di intelligenza artificiale di Azure, è necessario:

Contenitore dell'archiviazione BLOB di Azure

Un account di Archiviazione BLOB di Azure con prestazioni Standard. Si creano contenitori per archiviare e organizzare i documenti di training all'interno dell'account di archiviazione. Se non si sa come creare un account di archiviazione di Azure con un contenitore, seguire queste guide di avvio rapido:

  • Creare un account di archiviazione. Durante la creazione dell'account di archiviazione, assicurarsi di selezionare le prestazioni Standard nel campo Dettagli istanza → Prestazioni.
  • Creare un contenitore. Quando si crea il contenitore, impostare il campo Livello di accesso pubblico su Contenitore (accesso in lettura anonimo per contenitori e BLOB) nella finestra Nuovo contenitore.

Assegnazioni di ruolo di Azure

Per i progetti personalizzati, per diversi scenari sono necessarie le assegnazioni di ruolo seguenti.

  • Base
    • Utente di Servizi cognitivi: è necessario questo ruolo per la risorsa di Servizi di intelligenza artificiale di Azure o Document Intelligence per eseguire il training del modello personalizzato o eseguire l'analisi con i modelli sottoposti a training.
    • Archiviazione Collaboratore ai dati BLOB: è necessario questo ruolo per l'account Archiviazione per creare un progetto ed etichettare i dati.
  • Avanzate
    • Archiviazione Collaboratore account: è necessario questo ruolo per l'account Archiviazione per configurare le impostazioni CORS. Questa operazione è un'operazione una tantum se lo stesso account di archiviazione viene riutilizzato.
    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse e risorse.

Configurare CORS

CORS (condivisione di risorse tra le origini) deve essere configurato nell'account di archiviazione di Azure affinché sia accessibile da Document Intelligence Studio. Per configurare CORS nel portale di Azure, è necessario accedere alla scheda CORS dell'account di archiviazione.

  1. Selezionare la scheda CORS per l'account di archiviazione.

    Screenshot del menu delle impostazioni CORS nel portale di Azure.

  2. Per iniziare, creare una nuova voce CORS nel servizio BLOB.

  3. Impostare Origini consentite su https://documentintelligence.ai.azure.com.

    Screenshot che mostra la configurazione CORS per un account di archiviazione.

    Suggerimento

    È possibile utilizzare il carattere jolly '*' anziché un dominio specificato per consentire a tutti i domini di origine di effettuare richieste tramite CORS.

  4. Selezionare tutte le 8 opzioni disponibili per Metodi consentiti.

  5. Approvare tutte le Intestazioni consentite e le Intestazioni esposte immettendo un * in ogni campo.

  6. Impostare la Validità massima su 120 secondi o su qualsiasi valore accettabile.

  7. Selezionare il pulsante Salva nella parte superiore della pagina per salvare le modifiche.

CORS dovrebbe ora essere configurato per l'uso dell'account di archiviazione da Document Intelligence Studio.

Set di documenti di esempio

  1. Accedere al portale di Azure e passare a Contenitori di archiviazione dati dell'account>di archiviazione.>

    Screenshot del menu Archiviazione dati nel portale di Azure.

  2. Selezionare un contenitore dall'elenco.

  3. Selezionare Carica dal menu nella parte superiore della pagina.

    Screenshot del pulsante di caricamento del contenitore nella portale di Azure.

  4. Verrà visualizzata la finestra Carica BLOB.

  5. Selezionare i file da caricare.

    Screenshot della finestra del BLOB di caricamento nella portale di Azure.

Nota

Per impostazione predefinita, Studio userà i documenti che si trovano nella radice del contenitore. È tuttavia possibile usare i dati organizzati in cartelle specificando il percorso della cartella nei passaggi di creazione del progetto del modulo personalizzato. VedereOrganizzare i dati in sottocartelle

Modelli personalizzati

Per creare modelli personalizzati, iniziare con la configurazione del progetto:

  1. Nella home page di Studio selezionare la scheda Modello personalizzato per aprire la pagina Modelli personalizzati.

  2. Usare il comando "Crea un progetto" per avviare la configurazione guidata del nuovo progetto.

  3. Immettere i dettagli del progetto, selezionare la sottoscrizione e la risorsa di Azure e il contenitore di archiviazione BLOB di Azure che contiene i dati.

  4. Rivedere e inviare le impostazioni per creare il progetto.

  5. Per avviare rapidamente il processo di etichettatura, usare la funzionalità di etichetta automatica per etichettare usando un modello già sottoposto a training o uno dei modelli predefiniti.

  6. Per l'etichettatura manuale da zero, definire le etichette e i relativi tipi di interesse per l'estrazione.

  7. Selezionare il testo nel documento e selezionare l'etichetta nell'elenco a discesa o nel riquadro delle etichette.

  8. Etichettare altri quattro documenti per ottenere almeno cinque documenti etichettati.

  9. Selezionare il comando Train (Esegui training) e immettere il nome del modello, selezionare se si vuole che il modello neurale (consigliato) o il modello avvii il training del modello personalizzato.

  10. Quando il modello è pronto, usare il comando Test per convalidarlo con i documenti di test e osservare i risultati.

Demo del modello personalizzato di Business Intelligence per documenti

Etichettatura come tabelle

Nota

  • Con il rilascio delle versioni 2022-06-30-preview e successive dell'API, nei modelli personalizzati verrà aggiunto il supporto per campi tabulari (tabelle) tra pagine.
  • Con il rilascio delle versioni 2022-06-30-preview e successive dell'API, i modelli neurali personalizzati supporteranno i campi tabulari (tabelle) e i modelli sottoposti a training con l'API versione 2022-08-31 o successive accetteranno etichette di campi tabulari.
  1. Usare il comando Elimina per eliminare i modelli non necessari.

  2. Scaricare i dettagli del modello per la visualizzazione offline.

  3. Selezionare più modelli e comporli in un nuovo modello da usare nelle applicazioni.

Uso delle tabelle come modello visivo:

Per i modelli di moduli personalizzati, durante la creazione di modelli personalizzati, potrebbe essere necessario estrarre raccolte di dati dai documenti. Le raccolte di dati possono essere visualizzate in due formati. Uso delle tabelle come modello visivo:

  • Conteggio dinamico o variabile di valori (righe) per un determinato set di campi (colonne)

  • Raccolta specifica di valori per un determinato set di campi (colonne e/o righe)

Etichettare come tabella dinamica

Usare le tabelle dinamiche per estrarre un numero variabile di valori (righe) per un determinato set di campi (colonne):

  1. Aggiungere una nuova etichetta di tipo "Tabella", selezionare il tipo "Tabella dinamica" e assegnare un nome all'etichetta.

  2. Aggiungere il numero di colonne (campi) e righe (per i dati) necessarie.

  3. Selezionare il testo nella pagina e quindi scegliere la cella da assegnare al testo. Ripetere l'operazione per tutte le righe e le colonne in tutte le pagine di tutti i documenti.

Esempio di etichettatura di Document Intelligence come tabella dinamica

Etichettare come tabella fissa

Usare le tabelle fisse per estrarre una raccolta specifica di valori per un determinato set di campi (colonne e/o righe):

  1. Creare una nuova etichetta di tipo "Tabella", selezionare il tipo "Tabella fissa" e assegnarle un nome.

  2. Aggiungere il numero di colonne e righe necessarie corrispondenti ai due set di campi.

  3. Selezionare il testo nella pagina e quindi scegliere la cella da assegnare al testo. Ripetere l'operazione per altri documenti.

Esempio di etichettatura di Document Intelligence come tabella fissa

Rilevamento della firma

Nota

I campi della firma sono attualmente supportati solo per i modelli personalizzati. Quando si esegue il training di un modello neurale personalizzato, i campi della firma etichettati vengono ignorati.

Per etichettare per il rilevamento della firma (solo modulo personalizzato):

  1. Nella visualizzazione di etichettatura creare una nuova etichetta di tipo "Firma" e assegnarle un nome.

  2. Usare il comando Area per creare un'area rettangolare nella posizione prevista della firma.

  3. Selezionare l'area disegnata e scegliere l'etichetta di tipo Firma da assegnare all'area disegnata. Ripetere l'operazione per altri documenti.

Esempio di etichettatura di Document Intelligence per il rilevamento delle firme

Passaggi successivi

  • Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni sulle differenze rispetto alla versione precedente dell'API REST.
  • Esplorare le guide di avvio rapido dell'SDK v3.0 per provare le funzionalità v3.0 nelle applicazioni con i nuovi SDK.
  • Vedere le guide di avvio rapido dell'API REST v3.0 per provare le funzionalità v3.0 con la nuova API REST.

Introduzione a Document Intelligence Studio.