Model faktury analizy dokumentów

Ważne

  • Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
  • Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
  • Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
  • Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
  • Wschodnie stany USA
  • Zachodnie stany USA 2
  • Europa Zachodnia

Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:niebieski znacznik wyboruZnacznikv3.1 (GA)v3.0 (GA)niebieski znacznik wyboruniebieski znacznik wyboruv2.1 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza) | | Poprzednie wersje:niebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza)purpurowy znacznik wyboruv3.1 | Poprzednia wersja:niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v2.1 Najnowsza wersja:Znacznikniebieski znacznik wyboruv4.0 (wersja zapoznawcza) |

Model faktur analizy dokumentów korzysta z zaawansowanych funkcji optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól i elementów liniowych z faktur sprzedaży, rachunków za narzędzia i zamówień zakupu. Faktury mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst faktury; Wyodrębnia kluczowe informacje, takie jak nazwa klienta, adres rozliczeniowy, data ukończenia i kwota należna; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie faktury w 27 językach.

Obsługiwane typy dokumentów:

  • Faktury
  • Rachunki za usługi użyteczności publicznej
  • Zamówienia sprzedaży
  • Zamówienia zakupu

Automatyczne przetwarzanie faktur

Automatyczne przetwarzanie faktur to proces wyodrębniania kluczowych pól płatnych kont z dokumentów konta rozliczeniowego. Wyodrębnione dane obejmują elementy wierszy z faktur zintegrowanych z przepływami pracy płatnych kont (AP) na potrzeby przeglądów i płatności. W przeszłości proces płatności jest wykonywany ręcznie, a zatem bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z faktur jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji faktur.

Przykładowa faktura przetworzona za pomocą programu Document Intelligence Studio:

Zrzut ekranu przedstawiający przykładową fakturę przeanalizowaną w narzędziu Document Intelligence Studio.

Przykładowa faktura przetworzona za pomocą narzędzia do etykietowania przykładowego analizy dokumentów:

Zrzut ekranu przedstawiający przykładową fakturę.

Opcje programowania

Analiza dokumentów w wersji 4.0 (2024-02-29-preview, 2023-10-31-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model faktury • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzona faktura

Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model faktury • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzona faktura

Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model faktury • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzona faktura

Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby
Model faktury Narzędzie
do etykietowania analizy dokumentów• Interfejs API
REST• Zestaw SDK
biblioteki klienckiej• Kontener docker analizy dokumentów

Wymagania dotyczące danych wejściowych

  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
    Przeczytaj
    Układ ✔ (2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-02-29-preview)
  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

  • Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
  • Obsługiwane pliki PDF i TIFF, przetwarzane są maksymalnie 2000 stron. W przypadku subskrybentów warstwy Bezpłatna przetwarzane są tylko dwie pierwsze strony.
  • Obsługiwany rozmiar pliku musi być mniejszy niż 50 MB i wymiary co najmniej 50 x 50 pikseli i maksymalnie 10 000 x 10 000 pikseli.

Wyodrębnianie danych modelu faktury

Zobacz, jak dane, w tym informacje o kliencie, szczegóły dostawcy i elementy wiersza, są wyodrębniane z faktur. Potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

  1. Na stronie głównej Document Intelligence Studio wybierz pozycję Faktury.

  2. Możesz przeanalizować przykładową fakturę lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Narzędzie do etykietowania przykładowego analizy dokumentów

  1. Przejdź do narzędzia przykładowego analizy dokumentów.

  2. Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .

    Zrzut ekranu przedstawiający proces analizowania wyników w modelu układu.

  3. Wybierz typ formularza do przeanalizowania z menu rozwijanego.

  4. Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:

  5. W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.

    Zrzut ekranu przedstawiający menu rozwijane lokalizacji źródłowej.

  6. W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.

  7. W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.

    Zrzut ekranu przedstawiający menu rozwijane select-form-type.

  8. Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.

  9. Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.

    Zrzut ekranu przedstawiający operację analizowania wyników w modelu układu.

Uwaga

Przykładowe narzędzie etykietowania nie obsługuje formatu pliku BMP. Jest to ograniczenie narzędzia, a nie usługi analizy dokumentów.

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.

Wyodrębnianie pól

Nazwisko Pisz Opis Standardowe dane wyjściowe
CustomerName string Zafakturowany klient Microsoft Corp
CustomerId string Identyfikator referencyjny klienta CID-12345
PurchaseOrder string Numer referencyjny zamówienia zakupu PO-3333
InvoiceId string Identyfikator dla tej konkretnej faktury (często numer faktury) INV-100
InvoiceDate (Data wystawienia faktury) data data wystawienia faktury mm-dd-rrrr
DueDate data data płatności za tę fakturę jest należna mm-dd-rrrr
VendorName string Dostawca, który utworzył tę fakturę CONTOSO LTD.
VendorAddress adres Adres wysyłkowy dostawcy 123 456th St, Nowy Jork, NY 10001
VendorAddressRecipient string Nazwa skojarzona z elementem VendorAddress Siedziba firmy Contoso
CustomerAddress adres Adres wysyłkowy klienta 123 Other St, Redmond WA, 98052
CustomerAddressRecipient string Nazwa skojarzona z elementem CustomerAddress Microsoft Corp
BillingAddress adres Jawny adres rozliczeniowy klienta 123 Bill St, Redmond WA, 98052
BillingAddressRecipient string Nazwa skojarzona z elementem BillingAddress Microsoft Services
ShippingAddress adres Jawny adres wysyłkowy klienta 123 Ship St, Redmond WA, 98052
ShippingAddressRecipient string Nazwa skojarzona z elementem ShippingAddress Dostarczanie firmy Microsoft
Suma częściowa currency Pole sumy częściowej zidentyfikowane na tej fakturze 100,00 $
TotalDiscount currency Łączny rabat zastosowany do faktury 5,00 USD
TotalTax currency Pole całkowitego podatku zidentyfikowane na tej fakturze 10,00 $
InvoiceTotal currency Łączna liczba nowych opłat skojarzonych z tą fakturą 10,00 $
AmountDue currency Łączna kwota ze względu na dostawcę 610 USD
PreviousUnpaidBalance currency Jawne wcześniej niezapłacone saldo 500,00 USD
Address usługi Remittance adres Jawne przelewy lub adres płatności dla klienta 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string Nazwa skojarzona z funkcją RemittanceAddress Rozliczenia firmy Contoso
ServiceAddress adres Jawny adres usługi lub adres właściwości klienta 123 Service St, Redmond WA, 98052
ServiceAddressRecipient string Nazwa skojarzona z elementem ServiceAddress Microsoft Services
ServiceStartDate data Pierwsza data okresu usługi (na przykład okres usługi rozliczanej za pomocą narzędzia) mm-dd-rrrr
ServiceEndDate data Data zakończenia okresu usługi (na przykład okres usługi rozliczanej za pomocą usługi) mm-dd-rrrr
VendorTaxId string Numer podatnika skojarzony z dostawcą 123456-7
CustomerTaxId string Numer podatnika skojarzony z klientem 765432-1
Termin płatności string Warunki płatności za fakturę Net90
KVKNumber string Unikatowy identyfikator firm zarejestrowanych w Holandii (tylko nl) 12345678
CurrencyCode string Kod waluty skojarzony z wyodrębnionej kwoty
PaymentDetails tablica Tablica zawierająca szczegóły opcji płatności, takie jak IBAN,SWIFT, BPayBillerCode(AU), BPayReference(AU)
TaxDetails tablica Tablica zawierająca szczegóły podatkowe, takie jak kwota i stawka
TaxDetails tablica Tablica zawierająca dodane informacje podatkowe, takie jak CGST, IGSTi SGST. Ten element wiersza jest obecnie dostępny tylko dla ustawień regionalnych Niemcy (), Hiszpania (dees), Portugalia (pt) i Kanada Angielska (en-CA)

Tablica elementów liniowych

Poniżej przedstawiono elementy wiersza wyodrębnione z faktury w odpowiedzi wyjściowej JSON (następujące dane wyjściowe używają tej przykładowej faktury:

Nazwisko Pisz Opis Wartość (standardowe dane wyjściowe)
Liczba dni currency Ilość elementu wiersza 60,00 USD
Data data Data odpowiadająca każdemu elementowi wiersza. Często jest to data wysłania elementu wiersza 3/4/2021
opis string Opis tekstu dla elementu wiersza faktury Usługa konsultingowa
Ilość Liczba Ilość dla tego elementu wiersza faktury 2
Kod_produktu string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Podatek currency Podatek skojarzony z każdym elementem wiersza. Możliwe wartości obejmują kwotę podatku i podatek Y/N 6,00 USD
TaxRate string Stawka podatku skojarzona z każdym elementem wiersza. 18%
Jednostka string Jednostka elementu wiersza, np. kg, lb itp. Godziny
UnitPrice Liczba Cena netto lub brutto (w zależności od ustawienia faktury brutto) jednej jednostki tego elementu 30,00 $

Pary klucz-wartość faktury i wyodrębnione elementy wiersza znajdują się w documentResults sekcji danych wyjściowych JSON.

Pary klucz-wartość

Wstępnie utworzona faktura 2022-06-30 i nowsze wersje obsługują opcjonalne zwracanie par klucz-wartość. Domyślnie zwracanie par klucz-wartość jest wyłączone. Pary klucz-wartość są określonymi zakresami na fakturze, które identyfikują etykietę lub klucz oraz skojarzona odpowiedź lub wartość. Na fakturze te pary mogą być etykietą i wartością wprowadzoną przez użytkownika dla tego pola lub numeru telefonu. Model sztucznej inteligencji jest trenowany w celu wyodrębniania możliwych do zidentyfikowania kluczy i wartości w oparciu o szeroką gamę typów dokumentów, formatów i struktur.

Klucze mogą również istnieć w izolacji, gdy model wykryje, że klucz istnieje, bez skojarzonej wartości lub podczas przetwarzania pól opcjonalnych. Na przykład pole nazwy środkowej może być puste w formularzu w niektórych przypadkach. Pary klucz-wartość są zawsze zakresami tekstu zawartego w dokumencie. W przypadku dokumentów, w których ta sama wartość jest opisana na różne sposoby, na przykład klient/użytkownik, skojarzony klucz jest klientem lub użytkownikiem (na podstawie kontekstu).

Wyodrębnione pola

Usługa Faktura wyodrębnia tekst, tabele i 26 pól faktur. Poniżej przedstawiono pola wyodrębnione z faktury w odpowiedzi wyjściowej JSON (poniższe dane wyjściowe używają tej przykładowej faktury).

Nazwisko Pisz Opis Tekst Wartość (standardowe dane wyjściowe)
CustomerName string Klient jest fakturowany Microsoft Corp
CustomerId string Identyfikator odwołania klienta CID-12345
PurchaseOrder string Numer referencyjny zamówienia zakupu PO-3333
InvoiceId string Identyfikator tej konkretnej faktury (często "Numer faktury") INV-100
InvoiceDate (Data wystawienia faktury) data Data wystawienia faktury 11/15/2019 2019-11-15
DueDate data Data płatności za tę fakturę jest należna 15.12.2019 2019-12-15
VendorName string Dostawca, który utworzył fakturę CONTOSO
VendorAddress string Adres wysyłkowy dostawcy 123 456th St New York, NY, 10001
VendorAddressRecipient string Nazwa skojarzona z elementem VendorAddress Siedziba firmy Contoso
CustomerAddress string Adres wysyłkowy klienta 123 Other Street, Redmond, Waszyngton, 98052
CustomerAddressRecipient string Nazwa skojarzona z elementem CustomerAddress Microsoft Corp
BillingAddress string Jawny adres rozliczeniowy klienta 123 Bill Street, Redmond, Waszyngton, 98052
BillingAddressRecipient string Nazwa skojarzona z elementem BillingAddress Microsoft Services
ShippingAddress string Jawny adres wysyłkowy klienta 123 Ship Street, Redmond, Waszyngton, 98052
ShippingAddressRecipient string Nazwa skojarzona z elementem ShippingAddress Dostarczanie firmy Microsoft
Suma częściowa Liczba Pole sumy częściowej zidentyfikowane na tej fakturze 100,00 $ 100
TotalTax Liczba Pole całkowitego podatku zidentyfikowane na tej fakturze 10,00 $ 10
InvoiceTotal Liczba Łączna liczba nowych opłat skojarzonych z tą fakturą 110,00 USD 110
AmountDue Liczba Łączna kwota ze względu na dostawcę 610,00 USD 610
ServiceAddress string Jawny adres usługi lub adres właściwości klienta 123 Service Street, Redmond, Waszyngton, 98052
ServiceAddressRecipient string Nazwa skojarzona z elementem ServiceAddress Microsoft Services
Address usługi Remittance string Jawne przelewy lub adres płatności dla klienta 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string Nazwa skojarzona z funkcją RemittanceAddress Rozliczenia firmy Contoso
ServiceStartDate data Pierwsza data okresu usługi (na przykład okres usługi rozliczanej za pomocą narzędzia) 10/14/2019 2019-10-14
ServiceEndDate data Data zakończenia okresu usługi (na przykład okres usługi rozliczanej za pomocą usługi) 11/14/2019 2019-11-14
PreviousUnpaidBalance Liczba Jawne wcześniej niezapłacone saldo 500,00 USD 500

Poniżej przedstawiono elementy wiersza wyodrębnione z faktury w odpowiedzi wyjściowej JSON i używają tej przykładowej faktury:

Nazwisko Pisz Opis Tekst (element wiersza nr 1) Wartość (standardowe dane wyjściowe)
Elementy string Pełny wiersz tekstowy ciągu elementu wiersza 3/4/2021 A123 Usługi konsultingowe 2 godziny $30.00 10% $60.00
Kwota Liczba Ilość elementu wiersza 60,00 USD 100
opis string Opis tekstu dla elementu wiersza faktury Usługa konsultingowa Usługa konsultingowa
Ilość Liczba Ilość dla tego elementu wiersza faktury 2 2
UnitPrice Liczba Cena netto lub brutto (w zależności od ustawienia faktury brutto) jednej jednostki tego elementu 30,00 $ 30
Kod_produktu string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Jednostka string Jednostka elementu wiersza, np. kg, lb itp. godziny
Data data Data odpowiadająca każdemu elementowi wiersza. Często jest to data wysłania elementu wiersza 3/4/2021 2021-03-04
Podatek Liczba Podatek skojarzony z każdym elementem wiersza. Możliwe wartości obejmują kwotę podatku, podatek %i podatek Y/N 10%

Poniżej przedstawiono złożone pola wyodrębnione z faktury w odpowiedzi wyjściowej JSON:

TaxDetails

Szczegóły podatkowe mają na celu podzielenie różnych podatków zastosowanych do sumy faktury.

Nazwisko Pisz Opis Tekst (element wiersza nr 1) Wartość (standardowe dane wyjściowe)
Elementy string Pełny wiersz tekstowy elementu podatkowego V.A.T. 15% $60.00
Kwota Liczba Kwota podatku od pozycji podatkowej 60,00 60
Stawka string Stawka podatkowa pozycji podatkowej 15%

PaymentDetails

Wyświetl listę wszystkich wykrytych opcji płatności wykrytych w polu.

Nazwisko Pisz Opis Tekst (element wiersza nr 1) Wartość (standardowe dane wyjściowe)
IBAN string Wewnętrzny numer konta bankowego GB33BUKB20201555555555
SWIFT string Kod SWIFT BUKBGB22
BPayBillerCode string Australian B-Pay Biller Code 12345
BPayReference string Australijski kod referencyjny B-Pay 98765432100

Dane wyjściowe JSON

Dane wyjściowe JSON mają trzy części:

  • "readResults" węzeł zawiera wszystkie rozpoznane znaczniki tekstu i zaznaczenia. Tekst jest uporządkowany za pomocą strony, a następnie według wierszy, a następnie według pojedynczych wyrazów.
  • "pageResults" węzeł zawiera tabele i komórki wyodrębnione z ich pól ograniczenia, ufności i odwołania do wierszy i wyrazów w readResults.
  • "documentResults" węzeł zawiera wartości specyficzne dla faktury i elementy wiersza odnalezione przez model. W tym miejscu można znaleźć wszystkie pola z faktury, takie jak identyfikator faktury, wysyłka do, rachunek, klient, suma, elementy wiersza i wiele innych.

Przewodnik migracji

  • Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.0 w aplikacjach i przepływach pracy.

Następne kroki