Model paragonu analizy dokumentów

Ważne

  • Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
  • Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
  • Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
  • Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
  • Wschodnie stany USA
  • Zachodnie stany USA 2
  • Europa Zachodnia

Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:niebieski znacznik wyboruZnacznikv3.1 (GA)v3.0 (GA)niebieski znacznik wyboruniebieski znacznik wyboruv2.1 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza) | | Poprzednie wersje:niebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza)purpurowy znacznik wyboruv3.1 | Poprzednia wersja:niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v2.1 Najnowsza wersja:Znacznikniebieski znacznik wyboruv4.0 (wersja zapoznawcza) |

Model paragonu analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z paragonów sprzedaży. Paragony mogą mieć różne formaty i jakość, w tym paragony drukowane i odręczne. Interfejs API wyodrębnia kluczowe informacje, takie jak nazwa sprzedawcy, numer telefonu sprzedawcy, data transakcji, podatek i suma transakcji oraz zwraca ustrukturyzowane dane JSON.

Obsługiwane typy paragonów:

  • Termiczne
  • Karta kredytowa
  • instalacja gazowa;
  • Parkowanie
  • Hotel
  • Transport
  • Komunikacja
  • Rozrywka
  • Lot
  • Szkolenie
  • Apteka/Medyczna

Wyodrębnianie danych paragonu

Cyfryzacja paragonów obejmuje transformację różnych rodzajów paragonów, w tym zeskanowanych, sfotografowanych i drukowanych kopii w formacie cyfrowym w celu usprawnionego przetwarzania podrzędnego. Przykłady obejmują zarządzanie wydatkami, analizę zachowań konsumentów, automatyzację podatków itp. Korzystanie z analizy dokumentów z technologią optycznego rozpoznawania znaków (optycznego rozpoznawania znaków) umożliwia wyodrębnianie i interpretowanie danych z tych zróżnicowanych formatów paragonów. Przetwarzanie analizy dokumentów upraszcza proces konwersji, ale także znacznie skraca czas i nakład pracy, co ułatwia efektywne zarządzanie danymi i pobieranie.

Przykładowe potwierdzenie przetworzone za pomocą programu Document Intelligence Studio:

Zrzut ekranu przedstawiający przykładowe potwierdzenie przetworzone w programie Document Intelligence Studio.

Przykładowe potwierdzenie przetworzone za pomocą narzędzia do etykietowania przykładowego analizy dokumentów:

Zrzut ekranu przedstawiający przykładowe potwierdzenie przetworzone za pomocą narzędzia do etykietowania przykładowego formularza.

Opcje programowania

Analiza dokumentów w wersji 4.0 (2024-02-29-preview, 2023-10-31-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model paragonu • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model paragonu • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model paragonu • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby
Model paragonu Narzędzie
do etykietowania analizy dokumentów• Interfejs API
REST• Zestaw SDK
biblioteki klienckiej• Kontener docker analizy dokumentów

Wymagania dotyczące danych wejściowych

  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
    Przeczytaj
    Układ ✔ (2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-02-29-preview)
  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

  • Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
  • Obsługiwany limit stron dla plików PDF i TIFF: Analiza dokumentów może przetwarzać maksymalnie 2000 stron dla subskrybentów warstwy Standardowa lub tylko dwie pierwsze strony dla subskrybentów warstwy bezpłatnie.
  • Obsługiwany rozmiar pliku: mniejszy niż 50 MB; minimalna liczba pikseli 50 x 50 pikseli; maksymalna liczba pikseli: 10 000 x 10 000 pikseli.

Wyodrębnianie danych modelu paragonu

Zobacz, w jaki sposób analiza dokumentów wyodrębnia dane, w tym godzinę i datę transakcji, informacje o kupcu i sumy kwot od wpływów. Potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Uwaga

Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0 oraz nowszymi wersjami.

  1. Na stronie głównej Document Intelligence Studio wybierz pozycję Paragony.

  2. Możesz przeanalizować przykładowe potwierdzenie lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Narzędzie do etykietowania przykładowego analizy dokumentów

  1. Przejdź do narzędzia przykładowego analizy dokumentów.

  2. Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .

    Zrzut ekranu przedstawiający proces analizowania wyników przez model układu.

  3. Wybierz typ formularza do przeanalizowania z menu rozwijanego.

  4. Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:

  5. W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.

    Zrzut ekranu przedstawiający menu rozwijane lokalizacji źródłowej.

  6. W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.

  7. W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.

    Zrzut ekranu przedstawiający menu rozwijane select-form-type.

  8. Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.

  9. Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.

    Zrzut ekranu przedstawiający operację analizowania wyników w modelu układu.

Uwaga

Przykładowe narzędzie etykietowania nie obsługuje formatu pliku BMP. Jest to ograniczenie narzędzia, a nie usługi analizy dokumentów.

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.

Wyodrębnianie pól

Nazwisko Pisz Opis Standardowe dane wyjściowe
Typ paragonu String Typ paragonu sprzedaży Wyszczególnione
Nazwa handlowca String Imię i nazwisko sprzedawcy wystawiającego paragon
Kupiec Telefon Numer phoneNumber Wymieniony numer telefonu sprzedawcy +1 xxx xxx xxxx
Adres handlowca String Wymieniony adres sprzedawcy
Data transakcji Data Data wystawienia paragonu rrrr-mm-dd
Czas transakcji Czas Czas wystawienia paragonu hh-mm-ss (24-godzinne)
Łącznie Liczba (USD) Całkowita liczba transakcji odbioru Liczba zmiennoprzecinkowa dwuprzecinkowa
Suma częściowa Liczba (USD) Suma częściowa paragonu, często przed zastosowaniem podatków Liczba zmiennoprzecinkowa dwuprzecinkowa
Podatek Liczba (USD) Całkowity podatek od paragonu (często podatek od sprzedaży lub odpowiednik). Zmieniono nazwę na "TotalTax" w wersji 2022-06-30. Liczba zmiennoprzecinkowa dwuprzecinkowa
Napiwek Liczba (USD) Porada dołączona przez kupującego Liczba zmiennoprzecinkowa dwuprzecinkowa
Elementy Tablica obiektów Wyodrębnione elementy wiersza z nazwą, ilością, ceną jednostkową i łączną ceną wyodrębnionej
Nazwisko String Opis elementu. Zmieniono nazwę na "Opis" w wersji 2022-06-30.
Ilość Liczba Ilość każdego elementu Liczba zmiennoprzecinkowa dwuprzecinkowa
Cena Liczba Pojedyncza cena każdej jednostki przedmiotów Liczba zmiennoprzecinkowa dwuprzecinkowa
Cena_łączna Liczba Łączna cena elementu wiersza Liczba zmiennoprzecinkowa dwuprzecinkowa

Usługa Document Intelligence w wersji 3.0 lub nowszej wprowadza kilka nowych funkcji i możliwości. Oprócz paragonów cieplnych model Paragon obsługuje jednostronicowe przetwarzanie paragonów hotelowych i wyodrębnianie szczegółów podatkowych dla wszystkich typów paragonów.

Usługa Document Intelligence w wersji 4.0 lub nowszej wprowadza obsługę waluty dla wszystkich pól związanych z ceną dla paragonów cieplnych i hotelowych.

Przyjęcie

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-3210
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
TransactionDate date Data wystawienia paragonu 6 czerwca 2019 r.
TransactionTime time Czas wystawienia paragonu 16:49
Subtotal number Suma częściowa paragonu, często przed zastosowaniem podatków 12,34 USD
TotalTax number Podatek od paragonu, często podatek od sprzedaży lub odpowiednik 2,00 USD
Tip number Porada dołączona przez kupującego 1,00 USD
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Surface Pro 6
Items.*.Quantity number Ilość każdego elementu 1
Items.*.Price number Pojedyncza cena każdej jednostki przedmiotów 999,00 USD
Items.*.ProductCode string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Items.*.QuantityUnit string Jednostka ilości każdego elementu
TaxDetails array
TaxDetails.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Kwota szczegółów podatkowych 999,00 USD

receipt.retailMeal

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-3210
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
TransactionDate date Data wystawienia paragonu 6 czerwca 2019 r.
TransactionTime time Czas wystawienia paragonu 16:49
Subtotal number Suma częściowa paragonu, często przed zastosowaniem podatków 12,34 USD
TotalTax number Podatek od paragonu, często podatek od sprzedaży lub odpowiednik 2,00 USD
Tip number Porada dołączona przez kupującego 1,00 USD
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Surface Pro 6
Items.*.Quantity number Ilość każdego elementu 1
Items.*.Price number Pojedyncza cena każdej jednostki przedmiotów 999,00 USD
Items.*.ProductCode string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Items.*.QuantityUnit string Jednostka ilości każdego elementu
TaxDetails array
TaxDetails.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Kwota szczegółów podatkowych 999,00 USD

receipt.creditCard

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-3210
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
TransactionDate date Data wystawienia paragonu 6 czerwca 2019 r.
TransactionTime time Czas wystawienia paragonu 16:49
Subtotal number Suma częściowa paragonu, często przed zastosowaniem podatków 12,34 USD
TotalTax number Podatek od paragonu, często podatek od sprzedaży lub odpowiednik 2,00 USD
Tip number Porada dołączona przez kupującego 1,00 USD
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Surface Pro 6
Items.*.Quantity number Ilość każdego elementu 1
Items.*.Price number Pojedyncza cena każdej jednostki przedmiotów 999,00 USD
Items.*.ProductCode string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Items.*.QuantityUnit string Jednostka ilości każdego elementu
TaxDetails array
TaxDetails.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Kwota szczegółów podatkowych 999,00 USD

receipt.gas

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-3210
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
TransactionDate date Data wystawienia paragonu 6 czerwca 2019 r.
TransactionTime time Czas wystawienia paragonu 16:49
Subtotal number Suma częściowa paragonu, często przed zastosowaniem podatków 12,34 USD
TotalTax number Podatek od paragonu, często podatek od sprzedaży lub odpowiednik 2,00 USD
Tip number Porada dołączona przez kupującego 1,00 USD
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Surface Pro 6
Items.*.Quantity number Ilość każdego elementu 1
Items.*.Price number Pojedyncza cena każdej jednostki przedmiotów 999,00 USD
Items.*.ProductCode string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Items.*.QuantityUnit string Jednostka ilości każdego elementu
TaxDetails array
TaxDetails.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Kwota szczegółów podatkowych 999,00 USD

receipt.parking

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-3210
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
TransactionDate date Data wystawienia paragonu 6 czerwca 2019 r.
TransactionTime time Czas wystawienia paragonu 16:49
Subtotal number Suma częściowa paragonu, często przed zastosowaniem podatków 12,34 USD
TotalTax number Podatek od paragonu, często podatek od sprzedaży lub odpowiednik 2,00 USD
Tip number Porada dołączona przez kupującego 1,00 USD
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Surface Pro 6
Items.*.Quantity number Ilość każdego elementu 1
Items.*.Price number Pojedyncza cena każdej jednostki przedmiotów 999,00 USD
Items.*.ProductCode string Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza A123
Items.*.QuantityUnit string Jednostka ilości każdego elementu
TaxDetails array
TaxDetails.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Kwota szczegółów podatkowych 999,00 USD

receipt.hotel

Pole Typ Opis Przykład
MerchantName string Imię i nazwisko sprzedawcy wystawiającego paragon Contoso
MerchantPhoneNumber phoneNumber Wymieniony numer telefonu sprzedawcy 987-654-310
MerchantAddress address Wymieniony adres sprzedawcy 123 Main St. Redmond, Waszyngton 98052
Total number Całkowita liczba transakcji odbioru 14,34 USD
ArrivalDate date Data przyjazdu 27Mar21
DepartureDate date Data wyjazdu 28Mar21
Currency string Jednostka waluty kwot paragonu (ISO 4217) lub "MIESZANA", jeśli znaleziono wiele wartości USD
MerchantAliases array
MerchantAliases.* string Alternatywna nazwa sprzedawcy Contoso (R)
Items array
Items.* object Wyodrębniony element wiersza 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Łączna cena elementu wiersza 999,00 USD
Items.*.Description string Opis towaru Opłata za pokój
Items.*.Date date Data elementu 27Mar21
Items.*.Category string Kategoria elementów Pokój

Przewodnik migracji i interfejs API REST w wersji 3.1

  • Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.1 w aplikacjach i przepływach pracy.

Następne kroki