Który model należy wybrać?
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
- Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
- Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:v3.1 (GA)v3.0 (GA)
Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:v4.0 (wersja zapoznawcza) | | Poprzednie wersje:v3.0
Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:v4.0 (wersja zapoznawcza)v3.1
Usługa Azure AI Document Intelligence obsługuje szeroką gamę modeli, które umożliwiają dodawanie inteligentnego przetwarzania dokumentów do aplikacji i optymalizowanie przepływów pracy. Wybór odpowiedniego modelu jest niezbędny do zapewnienia sukcesu przedsiębiorstwa. W tym artykule zapoznamy się z dostępnymi modelami analizy dokumentów i przedstawimy wskazówki dotyczące wybierania najlepszego rozwiązania dla projektów.
Poniższe wykresy decyzyjne przedstawiają funkcje każdego obsługiwanego modelu analizy dokumentów w wersji 3.0 i ułatwiają wybór najlepszego modelu spełniającego wymagania i wymagania aplikacji.
Ważne
Pamiętaj, aby sprawdzić stronę obsługi języka pod kątem obsługiwanego tekstu językowego i wyodrębniania pól według funkcji.
Wstępnie wytrenowane modele analizy dokumentów
Document type | Przykład | Dane do wyodrębnienia | Najlepsze rozwiązanie |
---|---|---|---|
Ogólny dokument. | Kontrakt lub list. | Chcesz przede wszystkim wyodrębnić napisane lub drukowane wiersze tekstu, wyrazy, lokalizacje i wykryte języki. | Odczytywanie modelu OCR |
Dokument zawierający informacje strukturalne. | Raport lub badanie. | Oprócz tekstu pisanego lub drukowanego należy wyodrębnić informacje strukturalne, takie jak tabele, znaczniki wyboru, akapity, tytuły, nagłówki i podpozycje. | Model analizy układu |
Dokument ustrukturyzowany lub częściowo ustrukturyzowany zawierający zawartość sformatowaną jako pola (klucze) i wartości. | Formularz lub dokument, który jest standardowym formatem używanym w twojej firmie lub branży, takim jak aplikacja kredytowa lub ankieta. | Chcesz wyodrębnić pola i wartości, w tym te, które nie są objęte wstępnie utworzonymi modelami specyficznymi dla scenariusza bez konieczności trenowania modelu niestandardowego. | **Model analizy układu z włączonym opcjonalnym parametrem features=keyValuePairs ciągu zapytania ** |
Wstępnie wytrenowane modele specyficzne dla scenariuszy
Document type | Dane do wyodrębnienia | Najlepsze rozwiązanie |
---|---|---|
Formularz podatkowy W-2 w USA | Chcesz wyodrębnić kluczowe informacje, takie jak wynagrodzenie, płace i podatki wstrzymane. | Model W-2 podatku amerykańskiego |
Formularz podatku 1098 w USA | Chcesz wyodrębnić szczegóły odsetek hipotecznych, takie jak podmiot zabezpieczeń, punktów i podatku. | Model podatku 1098 w USA |
Formularz podatku 1098-E w USA | Chcesz wyodrębnić szczegóły odsetek pożyczek studenckich, takich jak kredytodawca i kwota odsetek. | Model 1098-E podatku amerykańskiego |
Formularz podatku 1098T w USA | Chcesz wyodrębnić kwalifikowane szczegóły czesnego, takie jak korekty stypendiów, status studenta i informacje kredytodawcy. | Model 1098-T podatku amerykańskiego |
Formularz podatku amerykańskiego 1099 (odmiany) | Chcesz wyodrębnić informacje z 1099 formularzy i jego odmian (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Model podatku 1099 w USA |
Formularz podatku amerykańskiego 1040 (odmiany) | Chcesz wyodrębnić informacje z 1040 formularzy i jego odmian (Harmonogram 1, Harmonogram 2, Harmonogram 3, Harmonogram 8812, Harmonogram A, Harmonogram B, Harmonogram C, Harmonogram D, Harmonogram EIC, Harmonogram F, Harmonogram H, Harmonogram J, Harmonogram R, Harmonogram SE, Harmonogram starszy). |
Model podatku 1040 w USA |
Umowa (umowa prawna między stronami). | Chcesz wyodrębnić szczegóły umowy, takie jak strony, daty i interwały. | Model kontraktu |
Karta ubezpieczenia zdrowotnego lub identyfikator ubezpieczenia zdrowotnego. | Chcesz wyodrębnić kluczowe informacje, takie jak ubezpieczyciel, identyfikator członka, ubezpieczenie na receptę i numer grupy. | Model karty ubezpieczenia zdrowotnego |
Karta kredytowa/debetowa . | Chcesz wyodrębnić kluczowe karty bankowe, takie jak numer karty i nazwa banku. | Model karty kredytowej/debetowej |
Akt małżeństwa . | Chcesz wyodrębnić kluczowe informacje z certyfikatów małżeńskich. | Model certyfikatu małżeństwa |
Faktura lub zestawienie rozliczeniowe. | Chcesz wyodrębnić kluczowe informacje, takie jak nazwa klienta, adres rozliczeniowy i kwota należna. | Model faktury |
Paragon, kupon lub jednostronicowy paragon hotelowy. | Chcesz wyodrębnić kluczowe informacje, takie jak nazwa sprzedawcy, data transakcji i suma transakcji. | Model paragonu |
Dokument tożsamości (id), taki jak prawo jazdy USA lub międzynarodowy paszport. | Chcesz wyodrębnić kluczowe informacje, takie jak imię, nazwisko, data urodzenia, adres i podpis. | Model dokumentu tożsamości (ID) |
Kredyt hipoteczny USA 1003 . | Chcesz wyodrębnić kluczowe informacje z aplikacji ujednoliconej pożyczki mieszkaniowej. | Model formularza 1003 |
Kredyt hipoteczny USA 1008 . | Chcesz wyodrębnić kluczowe informacje z podsumowania jednolitych zapisów i przesyłania. | Model formularza 1008 |
Ujawnienie zamknięcia kredytów hipotecznych w USA . | Chcesz wyodrębnić kluczowe informacje z formularza ujawnienia zamknięcia kredytu hipotecznego. | Model formularza zamknięcia kredytów hipotecznych |
Dokumenty typu mieszanego z ustrukturyzowanymi, częściowo ustrukturyzowanymi i/lub nieustrukturyzowanymi elementami. | Chcesz wyodrębnić pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony, które nie są wyodrębniane przez wstępnie utworzone lub ogólne modele dokumentów. | Model niestandardowy |
Napiwek
- Jeśli nadal nie masz pewności, który wstępnie wytrenowany model ma być używany, wypróbuj model układu z włączonym opcjonalnym parametrem
features=keyValuePairs
ciągu zapytania. - Model układu jest obsługiwany przez aparat OCR do wykrywania stron, tabel, stylów, tekstu, wierszy, wyrazów, lokalizacji i języków.
Niestandardowe modele wyodrębniania
Zestaw szkoleniowy | Przykładowe dokumenty | Najlepsze rozwiązanie |
---|---|---|
Ustrukturyzowane, spójne dokumenty z układem statycznym. | Formularze ustrukturyzowane, takie jak kwestionariusze lub aplikacje. | Niestandardowy model szablonu |
Dokumenty ustrukturyzowane, częściowo ustrukturyzowane i nieustrukturyzowane. | ● Ankiety ustrukturyzowane →● Częściowo ustrukturyzowane faktury →● Listy → bez struktury |
Niestandardowy model neuronowy |
Kolekcja kilku modeli wytrenowanych na dokumentach podobnych typów. | ● Dostarczanie zamówień zakupu● Zamówienia zakupu sprzętu● Zamówienia zakupu mebli Wszystkie składa się w jeden model. |
Skomponowany model niestandardowy |
Niestandardowy model klasyfikacji
Zestaw szkoleniowy | Przykładowe dokumenty | Najlepsze rozwiązanie |
---|---|---|
Co najmniej dwa różne typy dokumentów. | Formularze, litery lub dokumenty | Niestandardowy model klasyfikacji |