Niestandardowy model szablonu analizy dokumentów

Artykuł
03/10/2024

Ważne

Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
Wschodnie stany USA
Zachodnie stany USA 2
Europa Zachodnia

Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:v4.0 (wersja zapoznawcza) | | Poprzednie wersje:v3.0v2.1

Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:v4.0 (wersja zapoznawcza)v3.1 | Poprzednia wersja:v2.1

Ta zawartość dotyczy:v2.1 Najnowsza wersja:v4.0 (wersja zapoznawcza) |

Szablon niestandardowy (dawniej formularz niestandardowy) to łatwy do wytrenowania model dokumentu, który dokładnie wyodrębnia pary klucz-wartość, znaczniki wyboru, tabele, regiony i podpisy z dokumentów. Modele szablonów używają wskazówek układu do wyodrębniania wartości z dokumentów i są odpowiednie do wyodrębniania pól z dokumentów o wysokiej strukturze za pomocą zdefiniowanych szablonów wizualizacji.

Niestandardowe modele szablonów mają taki sam format i strategię etykietowania, jak niestandardowe modele neuronowe, z obsługą większej liczby typów pól i języków.

Możliwości modelu

Niestandardowe modele szablonów obsługują pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony.

Pola formularza	Znaczniki zaznaczenia	Pola tabelaryczne (tabele)	Podpis	Wybrane regiony
Obsługiwane	Obsługiwane	Obsługiwane	Obsługiwane	Obsługiwane

Pola tabelaryczne

Wraz z wydaniem interfejsu API w wersji 2022-06-30-preview i nowszych niestandardowe modele szablonów będą dodawać obsługę pól tabelarycznych między stronami (tabele):

Aby oznaczyć tabelę obejmującą wiele stron, należy oznaczyć każdy wiersz tabeli na różnych stronach w jednej tabeli.
Najlepszym rozwiązaniem jest upewnienie się, że zestaw danych zawiera kilka przykładów oczekiwanych odmian. Na przykład uwzględnij przykłady, w których cała tabela znajduje się na jednej stronie i gdzie tabele obejmują co najmniej dwie strony, jeśli spodziewasz się zobaczyć te odmiany w dokumentach.

Pola tabelaryczne są również przydatne podczas wyodrębniania powtarzających się informacji w dokumencie, który nie jest rozpoznawany jako tabela. Na przykład powtarzające się sekcje środowisk roboczych w wznowieniu można oznaczyć i wyodrębnić jako pole tabelaryczne.

Obsługa odmian

Modele szablonów opierają się na zdefiniowanym szablonie wizualnym, a zmiany w szablonie skutkuje niższą dokładnością. W tych przypadkach podziel zestaw danych trenowania, aby uwzględnić co najmniej pięć próbek każdego szablonu i wytrenować model dla każdej odmiany. Następnie możesz utworzyć modele w jednym punkcie końcowym. W przypadku subtelnych odmian, takich jak cyfrowe dokumenty PDF i obrazy, najlepiej uwzględnić co najmniej pięć przykładów każdego typu w tym samym zestawie danych treningowych.

Wymagania dotyczące danych wejściowych

Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

Obsługiwane formaty plików:

Model	PDF	Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
Przeczytaj	✔	✔	✔
Układ	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview lub nowszy)
Dokument ogólny	✔	✔
Wstępnie utworzona	✔	✔
Niestandardowy	✔	✔

✱ Pliki pakietu Microsoft Office nie są obecnie obsługiwane w przypadku innych modeli lub wersji.

W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).
W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.
W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

Trenowanie modelu

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 4.0. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Szablon niestandardowy	Interfejs API w wersji 3.1	Zestaw SDK analizy dokumentów	Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildModetemplatena .

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 3.1. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Szablon niestandardowy	Interfejs API w wersji 3.1	Zestaw SDK analizy dokumentów	Document Intelligence Studio

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — modele niestandardowe, aby uzyskać pełną listę obsługiwanych języków.

Niestandardowe (szablon) modele są ogólnie dostępne za pomocą interfejsu API w wersji 2.1.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Model niestandardowy (szablon)	Analiza dokumentów 2.1	Zestaw SDK analizy dokumentów	Narzędzie do etykietowania przykładu analizy dokumentów

Następne kroki

Dowiedz się, jak tworzyć i tworzyć modele niestandardowe:

Tworzenie niestandardowego modelu Tworzenie modeliniestandardowych