Niestandardowy model szablonu analizy dokumentów

Ważne

  • Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
  • Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
  • Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
  • Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
  • Wschodnie stany USA
  • Zachodnie stany USA 2
  • Europa Zachodnia

Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:niebieski znacznik wyboruZnacznikv3.1 (GA)v3.0 (GA)niebieski znacznik wyboruniebieski znacznik wyboruv2.1 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza) | | Poprzednie wersje:niebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza)purpurowy znacznik wyboruv3.1 | Poprzednia wersja:niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v2.1 Najnowsza wersja:Znacznikniebieski znacznik wyboruv4.0 (wersja zapoznawcza) |

Szablon niestandardowy (dawniej formularz niestandardowy) to łatwy do wytrenowania model dokumentu, który dokładnie wyodrębnia pary klucz-wartość, znaczniki wyboru, tabele, regiony i podpisy z dokumentów. Modele szablonów używają wskazówek układu do wyodrębniania wartości z dokumentów i są odpowiednie do wyodrębniania pól z dokumentów o wysokiej strukturze za pomocą zdefiniowanych szablonów wizualizacji.

Niestandardowe modele szablonów mają taki sam format i strategię etykietowania, jak niestandardowe modele neuronowe, z obsługą większej liczby typów pól i języków.

Możliwości modelu

Niestandardowe modele szablonów obsługują pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony.

Pola formularza Znaczniki zaznaczenia Pola tabelaryczne (tabele) Podpis Wybrane regiony
Obsługiwane Obsługiwane Obsługiwane Obsługiwane Obsługiwane

Pola tabelaryczne

Wraz z wydaniem interfejsu API w wersji 2022-06-30-preview i nowszych niestandardowe modele szablonów będą dodawać obsługę pól tabelarycznych między stronami (tabele):

  • Aby oznaczyć tabelę obejmującą wiele stron, należy oznaczyć każdy wiersz tabeli na różnych stronach w jednej tabeli.
  • Najlepszym rozwiązaniem jest upewnienie się, że zestaw danych zawiera kilka przykładów oczekiwanych odmian. Na przykład uwzględnij przykłady, w których cała tabela znajduje się na jednej stronie i gdzie tabele obejmują co najmniej dwie strony, jeśli spodziewasz się zobaczyć te odmiany w dokumentach.

Pola tabelaryczne są również przydatne podczas wyodrębniania powtarzających się informacji w dokumencie, który nie jest rozpoznawany jako tabela. Na przykład powtarzające się sekcje środowisk roboczych w wznowieniu można oznaczyć i wyodrębnić jako pole tabelaryczne.

Obsługa odmian

Modele szablonów opierają się na zdefiniowanym szablonie wizualnym, a zmiany w szablonie skutkuje niższą dokładnością. W tych przypadkach podziel zestaw danych trenowania, aby uwzględnić co najmniej pięć próbek każdego szablonu i wytrenować model dla każdej odmiany. Następnie możesz utworzyć modele w jednym punkcie końcowym. W przypadku subtelnych odmian, takich jak cyfrowe dokumenty PDF i obrazy, najlepiej uwzględnić co najmniej pięć przykładów każdego typu w tym samym zestawie danych treningowych.

Wymagania dotyczące danych wejściowych

  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
    Przeczytaj
    Układ ✔ (2024-02-29-preview, 2023-10-31-preview lub nowszy)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowy

    ✱ Pliki pakietu Microsoft Office nie są obecnie obsługiwane w przypadku innych modeli lub wersji.

  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

  • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.

  • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

Trenowanie modelu

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 4.0. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Szablon niestandardowy Interfejs API w wersji 3.1 Zestaw SDK analizy dokumentów Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildModetemplatena .

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 3.1. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Szablon niestandardowy Interfejs API w wersji 3.1 Zestaw SDK analizy dokumentów Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildModetemplatena .

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — modele niestandardowe, aby uzyskać pełną listę obsługiwanych języków.

Niestandardowe (szablon) modele są ogólnie dostępne za pomocą interfejsu API w wersji 2.1.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Model niestandardowy (szablon) Analiza dokumentów 2.1 Zestaw SDK analizy dokumentów Narzędzie do etykietowania przykładu analizy dokumentów

Następne kroki

Dowiedz się, jak tworzyć i tworzyć modele niestandardowe: