FormPage Klasse

Stellt eine Seite dar, die vom Eingabedokument erkannt wird. Enthält Zeilen, Wörter, Auswahlmarkierungen, Tabellen und Seitenmetadaten.

Neu in Version 2.1: selection_marks-Eigenschaft , Unterstützung für to_dict - und from_dict methoden

Vererbung
builtins.object
FormPage

Konstruktor

FormPage(**kwargs: Any)

Methoden

from_dict

Konvertiert ein Diktat in der Form einer FormPage in das Modell selbst.

to_dict

Gibt eine Diktatdarstellung von FormPage zurück.

from_dict

Konvertiert ein Diktat in der Form einer FormPage in das Modell selbst.

from_dict(data: Dict) -> FormPage

Parameter

data
dict
Erforderlich

Ein Wörterbuch in form von FormPage.

Gibt zurück

FormPage

Rückgabetyp

to_dict

Gibt eine Diktatdarstellung von FormPage zurück.

to_dict() -> Dict

Gibt zurück

dict

Rückgabetyp

Attribute

height

Die Höhe des Bilds/pdf in Pixel/Zoll.

height: float

lines

Wenn include_field_elements auf true festgelegt ist, wird eine Liste der erkannten Textzeilen zurückgegeben. Für Aufrufe zum Erkennen von Inhalten wird diese Liste immer aufgefüllt. Die maximale Anzahl der zurückgegebenen Zeilen beträgt 300 pro Seite. Die Zeilen werden von oben nach unten sortiert, von links nach rechts, obwohl in bestimmten Fällen die Nähe mit höherer Priorität behandelt wird. Da die Sortierreihenfolge vom erkannten Text abhängt, kann sie sich zwischen Images und OCR-Versionsupdates ändern. Daher sollte die Geschäftslogik auf der tatsächlichen Position der Position der Position basieren, anstatt auf der Reihenfolge. Die Lesereihenfolge der Zeilen kann durch das argument reading_order Schlüsselwort (keyword) angegeben werden (Hinweis: reading_order nur in begin_recognize_content und begin_recognize_content_from_url unterstützt).

lines: List[FormLine]

page_number

Die 1-basierte Nummer der Seite, auf der sich dieser Inhalt befindet.

page_number: int

selection_marks

Liste der Auswahlmarkierungen, die von der Seite extrahiert wurden.

selection_marks: List[FormSelectionMark]

tables

Eine Liste der extrahierten Tabellen, die auf einer Seite enthalten sind.

tables: List[FormTable]

text_angle

Die allgemeine Ausrichtung des Texts im Uhrzeigersinn, gemessen in Grad zwischen (-180, 180).

text_angle: float

unit

Der LengthUnit , der von den Eigenschaften breite, höhe und begrenzungsrahmen verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "Zoll".

unit: str

width

Die Breite des Bilds/pdf in Pixel/Zoll.

width: float