FormPage Klasse
Stellt eine Seite dar, die vom Eingabedokument erkannt wird. Enthält Zeilen, Wörter, Auswahlmarkierungen, Tabellen und Seitenmetadaten.
Neu in Version 2.1: selection_marks-Eigenschaft , Unterstützung für to_dict - und from_dict methoden
- Vererbung
-
builtins.objectFormPage
Konstruktor
FormPage(**kwargs: Any)
Methoden
from_dict |
Konvertiert ein Diktat in der Form einer FormPage in das Modell selbst. |
to_dict |
Gibt eine Diktatdarstellung von FormPage zurück. |
from_dict
Konvertiert ein Diktat in der Form einer FormPage in das Modell selbst.
from_dict(data: Dict) -> FormPage
Parameter
Gibt zurück
FormPage
Rückgabetyp
to_dict
Gibt eine Diktatdarstellung von FormPage zurück.
to_dict() -> Dict
Gibt zurück
dict
Rückgabetyp
Attribute
height
Die Höhe des Bilds/pdf in Pixel/Zoll.
height: float
lines
Wenn include_field_elements auf true festgelegt ist, wird eine Liste der erkannten Textzeilen zurückgegeben. Für Aufrufe zum Erkennen von Inhalten wird diese Liste immer aufgefüllt. Die maximale Anzahl der zurückgegebenen Zeilen beträgt 300 pro Seite. Die Zeilen werden von oben nach unten sortiert, von links nach rechts, obwohl in bestimmten Fällen die Nähe mit höherer Priorität behandelt wird. Da die Sortierreihenfolge vom erkannten Text abhängt, kann sie sich zwischen Images und OCR-Versionsupdates ändern. Daher sollte die Geschäftslogik auf der tatsächlichen Position der Position der Position basieren, anstatt auf der Reihenfolge. Die Lesereihenfolge der Zeilen kann durch das argument reading_order Schlüsselwort (keyword) angegeben werden (Hinweis: reading_order nur in begin_recognize_content und begin_recognize_content_from_url unterstützt).
lines: List[FormLine]
page_number
Die 1-basierte Nummer der Seite, auf der sich dieser Inhalt befindet.
page_number: int
selection_marks
Liste der Auswahlmarkierungen, die von der Seite extrahiert wurden.
selection_marks: List[FormSelectionMark]
tables
Eine Liste der extrahierten Tabellen, die auf einer Seite enthalten sind.
tables: List[FormTable]
text_angle
Die allgemeine Ausrichtung des Texts im Uhrzeigersinn, gemessen in Grad zwischen (-180, 180).
text_angle: float
unit
Der LengthUnit , der von den Eigenschaften breite, höhe und begrenzungsrahmen verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "Zoll".
unit: str
width
Die Breite des Bilds/pdf in Pixel/Zoll.
width: float
Azure SDK for Python
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für