FormPage Clase

Representa una página reconocida en el documento de entrada. Contiene líneas, palabras, marcas de selección, tablas y metadatos de página.

Novedad de la versión v2.1: selection_marks propiedad, compatibilidad con métodos de to_dict y from_dict

Herencia
builtins.object
FormPage

Constructor

FormPage(**kwargs: Any)

Métodos

from_dict

Convierte un dict en la forma de formPage en el propio modelo.

to_dict

Devuelve una representación dict de FormPage.

from_dict

Convierte un dict en la forma de formPage en el propio modelo.

from_dict(data: Dict) -> FormPage

Parámetros

data
dict
Requerido

Diccionario en la forma de FormPage.

Devoluciones

FormPage

Tipo de valor devuelto

to_dict

Devuelve una representación dict de FormPage.

to_dict() -> Dict

Devoluciones

dict

Tipo de valor devuelto

Atributos

height

Alto de la imagen/PDF en píxeles/pulgadas, respectivamente.

height: float

lines

Cuando include_field_elements se establece en true, se devuelve una lista de líneas de texto reconocidas. Para que las llamadas reconozcan contenido, esta lista siempre se rellena. El número máximo de líneas devueltas es de 300 por página. Las líneas se ordenan de arriba a abajo, de izquierda a derecha, aunque en determinados casos la proximidad se trata con mayor prioridad. Dado que el criterio de ordenación depende del texto detectado, puede cambiar entre imágenes y actualizaciones de la versión de OCR. Por lo tanto, la lógica de negocios debe basarse en la ubicación de línea real en lugar del orden. El orden de lectura de las líneas se puede especificar mediante el argumento de palabra clave reading_order (Nota: reading_order solo se admite en begin_recognize_content y begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Número basado en 1 de la página en la que está presente este contenido.

page_number: int

selection_marks

Lista de marcas de selección extraídas de la página.

selection_marks: List[FormSelectionMark]

tables

Lista de tablas extraídas contenidas en una página.

tables: List[FormTable]

text_angle

Orientación general del texto en dirección de sentido de las agujas del reloj, medida en grados entre (-180, 180].

text_angle: float

unit

utilizado LengthUnit por las propiedades del cuadro de límite, alto y ancho. En el caso de las imágenes, la unidad es "píxel". Para PDF, la unidad es "pulgada".

unit: str

width

Ancho de la imagen/PDF en píxeles/pulgadas, respectivamente.

width: float