DocumentInformatie hypotheekmodellen
Deze inhoud is van toepassing op:v4.0 (preview)
De Document Intelligence Hypotheekmodellen maken gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) en deep learning-modellen om belangrijke velden uit hypotheekdocumenten te analyseren en te extraheren. Hypotheekdocumenten kunnen van verschillende indelingen en kwaliteit zijn. De API analyseert hypotheekdocumenten en retourneert een gestructureerde JSON-gegevensweergave. De modellen ondersteunen momenteel alleen Engelstalige documenten.
Ondersteunde documenttypen:
- Aanvraag voor uniforme woonlening (formulier 1003)
- Uniform Underwriting and Transmittal Summary (formulier 1008)
- Formulier voor het sluiten van openbaarmaking
Ontwikkelingsopties
Document Intelligence v4.0 (2024-02-29-preview) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:
Functie | Resources | Model-id |
---|---|---|
Hypotheekmodel | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• vooraf samengestelde hypotheek.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
Vereisten voor invoer
Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.
Ondersteunde bestandsindelingen:
Model PDF Afbeelding:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en HTMLRead ✔ ✔ ✔ Indeling ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Algemeen document ✔ ✔ Vooraf gebouwd ✔ ✔ Aangepaste extractie ✔ ✔ Aangepaste classificatie ✔ ✔ ✔ (2024-02-29-preview) Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt).
De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB gratis (F0).
De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.
Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.
De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer
8
-punttekst op 150 punten per inch (DPI).Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.
Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1G-MB voor het neurale model.
Voor het trainen van aangepast classificatiemodel is
1GB
de totale grootte van trainingsgegevens maximaal 10.000 pagina's.
Gegevensextractie van hypotheekdocumenten proberen
Als u wilt zien hoe gegevensextractie werkt voor de hypotheekdocumentenservice, hebt u de volgende resources nodig:
Een Azure-abonnement: u kunt er gratis een maken.
Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (
F0
) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.
Document Intelligence Studio
Selecteer hypotheek op de startpagina van Document Intelligence Studio.
U kunt de voorbeeldhypothecaire documenten analyseren of uw eigen bestanden uploaden.
Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:
Ondersteunde talen en landinstellingen
Zie onze pagina met vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.
Veldextractie 1003 Uniform Residential Loan Application (URLA)
Hier volgen de velden die zijn geëxtraheerd uit een 1003 URLA-formulier in het JSON-uitvoerantwoord.
Name | Type | Description | Voorbeelduitvoer |
---|---|---|---|
LenderLoanNumber | String | Kredietverlenersnummer of universele lening-id | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Aanvraagnummer van het agentschap | 115894 |
Kredietnemer | Object | Een object dat de identiteitsmarkeringen van de kredietnemer bevat, zoals naam, SSN, geboortedatum. | |
Medelener | Object | Een object met de namen van de medelener en ondertekende datum. | |
CurrentEmployment | Object | Een object met informatie over de huidige werkgelegenheid, waaronder: Werkgevernaam, Werkgever Telefoon nummer, Werkgeveradres. | |
Krediet | Object | Een object dat leninggegevens bevat, waaronder: bedrag, doeltype, herfinancieringstype. | |
Eigenschappen | object | Een object met informatie over de eigenschap, waaronder: adres, aantal eenheden, waarde. |
De 1003 URLA-sleutel-waardeparen en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults
sectie van de JSON-uitvoer.
Veldextractie 1008 Uniform Underwriting and Transmittal Summary
Hier volgen de velden die zijn geëxtraheerd uit een 1008-formulier in het JSON-uitvoerantwoord.
Name | Type | Description | Voorbeelduitvoer |
---|---|---|---|
Kredietnemer | Object | Een object met informatie over de kredietnemer, waaronder: naam en aantal kredietnemers. | |
Eigenschappen | Object | Een object met informatie over de eigenschap, waaronder: adres, bezettingsstatus, verkoopprijs. | |
Hypotheek | Object | Een object met informatie over de hypotheek, waaronder: Type lening, afschrijvingstype, doeltype lening. | |
Overnemen | Object | Een object dat informatie bevat over de underwriting-informatie, waaronder: underwriter name, appraiser name, borrower income. | |
Verkoper | Object | Een object met informatie over de verkoper, waaronder: Naam, adres, nummer. |
De sleutel-waardeparen van het formulier 1008 en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults
sectie van de JSON-uitvoer.
Openbaarmaking van hypotheekafsluiting voor veldextractie
Hier volgen de velden die zijn geëxtraheerd uit een formulier voor het vrijgeven van hypotheeksluitingen in het JSON-uitvoerantwoord.
Name | Type | Description | Voorbeelduitvoer |
---|---|---|---|
Sluiten | Object | Een object met informatie over de slotinformatie, waaronder: Uitgiftedatum, Sluitingsdatum, Uitbetalingsdatum. | |
Transactie | Object | Een object dat informatie bevat over de transactiegegevens, waaronder: Naam van de kredietnemer, adres van de kredietnemer, verkopernaam. | |
Krediet | Object | Een object dat leninggegevens bevat, waaronder: term, doel, product. |
De sleutel-waardeparen en regelitems die worden geëxtraheerd voor hypotheekafsluitingen, bevinden zich in de documentResults
sectie van de JSON-uitvoer.
Volgende stappen
Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.