Welches Modell sollte ich auswählen?

Wichtig

  • Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
  • Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
  • Die öffentliche Vorschauversion der Clientbibliotheken für Dokument-Intelligence ist standardmäßig die REST-API-Version 2024-02-29-preview.
  • Öffentliche Vorschauversion 2024-02-29-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
  • USA, Osten
  • USA, Westen 2
  • Europa, Westen

Dieser Inhalt gilt für:HäkchenVersion 4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchen3.1 (allgemein verfügbar)Blaues Häkchen3.0 (allgemein verfügbar)

Dieser Inhalt gilt für:Häkchenv3.1 (allgemein verfügbar) | Neueste Version:Lila Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.0

Dieser Inhalt gilt für:Häkchenv3.0 (GA) | Aktuelle Versionen:Lila Häkchenv4.0 (Vorschau)lila-häkchenv3.1

Die Azure KI Dokument Intelligenz unterstützt eine Vielzahl von Modellen, mit denen Sie Ihre Anwendungen um intelligente Dokumentenverarbeitung erweitern und Ihre Workflows optimieren können. Die Auswahl des richtigen Modells ist entscheidend für den Erfolg Ihres Unternehmens. In diesem Artikel stellen wir Ihnen die verfügbaren Dokument Intelligenz-Modelle vor und geben Ihnen Hinweise, wie Sie die beste Lösung für Ihre Projekte auswählen können.

Die folgenden Entscheidungsdiagramme heben die Features der einzelnen von Dokument Intelligenz v3.0 unterstützten Modelle hervor und helfen Ihnen bei der Auswahl des besten Modells, das den Anforderungen Ihrer Anwendung entspricht.

Wichtig

Informieren Sie sich auf der Seite Sprachunterstützung über die unterstützte Sprachtext- und Feldextraktion nach Feature.

Vortrainierte Dokumentanalysemodelle

Dokumenttyp Beispiel Zu extrahierende Daten Für Sie am besten geeignete Lösung
Ein allgemeines Dokument. Ein Vertrag oder ein Brief. Sie möchten in erster Linie geschriebene oder gedruckte Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. Lese-OCR-Modell
Ein Dokument, das strukturelle Informationen enthält. Ein Bericht oder eine Studie. Zusätzlich zum geschriebenen oder gedruckten Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. Layoutanalysemodell
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder (Schlüssel) und Werte formatiert sind. Ein Formular oder Dokument in einem standardisierten Format, das in Ihrem Unternehmen oder Ihrer Branche häufig verwendet wird, z. B. ein Kreditantrag oder eine Umfrage. Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. **Layoutanalysemodell mit dem optionalen Abfragezeichenfolgenparameter features=keyValuePairs aktiviert **

Vortrainierte szenariospezifische Modelle

Dokumenttyp Zu extrahierende Daten Für Sie am besten geeignete Lösung
US-W2-Steuerformular Sie möchten Schlüsselinformationen wie Gehalt, Lohn und einbehaltene Steuern extrahieren. US-Steuermodell W-2
US-Steuerformular 1098 Sie möchten Details zu Hypothekenzinsen wie Prinzipal, Punkten und Steuern extrahieren. US-Steuerformular 1098
US-Steuerformular 1098-E Sie möchten Zinsdetails für das Studentendarlehen extrahieren, z. B. Kreditgeber und Zinsbetrag. US-Steuermodell 1098-E
US-Steuerformular 1098T Sie möchten qualifizierte Studiendetails extrahieren, z. B. Stipendienanpassungen, Status für Studierende und Informationen zum Kreditgeber. US-Steuermodell 1098-T
US-Steuerformular 1099 (Variationen) Sie möchten Informationen aus 1099-Formularen und ihren Variationen (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB) extrahieren. US-Steuermodell 1099
US-Steuerformular 1040 (Variationen) Sie möchten Informationen aus 1040 Formularen und deren Variationen extrahieren (Zeitplan 1, Zeitplan 2, Zeitplan 3, Zeitplan 8812, Zeitplan A, Zeitplan B, Zeitplan C, Zeitplan D, Zeitplan E, Zeitplan EIC, Zeitplan F, Zeitplan H, Zeitplan J, Zeitplan R, Schedule SE, Plan Senior). US-Steuermodell 1040
Vertrag (rechtliche Vereinbarung zwischen Parteien). Sie möchten Vertragsvereinbarungsdetails wie Parteien, Datumsangaben und Intervalle extrahieren. Vertragsmodell
Krankenversicherungskarte oder Krankenversicherungs-ID. Sie möchten Schlüsselinformationen wie Versicherer, Mitglieds-ID, verschreibungspflichtige Leistungen und Gruppennummer extrahieren. Krankenversicherungskartenmodell
Kredit-/Debitkarte . Sie möchten wichtige Informationsbankkarten wie Kartennummer und Bankname extrahieren. Kredit-/Debitkartenmodell
Heiratsurkunde . Sie möchten wichtige Informationen aus Ehescheinen extrahieren. Heiratsurkunde-Modell
Rechnung oder Abrechnung. Sie möchten Schlüsselinformationen wie Kundenname, Rechnungsadresse und fälligen Betrag extrahieren. Rechnungsmodell
Quittung, Gutschein oder einseitiger Hotelbeleg. Sie möchten Schlüsselinformationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme extrahieren. Belegmodell
Ausweisdokument (ID), z. B. ein Führerschein oder internationaler Reisepass. Sie möchten Schlüsselinformationen wie Vorname, Nachname, Geburtsdatum, Adresse und Unterschrift extrahieren. Ausweisdokumentmodell
US Mortgage 1003 . Sie möchten Schlüsselinformationen aus dem Antrag für ein einheitliches Wohnbaudarlehen extrahieren. 1003-Formularmodell
US Mortgage 1008 . Sie möchten wichtige Informationen aus der Uniform Underwriting and Transmittal Summary extrahieren. 1008-Formularmodell
US-Hypothekenabschluss-Offenlegung . Sie möchten wichtige Informationen aus einem Offenlegungsformular für Hypothekenabschluss extrahieren. Formularmodell zur Offenlegung von Hypothekenabschluss
Gemischtartige Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Benutzerdefiniertes Modell

Tipp

  • Wenn Sie immer noch nicht sicher sind, welches vortrainierte Modell verwendet werden soll, probieren Sie das Layoutmodell mit aktiviertem optionalen Abfragezeichenfolgenparameter features=keyValuePairs aus.
  • Das Layoutmodell wird von der Lese-OCR-Engine unterstützt, mit der Seiten, Tabellen, Stile, Textlinien, Wörter, Orte und Sprachen erkannt werden können.

Benutzerdefinierte Extraktionsmodelle

Trainingssatz Beispieldokumente Für Sie am besten geeignete Lösung
Strukturierte, konsistente Dokumente mit einem statischen Layout. Strukturierte Formulare wie Fragebögen oder Anwendungen. Benutzerdefiniertes Vorlagenmodell
Strukturierte, halbstrukturierte und unstrukturierte Dokumente. ● Strukturiert → Umfragen
● Halbstrukturiert → Rechnungen
● Unstrukturiert → Briefe
Benutzerdefiniertes neuronales Modell
Eine Sammlung von mehreren Modellen, die jeweils anhand von Dokumenten ähnlicher Art trainiert wurden. ● Lieferantenbestellungen
● Ausrüstungsbestellungen
● Möbelbestellungen
Alle zusammen in einem einzelnen Modell.
Zusammengestelltes benutzerdefiniertes Modell

Benutzerdefiniertes Klassifizierungsmodell

Trainingssatz Beispieldokumente Für Sie am besten geeignete Lösung
Mindestens zwei verschiedene Dokumenttypen. Formulare, Briefe oder Dokumente Benutzerdefiniertes Klassifizierungsmodell

Nächste Schritte