Erste Schritte mit der Beleganalyse in Azure

Abgeschlossen

Azure KI Dokument Intelligenz besteht aus Features, die nach Modelltyp gruppiert sind:

  • Vorgefertigte Modelle – vortrainierte Modelle, die entwickelt wurden, um allgemeine Dokumenttypen wie Rechnungen, Visitenkarten, Ausweisdokumente und vieles mehr zu verarbeiten. Diese Modelle wurden entwickelt, um bestimmte Felder zu erkennen und zu extrahieren, die für jeden Dokumententyp wichtig sind.
  • Benutzerdefinierte Modelle – können trainiert werden, um bestimmte Felder zu identifizieren, die nicht in den vorhandenen vortrainierten Modellen berücksichtigt werden.
  • Dokumentanalyse – eine allgemeine Dokumentenanalyse, die strukturierte Datendarstellungen zurückgibt, einschließlich interessanter Regionen und ihrer Beziehungen untereinander.

Vordefinierte Modelle

Die vorgefertigten Modelle wenden fortschrittliches maschinelles Lernen an, um Text, Schlüssel-Wert-Paare, Tabellen und Strukturen aus Formularen und Dokumenten genau zu identifizieren und zu extrahieren. Diese Funktionen umfassen das Extrahieren von:

  • Kunden- und Lieferantendetails aus Rechnungen
  • Verkaufs- und Transaktionsdetails von Belegen
  • Identifikations- und Überprüfungsdetails aus Ausweisdokumenten
  • Krankenversicherungsdetails
  • Geschäftskontaktdetails
  • Vertrags- und Vertragsparteiendetails aus Verträgen
  • Steuerpflichtige Vergütung, Hypothekenzinsen, Details zu Studienkrediten und mehr

Betrachten Sie z. B. das vorgefertigte Belegmodell. Es verarbeitet Belege indem es:

  • Feldnamen mit Werten abgleicht;
  • Datentabellen identifiziert;
  • Bestimmter Feldtypen wie Datumsangaben, Telefonnummern, Adressen, Summen und andere identifiziert.

Das Belegmodell wurde darauf trainiert, Daten auf verschiedenen Belegarten zu erkennen, z. B. auf Thermobons (auf wärmeempfindlichem Papier gedruckt), Hotelbelegen, Tankbelegen, Kreditkartenbelegen und Parkbelegen.

Zu den erkannten Feldern gehören:

  • Name, Adresse und Telefonnummer des Händlers
  • Datum und Uhrzeit des Kaufs
  • Bezeichnung, Menge und Preis jedes gekauften Artikels
  • Summe, Zwischensumme und Steuerangaben

Jedes Feld- und Datenpaar weist einen Konfidenzfaktor auf, der den wahrscheinlichen Grad der Genauigkeit angibt. Dies kann verwendet werden, um automatisch zu identifizieren, wann eine Person einen Beleg überprüfen muss.

Je nach Belegtyp wurde das Modell darauf trainiert, verschiedene Sprachen zu erkennen. Optimale Ergebnisse bei Verwendung des vorgefertigten Belegmodells erzielen Sie mit den folgenden Bildformaten:

  • JPEG, PNG, BMP, PDF oder TIFF.
  • Dateien müssen im kostenpflichtigen Tarif (S0) kleiner als 500 MB und im kostenlosen Tarif (F0) kleiner als 4 MB sein.
  • Die Bildgröße muss sich zwischen 50 × 50 Pixel und 10000 × 10000 Pixel befinden.
  • PDF-Dokumente maximal 43 × 43 cm
  • Pro Dokument darf nur ein Beleg abgebildet sein.

Sie können für das Training von Modellen Document Intelligence Studio verwenden, eine Benutzeroberfläche zum Testen der Dokumentanalyse, vordefinierter Modelle und zum Erstellen benutzerdefinierter Modelle.

Azure KI Dokument Intelligenz-Ressource

Um Azure KI Dokument Intelligenz zu verwenden, müssen Sie in Ihrem Azure-Abonnement entweder eine Dokument Intelligenz- oder eine Azure KI Services-Ressource erstellen. Wenn Sie Dokument Intelligenz noch nicht verwendet haben, wählen Sie beim Erstellen der Ressource den kostenlosen Tarif auf. Beim kostenlosen Tarif gibt es einige Einschränkungen, z. B. werden nur die ersten beiden Seiten von PDF- oder TIFF-Dokumenten verarbeitet.

Nachdem die Ressource erstellt wurde, können Sie Clientanwendungen erstellen, die mittels Schlüssel und Endpunkt eine Verbindung herstellen und übermittelte Formulare analysieren, oder die Ressource in Dokument Intelligenz Studio verwenden.