Verarbeiten von Inhalten mit Syntex

Abgeschlossen

Vermutlich verfügt Ihr organization wie Contoso Electronics bereits über zahlreiche Dokumente, und Sie möchten wissen, wie Sie Syntex verwenden können, um den Prozess der Verarbeitung zu optimieren. In dieser Lerneinheit wird beschrieben, wie Syntex Sie bei den Phasen 2, 3 und 4 des Inhaltslebenszyklus unterstützt: Klassifizieren von Inhalten, Extrahieren von Metadaten und Anwenden von Bezeichnungen durch Contoso Electronics.

Diagramm eines typischen Inhaltslebenszyklus, in dem Phase 2, 3 und 4 als Syntex-Inhaltsverarbeitung hervorgehoben sind.

Sie lernen Folgendes:

  • Typen von Dokumentverarbeitungsmodellen, die von Syntex bereitgestellt werden
  • Features, Anforderungen und Einschränkungen der einzelnen Modelle
  • Ein typischer Prozess zum Analysieren von Anforderungen, Einrichten und Trainieren eines Modells

Bevor wir beginnen, empfehlen wir Ihnen, die Websitevorlage "SharePoint Contracts-Verwaltungsteam" auf Ihrer SharePoint-Website einzurichten. Mit dieser Vorlage können Sie mit Beispieldateien, Vorlagen, Bibliotheken und Modellen, die im Lieferumfang dieser Vorlage enthalten sind, üben.

Screenshot: Auswählen der Vorlage für die Vertragsverwaltung

Dokumentverarbeitungsmodelle

Inhaltsverständnis in Microsoft Syntex beginnt mit Dokumentverarbeitungsmodellen. Mit Dokumentverarbeitungsmodellen können Sie Dokumente identifizieren und klassifizieren, die in SharePoint-Dokumentbibliotheken hochgeladen werden, und dann die benötigten Informationen aus jeder Datei extrahieren. Abhängig von den Merkmalen und Zwecken der Dokumente stellt Syntex Ihnen verschiedene Modelle zur Verarbeitung der Dokumente zur Verfügung. Es gibt zwei Kategorien von Dokumentverarbeitungsmodellen: vordefinierte Modelle und benutzerdefinierte Modelle.

Sehen wir uns die wichtigsten Fakten von Modellen in jeder Kategorie an.

Vordefinierte Modelle

Zunächst verfügt Syntex über drei vordefinierte Modelle : Vertragsmodell, Rechnungsmodell und Belegmodell, um wichtige Informationen aus Vertragsdokumenten zu analysieren und zu extrahieren, um Verkaufsrechnungen und Verkaufsbelege zu verarbeiten. Diese vordefinierten Modelle sind vorkonfiguriert und vortrainiert. Anstatt von Grund auf neu zu beginnen, um Ihr Modell zu erstellen, können Sie beginnen, indem Sie eine Datei anhand des vordefinierten Modells analysieren und Felder identifizieren, die Sie extrahieren möchten. Beide Modelle funktionieren für Dateien in den folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.

Vertragsverarbeitung

Das Vertragsverarbeitungsmodell analysiert und extrahiert wichtige Informationen aus Vertragsdokumenten. Das vordefinierte Vertragsverarbeitungsmodell erkennt Verträge in verschiedenen Formaten und extrahiert wichtige Vertragsinformationen wie Name und Adresse des Kunden, Vertragsdauer und Verlängerungsdatum.

Rechnungsverarbeitung

Das Rechnungsverarbeitungsmodell verarbeitet Rechnungen, um wichtige Informationen zu extrahieren. Das vordefinierte Rechnungsverarbeitungsmodell funktioniert für PDF-Dokumente und Bilddateien, unterstützt jedoch nur englischsprachige Rechnungen aus dem USA.

Belegverarbeitung

Verwenden Sie das Belegverarbeitungsmodell, um wichtige Informationen aus gedruckten oder handschriftlichen Belegen abzurufen. Dieses vordefinierte Belegverarbeitungsmodell funktioniert für PDF-Dokumente und Bilddateien, unterstützt aber nur englische Verkaufsbelege aus Australien, Kanada, Großbritannien, Indien und dem USA.

Verwenden vordefinierter Modelle

Um vordefinierte Modelle zu verwenden, erstellen Sie zunächst das Modell. Anschließend laden Sie eine Beispieldatei hoch, um sie mit dem vordefinierten Modell zu vergleichen. Sie müssen dem Modell mitteilen, welche Informationen aus dem Dokument extrahiert werden sollen (Extraktoren auswählen). Nachdem Sie Extraktoren ausgewählt haben, können Sie das Modell speichern und auf die Dokumentbibliothek anwenden. Die von den Extraktoren extrahierten Schlüsseldaten werden in der Dokumentbibliothek angezeigt.

Benutzerdefinierte Modelle

In den meisten Fällen handelt es sich bei Ihren Dokumenten nicht um Verträge, Rechnungen und Belege. Sie müssen benutzerdefinierte Modelle erstellen, um diese Dokumente zu verarbeiten. Es gibt drei Arten von benutzerdefinierten Modellen: Strukturiertes Dokumentverarbeitungsmodell, Freihandformdokumentverarbeitungsmodell und unstrukturiertes Dokumentverarbeitungsmodell. Jede eignet sich am besten für bestimmte Arten von Dokumenten in Bezug auf Informationsstruktur, Dateiformat und unterstützte Sprache. Die Kosten, Anforderungen für die Verwendung der einzelnen Modelle und der Aufwand für die Einrichtung variieren ebenfalls je nach Modelltyp.

Strukturiertes Dokumentverarbeitungsmodell

Ein strukturiertes Dokumentverarbeitungsmodell funktioniert am besten, wenn die Informationen im Dokument in einem Tabellenformat wie Formularen und Rechnungen gespeichert werden. Dieses benutzerdefinierte Modell funktioniert für PDF-Dokumente und Bilddateien. Es unterstützt eine Vielzahl von Sprachen und verwendet die Layoutmethode, um Informationen zu klassifizieren und zu extrahieren.

Freihandform-Dokumentverarbeitungsmodell

Ein Freihandform-Dokumentverarbeitungsmodell eignet sich am besten für unstrukturierte und Freihandform-Dokumente, bei denen die Formate möglicherweise unterschiedlich sind, aber in allen Dokumenten ähnliche Inhalte vorhanden sind. Dieses benutzerdefinierte Modell funktioniert für PDF-Dokumente und Bilddateien, unterstützt jedoch derzeit nur Dokumente in englischer Sprache. Dieses Modell verwendet die Freihandformauswahlmethode, um Informationen zu klassifizieren und zu extrahieren.

Hinweis

Sowohl strukturierte Dokumentverarbeitungs- als auch Freihanddokumentverarbeitungsmodelle basieren auf Power Platform. Sie sollten die Verfügbarkeit von Power Platform überprüfen, bevor Sie sich für die Verwendung dieser beiden Modelle entscheiden. Beide Modelle erfordern AI Builder-Gutschriften. Jeder Microsoft Syntex lizenzierten "Arbeitsplatz" verfügt über 3.500 Guthaben mit der Option, bei Bedarf mehr zu kaufen.

Unstrukturiertes Dokumentverarbeitungsmodell

Wenn Ihre Dokumente über verschiedene Inhaltsstrukturen verfügen, aber ähnliche Schlüsselinformationen enthalten, sollten Sie das unstrukturierte Dokumentverarbeitungsmodell in Betracht ziehen. Unter allen drei benutzerdefinierten Modellen unterstützt das unstrukturierte Dokumentverarbeitungsmodell die breiteste Palette von Dokumenttypen. Dieses Modell unterstützt die lateinischen Sprachen, einschließlich Englisch, Französisch, Deutsch, Italienisch und Spanisch. Es verwendet die Unterrichtsmethode, um die Dateien zu trainieren. Unstrukturiertes Dokumentverarbeitungsmodell ist in allen Regionen verfügbar.

Das folgende Video bietet einen schnellen Überblick über ein unstrukturiertes Dokumentverarbeitungsmodell:

Wählen Sie das folgende Bild aus, um die simulierte Benutzeroberfläche zum Erstellen eines unstrukturierten Dokumentverarbeitungsmodells zu durchlaufen: Interaktiver Leitfaden

Alle Modelle

Für alle Modelle müssen Sie zuerst eine oder mehrere Beispieldateien hochladen, um das Modell zu trainieren. Unterschiedliche Modelle verwenden jedoch unterschiedliche Trainingsmethoden und unterstützen unterschiedliche Dokumenttypen und Sprachen. Darüber hinaus müssen Sie bei einigen Modellen berücksichtigen, dass sie in bestimmten Regionen möglicherweise nicht funktionieren, wenn Power Platform und AI Builder in der Region nicht verfügbar sind. Weitere Informationen zu den Anforderungen und Einschränkungen für jedes Dokumentverarbeitungsmodell finden Sie hier.

Zur Erinnerung:

  • Zentral erstellte Modelle werden als Unternehmensmodelle und lokal als lokale Modelle bezeichnet.
  • Sie können Unternehmensmodelle auf mehrere Bibliotheken anwenden, während Sie lokale Modelle nur auf eine einzelne Bibliothek anwenden können.
  • Wenn ein Modell eine niedrige Zuverlässigkeitsbewertung aufweist, laden Sie zusätzliche Beispieldateien hoch, und trainieren Sie das Modell erneut.

Bevor Sie mit dem Erstellen von Modellen beginnen

  • Überlegen Sie, welche Informationen Sie extrahieren müssen.
  • Wenn Sie ein Syntex-Freihandformular oder ein strukturiertes Modell aktualisieren, vergessen Sie nicht, diese Änderungen zu veröffentlichen, um sie live zu machen. Wählen Sie auf der Seite mit den Modelldetails die zuletzt trainierte Version und dann Veröffentlichen aus.
  • Wenn Sie ein Syntex-Modell aktualisieren, z. B. Extraktoren hinzufügen oder entfernen, denken Sie daran, das Modell mit der Bibliothek zu synchronisieren, der es zugewiesen ist. Die Aktion zum Synchronisieren aktualisiert den Inhaltstyp und die Spalten entsprechend.

Dokumentmarkierung

Zusätzlich zu Dokumentverarbeitungsmodellen bietet Syntex Ihnen die Möglichkeit, Dokumente automatisch mit KI zu markieren. Für Bilder speichert die Bildmarkierung beschreibende Schlüsselwörter, die von KI in der Spalte Bildtags extrahiert wurden, um das Suchen, Sortieren, Filtern und Verwalten von Bildern zu vereinfachen. Bei anderen unterstützten Dokumenten speichert das Taxonomietagging die in Ihrem Terminologiespeicher konfigurierten Begriffe in der Taxonomiespalte , sodass sie einfacher durchsucht, sortiert, gefiltert und verwaltet werden können.

Optical Character Recognition (OCR; optische Zeichenerkennung)

Der OCR-Dienst in Syntex extrahiert gedruckten oder handschriftlichen Text aus Bildern und Dokumenten und indiziert diese dann bei der Suche. Dieser Dienst hilft Ihnen, die Schlüsselwörter und Ausdrücke, nach denen Sie suchen, schnell und genau zu finden.

Contoso Electronics optimiert die Dokumentqualitätsprüfung mit dem strukturierten Dokumentverarbeitungsmodell.

Sehen wir uns nun an, wie Contoso Electronics seinen Ansatz zur Optimierung des Prozesses der Dokumentqualitätsprüfung identifiziert.

Identifizieren des Szenarios

Contoso Electronics, ein großes Unternehmen, das in mehreren Ländern/Regionen tätig ist, möchte sicherstellen, dass alle Papiere den Erwartungen der Kunden in den einzelnen Bereichen entsprechen. Dies umfasst das Betrachten von Dingen wie technischen Entwürfen, Prozessen und das Sicherstellen, dass Kundenbestellungen korrekt sind. Im Grunde geht es darum, sicherzustellen, dass sie die Regeln beachten und alles in Ordnung ist.

In der Vergangenheit führten Dokumentprozessoren bei Contoso Electronics manuell Qualitätsprüfungen durch, was wertvolle Zeit und Ressourcen kostete. Mit Syntex hoffen Dokumentverarbeiter nun, dass wichtige Informationen aus jedem Dokument, das dem Projekt zugeordnet ist, automatisch erfasst werden können, sodass die Qualitätsprüfungen schneller und einfacher werden.

Entscheiden Sie sich für den Ansatz

Um die Dokumentqualitätsüberprüfung von Syntex für Contoso zu implementieren, besteht der erste Schritt darin, zu ermitteln, welches Dokumentverarbeitungsmodell verwendet werden soll. Die Führung bittet die IT-Abteilungen, mit Dokumentverarbeitern aus verschiedenen Projekten und Satellitenstandorten zusammenzuarbeiten, um die Entscheidung zu treffen. Das Team analysiert zunächst die Typen von Contoso-Dokumenten für die Qualitätsprüfung, deren Formate, Inhaltsstruktur und Sprachen.

Das Team stellt bald fest, dass Dokumente bei Contoso Electronics in vielen Formaten erhältlich sind, z. B. PDF-Dokumente, Bilder, Microsoft Word Dokumente, E-Mails und HTML-Seiten. Die Standard Arten von Dokumenten, die einer Qualitätsprüfung unterzogen werden, sind jedoch PDF-Dateien und gescannte Bilder in .jpeg Formaten. Da Contoso Electronics ein multinationales Unternehmen mit Projekten aus der ganzen Welt ist, sind viele Dokumente entweder in lateinischen Alphabetsprachen oder in nicht-alphabetischen Sprachen verfügbar. Außerdem weisen die meisten dieser Dokumente ähnliche Strukturen und Layouts auf. Gemäß der Liste der Features in der Vergleichstabelle jedes benutzerdefinierten Modells stellt das Team fest, dass das strukturierte Dokumentverarbeitungsmodell das geeignete Modell für die Verwendung ist.

Einrichten von Syntex

Als Nächstes muss die IT-Abteilung bestätigen, dass Power Platform und AI Builder an jedem Contoso Electronics-Satellitenstandort verfügbar sind. Nachdem bestätigt wurde, dass alle Satellitenstandorte über Power Platform und AI Builder verfügen, beginnt die IT-Abteilung mit der Einrichtung von Syntex. Contoso Electronics hat die Microsoft 365 Multi-Geo-Umgebung eingerichtet. Das bedeutet, dass sie sich an den Microsoft-Support wenden müssen, da sie das strukturierte Dokumentverarbeitungsmodell an allen Seinen Satellitenstandorten verwenden möchten. Basierend auf den Anforderungen der Dokumentverarbeitung von jedem Satellitenstandort und Hauptsitz entscheidet das Team auch über eine anfängliche Anzahl von Syntex-Lizenzen, die es erhalten muss.

Das Team untersucht auch die Kosten für die Ausführung des Modells. Bei der strukturierten Dokumentverarbeitung werden AI Builder-Gutschriften verwendet. Jede Syntex-Lizenz kann 3.500 Guthaben pro Monat mit einer maximalen Zuordnung von 1 Million Guthaben pro Monat und organization verwenden. Eine Zuordnung von 1 Million Credits ermöglicht die Verarbeitung von 2.000 Dateiseiten. Obwohl nicht verwendete Guthaben nicht von Monat zu Monat übertragen werden, entscheidet das Team nach der Berechnung der geschätzten monatlichen Gutschriften mit dem AI Builder-Rechner, dass das Standardguthaben ausreichend sein sollte. Die IT-Abteilung erstellt dann ein Inhaltscenter und fügt dokumentverarbeiter als andere Administratoren zur Content Center-Website hinzu.

Create und Trainieren des Modells

Bei Contoso Electronics können Dokumentprozessoren jetzt ihre eigenen lokalen strukturierten Dokumentverarbeitungsmodelle erstellen. Sie trainieren diese Modelle, um strukturierte Dokumente wie Ingenieurverträge zu analysieren und Schlüsselbezeichner wie Kundennamen, Projektnummern, Dokumentnummern, status und genehmigende Personen zu extrahieren. Um sicherzustellen, dass Dokumente konform und konsistent bleiben, können Dokumentverarbeiter das Modell so trainieren, dass Dokumente automatisch mit Aufbewahrungs- und Vertraulichkeitsbezeichnungen versehen werden (ab 2023).

Nach dem Trainieren des Modells und dessen Verwendung für Dokumente werden neue Spalten für Anbietername, Projektnummer und Dokumentnummer gemäß den Informationen generiert, die aus Dokumenten extrahiert wurden. Das Modell beschriftet dokumente auch automatisch mit Aufbewahrungs- und Vertraulichkeitsbezeichnungen, wenn es angewendet wird.

In der nächsten Lerneinheit wird erläutert, wie ein Vertragsmanager bei Contoso Electronics Inhaltsabfragen, Regeln und andere Tools verwendet, um Informationen aus den generierten Spalten zu finden. Außerdem wird erläutert, wie Syntex mit anderen Tools kombiniert wird, um den Workflow zu automatisieren.