Formatrichtlinien für benutzerdefinierte Frageantworten

Überprüfen Sie diese Formatierungsrichtlinien, um die besten Ergebnisse für Ihre Inhalte zu erzielen.

Überlegungen zur Formatierung

Nach dem Importieren einer Datei oder URL konvertiert und speichert die benutzerdefinierte Frageantwort Ihren Inhalt im Markdown-Format. Beim Konvertierungsvorgang werden neue Zeilen im Text hinzugefügt, z. B. \n\n. Wenn Sie sich bereits mit dem Markdown-Format auskennen, können Sie den konvertierten Inhalt eher verstehen und den Inhalt des Projekts verwalten.

Wenn Sie Ihren Inhalt direkt im Projekt hinzufügen oder bearbeiten, können Sie das Markdown-Format verwenden, um umfangreiche Textinhalte zu erstellen oder Inhalte im Markdown-Format zu ändern, die bereits in der Antwort vorhanden sind. Benutzerdefinierte Frageantworten unterstützen einen Großteil des Markdownformats, um Rich-Text-Funktionen zu Ihren Inhalten zu bringen. Die Clientanwendung, z. B. ein Chatbot, unterstützt jedoch möglicherweise nicht dieselben Markdown-Formate. Es ist wichtig, die Anzeige von Antworten in der Clientanwendung zu testen.

Grundlegende Dokumentformatierung

Benutzerdefinierte Frageantwort identifiziert Abschnitte und Unterabschnitte und Beziehungen in der Datei basierend auf visuellen Hinweisen wie:

  • Schriftgrad
  • Schriftstil
  • Nummerierung
  • Farben

Hinweis

Das Extrahieren von Bildern aus hochgeladenen Dokumenten wird derzeit nicht unterstützt.

Produkthandbücher

Bei einem Handbuch handelt es sich in der Regel um Anleitungen, die mit einem Produkt geliefert werden. Es hilft dem Benutzer beim Einrichten, Verwenden und Warten des Produkts sowie der Problembehandlung. Wenn benutzerdefinierte Frageantworten ein Handbuch verarbeiten, extrahiert sie die Überschriften und Unterüberschriften als Fragen und den nachfolgenden Inhalt als Antworten. Ein Beispiel finden Sie hier.

Unten sehen Sie ein Beispiel für ein Handbuch mit einer Indexseite und hierarchischen Inhalten.

Product Manual example for a project

Hinweis

Das Extrahieren funktioniert am besten bei Handbüchern, die über ein Inhaltsverzeichnis und/oder eine Indexseite verfügen und eine klare Struktur mit hierarchischen Überschriften aufweisen.

Broschüren, Richtlinien, Artikel und andere Dateien

Viele andere Arten von Dokumenten können ebenfalls zum Generieren von Frage-Antwort-Paaren verarbeitet werden, vorausgesetzt, sie weisen eine klare Struktur und ein klares Layout auf. Dazu gehören: Broschüren, Leitfäden, Berichte, Whitepaper, wissenschaftliche Veröffentlichungen, Richtlinien, Bücher usw. Ein Beispiel finden Sie hier.

Unten sehen Sie ein Beispiel für ein semistrukturiertes Dokument ohne Index:

Azure Blob storage semi-structured Doc

Unterstützung unstrukturierter Dokumente

„Benutzerdefinierte Fragen und Antworten“ unterstützt nun unstrukturierte Dokumente. Ein Dokument, dessen Inhalt nicht in einer klar definierten hierarchischen Weise organisiert ist, dem eine festgelegte Struktur fehlt oder dessen Inhalt frei fließend ist, kann als unstrukturiertes Dokument betrachtet werden.

Im Anschluss sehen Sie ein Beispiel für ein unstrukturiertes PDF-Dokument:

Unstructured document example for a project

Hinweis

F&A-Paare werden nicht auf der Registerkarte „Quellen bearbeiten“ für nicht strukturierte Quellen extrahiert.

Wichtig

Unterstützung für unstrukturierte Dateien/Inhalte ist nur in der benutzerdefinierten Frageantwort verfügbar.

Strukturiertes benutzerdefiniertes Frageantwortdokument

Das Format für strukturierte Fragen und Antworten in DOC-Dateien besteht aus zeilenweise abwechselnden Fragen und Antworten: eine Frage pro Zeile, gefolgt von der zugehörigen Antwort in der folgenden Zeile, wie unten gezeigt:

Question1

Answer1

Question2

Answer2

Nachfolgend finden Sie ein Beispiel für ein strukturiertes benutzerdefiniertes Frageantwort-Wortdokument:

Structured custom question answering document example for a project

Strukturierte TXT-, TSV- und XLS-Dateien

Benutzerdefinierte Frageantworten in Form von strukturierten .txt, TSV - oder .xls-Dateien können auch in benutzerdefinierte Frageantworten hochgeladen werden, um ein Projekt zu erstellen oder zu erweitern. Dabei kann es sich um Nur-Text-Dateien oder um Dateien mit Inhalten im RTF- oder HTML-Format handeln. Frage-Antwort-Paare verfügen über ein optionales Metadatenfeld, mit dem Frage-Antwort-Paare in Kategorien zusammengefasst werden können.

Frage Antwort Metadaten (1 Schlüssel: 1 Wert)
Frage1 Antwort1 Key1:Value1 | Key2:Value2
Frage2 Antwort2 Key:Value

Alle weiteren Spalten in der Quelldatei werden ignoriert.

Strukturiertes Datenformat durch Import

Wenn Sie ein Projekt importieren, wird der Inhalt des vorhandenen Projekts ersetzt. Der Import erfordert eine strukturierte TSV-Datei, die Informationen zur Datenquelle enthält. Diese Informationen helfen beim Gruppieren der Frage-Antwort-Paare und weisen sie einer bestimmten Datenquelle zu. Frage-Antwort-Paare verfügen über ein optionales Metadatenfeld, mit dem Frage-Antwort-Paare in Kategorien zusammengefasst werden können. Das Importformat muss dem Format der exportierten Wissensdatenbank ähneln.

Frage Antwort `Source` Metadaten (1 Schlüssel: 1 Wert) QnaId
Frage1 Antwort1 URL1 Key1:Value1 | Key2:Value2 QnaId 1
Frage2 Antwort2 Redaktionelle Änderung Key:Value QnaId 2

Dokumentformatierung mit Mehrfachdurchläufen

  • Verwenden Sie Überschriften und Unterüberschriften zum Angeben der Hierarchie. Beispielsweise können Sie h1 zum Bezeichnen der Antwort auf die übergeordnete Frage und h2 zum Bezeichnen der Frageantwort verwenden, die als Eingabeaufforderung interpretiert werden soll. Verwenden Sie einen kleinen Überschrifts-Schriftgrad, um nachfolgende Hierarchie anzugeben. Verwenden Sie keinen Stil, keine Farbe oder einen anderen Mechanismus, um die Struktur in Ihrem Dokument zu implizieren, die benutzerdefinierte Fragebeantwortung extrahiert die Multi-Turn-Eingabeaufforderungen nicht.
  • Das erste Zeichen der Überschrift muss groß geschrieben werden.
  • Beenden Sie eine Überschrift nicht mit einem Fragezeichen, ?.

Beispieldokumente:
Surface Pro (DOCX)
Contoso Benefits (DOCX)
Contoso Benefits (PDF)

FAQ-URLs

Benutzerdefinierte Frageantworten können HÄUFIG gestellte Webseiten in drei verschiedenen Formen unterstützen:

  • Einfache FAQ-Seiten
  • FAQ-Seiten mit Links
  • FAQ-Seiten mit einer Themenstartseite

Einfache FAQ-Seiten

Dies ist der am häufigsten verwendete Typ einer FAQ-Seite, bei der auf der gleichen Seite die Antworten unmittelbar auf die Fragen folgen.

Bei diesem FAQ-Seitentyp sind Fragen zusammengefasst und mit Antworten verknüpft, die sich in verschiedenen Abschnitten auf derselben Seite oder auf verschiedenen Seiten befinden.

Unten sehen Sie ein Beispiel für eine FAQ-Seite mit Links in Abschnitten, die sich auf derselben Seite befinden:

Section Link FAQ page example for a project

Diese Art von FAQ verfügt über eine Themenseite, auf der jedes Thema mit einem entsprechenden Satz von Fragen und Antworten auf einer anderen Seite verknüpft ist. Die Frageantwort durchforstet alle verknüpften Seiten, um die entsprechenden Fragen und Antworten zu extrahieren.

Unten sehen Sie ein Beispiel für eine Themenseite mit Links zu FAQ-Abschnitten auf verschiedenen Seiten.

Deep link FAQ page example for a project

Support-URLs

Benutzerdefinierte Frageantworten können halbstrukturierte Supportwebseiten verarbeiten, z. B. Webartikel, die beschreiben, wie eine bestimmte Aufgabe ausgeführt wird, wie sie ein bestimmtes Problem diagnostizieren und beheben und was die bewährten Methoden für einen bestimmten Prozess sind. Die Extraktion funktioniert am besten für Inhalte mit klarer Struktur und hierarchischen Überschriften.

Hinweis

Die Extraktion für Supportartikel ist ein neues Feature und befindet sich noch in einer frühen Phase. Sie funktioniert am besten für einfache, gut strukturierte Seiten ohne komplexe Kopf- und Fußzeilen.

Projekt importieren und exportieren

TSV- und XLS-Dateien aus exportierten Projektion können nur verwendet werden, indem die Dateien von der Seite Einstellungen in Language Studio importiert werden. Sie können nicht als Datenquellen bei der Erstellung von Projekten oder über die Funktion + Datei hinzufügen oder + URL hinzufügen auf der Seite Einstellungen verwendet werden.

Wenn Sie das Projekt über diese TSV- und XLS-Dateien importieren, werden die Frage-Antwort-Paare der redaktionellen Quelle hinzugefügt und nicht den Quellen, aus denen die Fragen und Antworten in dem exportierten Projekt extrahiert wurden.

Nächste Schritte