Formatierungsrichtlinien für importierte Dokumente und URLs

Überprüfen Sie diese Formatierungsrichtlinien, um die besten Ergebnisse für Ihre Inhalte zu erzielen.

Überlegungen zur Formatierung

Nach dem Importieren einer Datei oder URL konvertiert QnA Maker den Inhalt im Markdown-Format und speichert diesen. Beim Konvertierungsvorgang werden neue Zeilen im Text hinzugefügt, z. B. \n\n. Wenn Sie sich bereits mit dem Markdown-Format auskennen, können Sie den konvertierten Inhalt eher verstehen und den Inhalt der Wissensdatenbank verwalten.

Wenn Sie Ihren Inhalt direkt in der Wissensdatenbank hinzufügen oder bearbeiten, können Sie das Markdown-Format verwenden, um umfangreiche Textinhalte zu erstellen oder Inhalte im Markdown-Format zu ändern, die bereits in der Antwort vorhanden sind. QnA Maker unterstützt einen Großteil des Markdown-Formats, um umfassende Textfunktionen für Ihre Inhalte bereitzustellen. Die Clientanwendung, z. B. ein Chatbot, unterstützt jedoch möglicherweise nicht dieselben Markdown-Formate. Es ist wichtig, die Anzeige von Antworten in der Clientanwendung zu testen.

Hier finden Sie eine vollständige Liste mit Inhaltstypen und Beispielen.

Grundlegende Dokumentformatierung

QnA Maker identifiziert Abschnitte und Unterabschnitte sowie Beziehungen in der Datei anhand von visuellen Hinweisen wie:

  • Schriftgrad
  • Schriftstil
  • Nummerierung
  • Farben

Hinweis

Das Extrahieren von Bildern aus hochgeladenen Dokumenten wird derzeit nicht unterstützt.

Produkthandbücher

Bei einem Handbuch handelt es sich in der Regel um Anleitungen, die mit einem Produkt geliefert werden. Es hilft dem Benutzer beim Einrichten, Verwenden und Warten des Produkts sowie der Problembehandlung. Wenn QnA Maker ein Handbuch verarbeitet, werden die Überschriften und Unterüberschriften als Fragen und die nachfolgenden Inhalte als Antworten extrahiert. Ein Beispiel finden Sie hier.

Unten sehen Sie ein Beispiel für ein Handbuch mit einer Indexseite und hierarchischen Inhalten.

Product Manual example for a knowledge base

Hinweis

Das Extrahieren funktioniert am besten bei Handbüchern, die über ein Inhaltsverzeichnis und/oder eine Indexseite verfügen und eine klare Struktur mit hierarchischen Überschriften aufweisen.

Broschüren, Richtlinien, Artikel und andere Dateien

Viele andere Arten von Dokumenten können ebenfalls verarbeitet werden, um QA-Paare zu generieren, vorausgesetzt, sie weisen eine klare Struktur und ein klares Layout auf. Dazu gehören: Broschüren, Leitfäden, Berichte, Whitepaper, wissenschaftliche Veröffentlichungen, Richtlinien, Bücher usw. Ein Beispiel finden Sie hier.

Unten sehen Sie ein Beispiel für ein semistrukturiertes Dokument ohne Index:

Azure Blob storage semi-structured Doc

Unterstützung unstrukturierter Dokumente

„Benutzerdefinierte Fragen und Antworten“ unterstützt nun unstrukturierte Dokumente. Ein Dokument, dessen Inhalt nicht in einer klar definierten hierarchischen Weise organisiert ist, dem eine festgelegte Struktur fehlt oder dessen Inhalt frei fließend ist, kann als unstrukturiertes Dokument betrachtet werden.

Im Anschluss sehen Sie ein Beispiel für ein unstrukturiertes PDF-Dokument:

Unstructured document example for a knowledge base

Diese Funktionalität ist derzeit nur über den Dokumentupload und nur für Dateien im PDF- und DOC-Format verfügbar.

Wichtig

Unterstützung für unstrukturierte Dateien/Inhalte ist nur in „Fragen und Antworten“ verfügbar.

Strukturiertes QnA-Dokument

Das Format für strukturierte Fragen/Antworten in DOC-Dateien besteht aus abwechselnden Fragen und Antworten pro Zeile: eine Frage pro Zeile, gefolgt von ihrer Antwort in der folgenden Zeile, wie unten gezeigt:

Question1

Answer1

Question2

Answer2

Unten sehen Sie ein Beispiel für ein strukturiertes QnA-Word-Dokument:

Structured QnA document example for a knowledge base

Strukturierte TXT-, TSV- und XLS-Dateien

QnAs in Form von strukturierten TXT-, TSV- oder XLS-Dateien können auch in QnA Maker hochgeladen werden, um eine Wissensdatenbank zu erstellen oder zu erweitern. Dabei kann es sich um Nur-Text-Dateien oder um Dateien mit Inhalten im RTF- oder HTML-Format handeln. Frage-Antwort-Paare verfügen über ein optionales Metadatenfeld, mit dem Frage-Antwort-Paare in Kategorien zusammengefasst werden können.

Frage Antwort Metadaten (1 Schlüssel: 1 Wert)
Frage1 Antwort1 Key1:Value1 | Key2:Value2
Frage2 Antwort2 Key:Value

Alle weiteren Spalten in der Quelldatei werden ignoriert.

Beispiel für eine strukturierte Excel-Datei

Unten sehen Sie ein Beispiel für eine strukturierte QnA-XLS-Datei mit HTML-Inhalten:

Structured QnA excel example for a knowledge base

Beispiel für alternative Fragen zu einer einzelnen Antwort in einer Excel-Datei

Unten sehen Sie ein Beispiel für eine strukturierte QnA-XLS-Datei mit mehreren alternativen Fragen zu einer einzelnen Antwort:

Example of alternate questions for single answer in Excel file

Nachdem die Datei importiert wurde, befindet sich das Frage- und Antwortpaar in der Wissensdatenbank wie nachfolgend gezeigt:

Screenshot of alternate questions for single answer imported into knowledge base

Strukturiertes Datenformat durch Import

Beim Importieren einer Wissensdatenbank wird der Inhalt der vorhandenen Wissensdatenbank ersetzt. Der Import erfordert eine strukturierte TSV-Datei, die Informationen zur Datenquelle enthält. Diese Informationen helfen QnA Maker beim Gruppieren der Frage-Antwort-Paare und dem Zuweisen zu einer bestimmten Datenquelle. Frage-Antwort-Paare verfügen über ein optionales Metadatenfeld, mit dem Frage-Antwort-Paare in Kategorien zusammengefasst werden können.

Frage Antwort `Source` Metadaten (1 Schlüssel: 1 Wert)
Frage1 Antwort1 URL1 Key1:Value1 | Key2:Value2
Frage2 Antwort2 Redaktionelle Änderung Key:Value

Dokumentformatierung mit Mehrfachdurchläufen

  • Verwenden Sie Überschriften und Unterüberschriften zum Angeben der Hierarchie. Beispielsweise können Sie h1 hinzufügen, um die übergeordnete QnA zu bezeichnen, und h2, um die QnA anzugeben, die als Aufforderung verwendet werden soll. Verwenden Sie einen kleinen Überschrifts-Schriftgrad, um nachfolgende Hierarchie anzugeben. Verwenden Sie keine Auszeichnung, Farbe oder einen anderen Mechanismus zum Angeben von Struktur in Ihrem Dokument, QnA Maker kann die Mehrfachdurchlauf-Aufforderungen nicht extrahieren.
  • Das erste Zeichen der Überschrift muss groß geschrieben werden.
  • Beenden Sie eine Überschrift nicht mit einem Fragezeichen, ?.

Beispieldokumente:
Surface Pro (DOCX)
Contoso Benefits (DOCX)
Contoso Benefits (PDF)

FAQ-URLs

QnA Maker kann Webseiten mit häufig gestellten Fragen auf drei Arten unterstützen:

  • Einfache FAQ-Seiten
  • FAQ-Seiten mit Links
  • FAQ-Seiten mit einer Themenstartseite

Einfache FAQ-Seiten

Dies ist der am häufigsten verwendete Typ einer FAQ-Seite, bei der auf der gleichen Seite die Antworten unmittelbar auf die Fragen folgen.

Unten sehen Sie ein Beispiel für eine einfache FAQ-Seite:

Plain FAQ page example for a knowledge base

Bei diesem FAQ-Seitentyp sind Fragen zusammengefasst und mit Antworten verknüpft, die sich in verschiedenen Abschnitten auf derselben Seite oder auf verschiedenen Seiten befinden.

Unten sehen Sie ein Beispiel für eine FAQ-Seite mit Links in Abschnitten, die sich auf derselben Seite befinden:

Section Link FAQ page example for a knowledge base

Diese Art von FAQ verfügt über eine Themenseite, auf der jedes Thema mit einem entsprechenden Satz von Fragen und Antworten auf einer anderen Seite verknüpft ist. QnA Maker durchsucht alle verknüpften Seiten, um die entsprechenden Fragen und Antworten zu extrahieren.

Unten sehen Sie ein Beispiel für eine Themenseite mit Links zu FAQ-Abschnitten auf verschiedenen Seiten.

Deep link FAQ page example for a knowledge base

Support-URLs

QnA Maker kann semistrukturierte Supportwebseiten verarbeiten. Hierzu zählen beispielsweise Webartikel, in denen die Vorgehensweise zum Ausführen einer bestimmte Aufgabe, die Diagnostizierung oder Behebung eines bestimmten Problems oder die Verwendung bewährter Methoden für einen bestimmten Prozess beschrieben wird. Die Extraktion funktioniert am besten für Inhalte mit klarer Struktur und hierarchischen Überschriften.

Hinweis

Die Extraktion für Supportartikel ist ein neues Feature und befindet sich noch in einer frühen Phase. Sie funktioniert am besten für einfache, gut strukturierte Seiten ohne komplexe Kopf- und Fußzeilen.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

Importieren und Exportieren der Knowledge Base

TSV- und XLS-Dateien aus exportierten Wissensdatenbanken können nur verwendet werden, indem die Dateien von der Seite Einstellungen im QnA Maker-Portal importiert werden. Sie können nicht als Datenquellen während der Erstellung der Wissensdatenbank oder über die Funktion + Datei hinzufügen oder + URL hinzufügen auf der Seite Einstellungen verwendet werden.

Wenn Sie die Wissensdatenbank über diese TSV- und XLS-Dateien importieren, werden die QnA-Paare der redaktionellen Quelle hinzugefügt und nicht den Quellen, aus denen die QnAs in der exportierten Wissensdatenbank extrahiert wurden.

Nächste Schritte

Hier finden Sie eine vollständige Liste mit Inhaltstypen und Beispielen.