Wytyczne dotyczące formatowania importowanych dokumentów i adresów URL

Zapoznaj się z tymi wytycznymi dotyczącymi formatowania, aby uzyskać najlepsze wyniki dla zawartości.

Zagadnienia dotyczące formatowania

Po zaimportowaniu pliku lub adresu URL usługa QnA Maker konwertuje i przechowuje zawartość w formacie markdown. Proces konwersji dodaje nowe wiersze w tekście, takie jak \n\n. Znajomość formatu markdown pomaga zrozumieć przekonwertowaną zawartość i zarządzać zawartością baza wiedzy.

Jeśli dodasz lub edytujesz zawartość bezpośrednio w baza wiedzy, użyj formatowania markdown, aby utworzyć zawartość tekstu sformatowanego lub zmienić zawartość formatu markdown, która jest już w odpowiedzi. Usługa QnA Maker obsługuje znaczną część formatu języka znaczników Markdown, aby zapewnić możliwości tekstu sformatowanego do zawartości. Jednak aplikacja kliencka, taka jak czatbot, może nie obsługiwać tego samego zestawu formatów markdown. Ważne jest, aby przetestować wyświetlanie odpowiedzi aplikacji klienckiej.

Zobacz pełną listę typów zawartości i przykładów.

Podstawowe formatowanie dokumentu

Usługa QnA Maker identyfikuje sekcje i podsekcje i relacje w pliku na podstawie wskazówek wizualnych, takich jak:

  • rozmiar czcionki
  • styl czcionki
  • Numeracja
  • Kolory

Uwaga

Obecnie nie obsługujemy wyodrębniania obrazów z przekazanych dokumentów.

Podręczniki produktu

Podręcznik jest zazwyczaj materiałem wskazówek, który towarzyszy produktowi. Ułatwia on użytkownikowi konfigurowanie, używanie, konserwację i rozwiązywanie problemów z produktem. Gdy usługa QnA Maker przetwarza instrukcję ręczną, wyodrębnia nagłówki i podpozycje jako pytania oraz kolejną zawartość jako odpowiedzi. Zobacz przykład tutaj.

Poniżej znajduje się przykład podręcznika ze stroną indeksu i zawartością hierarchiczną

Product Manual example for a knowledge base

Uwaga

Wyodrębnianie działa najlepiej w podręcznikach, które mają spis treści i/lub stronę indeksu oraz czystą strukturę z nagłówkami hierarchicznymi.

Broszury, wytyczne, dokumenty i inne pliki

Wiele innych typów dokumentów można również przetworzyć w celu wygenerowania par QA, pod warunkiem, że mają wyraźną strukturę i układ. Należą do nich: Broszury, wytyczne, raporty, oficjalne dokumenty, dokumenty naukowe, zasady, książki itp. Zobacz przykład tutaj.

Poniżej przedstawiono przykład częściowo ustrukturyzowanego dokumentu bez indeksu:

Azure Blob storage semi-structured Doc

Obsługa dokumentów bez struktury

Niestandardowe odpowiadanie na pytania obsługuje teraz dokumenty bez struktury. Dokument, który nie ma zawartości zorganizowanej w dobrze zdefiniowany hierarchiczny sposób, brakuje struktury zestawu lub ma swobodny przepływ zawartości, można traktować jako dokument bez struktury.

Poniżej znajduje się przykład dokumentu PDF bez struktury:

Unstructured document example for a knowledge base

Obecnie ta funkcja jest dostępna tylko za pośrednictwem przekazywania dokumentów i tylko w formatach plików PDF i DOC.

Ważne

Obsługa pliku/zawartości bez struktury jest dostępna tylko w odpowiedziach na pytania.

Ustrukturyzowany dokument pytań i pytań

Format ustrukturyzowanych odpowiedzi na pytania w plikach DOC jest w postaci przemiennych pytań i odpowiedzi na wiersz, jednego pytania na wiersz, po którym następuje odpowiedź w następującym wierszu, jak pokazano poniżej:

Question1

Answer1

Question2

Answer2

Poniżej znajduje się przykład ustrukturyzowanego dokumentu słowa QnA:

Structured QnA document example for a knowledge base

Pliki TXT ze strukturą, TSV i XLS

QnAs w postaci ustrukturyzowanego pliku txt, tsv lub xls można również przekazać do usługi QnA Maker w celu utworzenia lub rozszerzenia baza wiedzy. Może to być zwykły tekst lub może zawierać zawartość w formacie RTF lub HTML. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.

Pytanie Odpowiedź Metadane (1 klucz: 1 wartość)
Pytanie1 Odpowiedź1 Key1:Value1 | Key2:Value2
Pytanie2 Odpowiedź2 Key:Value

Wszystkie dodatkowe kolumny w pliku źródłowym są ignorowane.

Przykład pliku programu Excel ze strukturą

Poniżej przedstawiono przykład ustrukturyzowanego pliku QnA .xls z zawartością HTML:

Structured QnA excel example for a knowledge base

Przykład alternatywnych pytań dotyczących pojedynczej odpowiedzi w pliku programu Excel

Poniżej znajduje się przykład ustrukturyzowanego pliku QnA .xls z kilkoma alternatywnymi pytaniami dotyczącymi jednej odpowiedzi:

Example of alternate questions for single answer in Excel file

Po zaimportowaniu pliku para pytań i odpowiedzi znajduje się w baza wiedzy, jak pokazano poniżej:

Screenshot of alternate questions for single answer imported into knowledge base

Format danych ustrukturyzowanych za pomocą importu

Importowanie baza wiedzy zastępuje zawartość istniejącego baza wiedzy. Importowanie wymaga ustrukturyzowanego pliku tsv zawierającego informacje o źródle danych. Te informacje pomagają usłudze QnA Maker grupować pary odpowiedzi na pytania i przypisywać je do określonego źródła danych. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.

Pytanie Odpowiedź Źródło Metadane (1 klucz: 1 wartość)
Pytanie1 Odpowiedź1 Adres URL1 Key1:Value1 | Key2:Value2
Pytanie2 Odpowiedź2 Redakcyjne Key:Value

Formatowanie dokumentu z wieloma obrotami

  • Użyj nagłówków i nagłówków podrzędnych, aby oznaczyć hierarchię. Możesz na przykład h1 oznaczać nadrzędną QnA i h2, aby oznaczyć QnA, które powinny być traktowane jako monit. Użyj małego rozmiaru nagłówka, aby oznaczyć kolejną hierarchię. Nie używaj stylu, koloru ani innego mechanizmu, aby sugerować strukturę w dokumencie, usługa QnA Maker nie wyodrębni monitów z wieloma zwrotami.
  • Pierwszy znak nagłówka musi być wielkich liter.
  • Nie należy kończyć nagłówka znakiem ?zapytania .

Przykładowe dokumenty:
Surface Pro (dokument)
Korzyści firmy Contoso (docx)
Korzyści firmy Contoso (pdf)

Adresy URL często zadawanych pytań

Usługa QnA Maker może obsługiwać strony internetowe z często zadawanymi pytaniami w 3 różnych formularzach:

  • Zwykłe strony często zadawanych pytań
  • Strony z linkami — często zadawane pytania
  • Strony często zadawanych pytań ze stroną główną tematów

Zwykłe strony często zadawanych pytań

Jest to najczęściej spotykana strona często zadawanych pytań, na której odpowiedzi są natychmiast zgodne z pytaniami na tej samej stronie.

Poniżej przedstawiono przykład zwykłej strony często zadawanych pytań:

Plain FAQ page example for a knowledge base

Na tej stronie często zadawanych pytań pytania są agregowane razem i są połączone z odpowiedziami, które znajdują się w różnych sekcjach tej samej strony lub na różnych stronach.

Poniżej znajduje się przykład strony często zadawanych pytań z linkami w sekcjach, które znajdują się na tej samej stronie:

Section Link FAQ page example for a knowledge base

Ten typ często zadawanych pytań zawiera stronę Tematy, na której każdy temat jest połączony z odpowiednim zestawem pytań i odpowiedzi na innej stronie. Usługa QnA Maker przeszukiwa wszystkie połączone strony w celu wyodrębnienia odpowiednich pytań i odpowiedzi.

Poniżej znajduje się przykład strony Tematy z linkami do sekcji Często zadawane pytania na różnych stronach.

Deep link FAQ page example for a knowledge base

Adresy URL pomocy technicznej

Usługa QnA Maker może przetwarzać częściowo ustrukturyzowane strony internetowe, takie jak artykuły internetowe, które opisują sposób wykonywania danego zadania, diagnozowanie i rozwiązywanie danego problemu oraz najlepsze rozwiązania dla danego procesu. Wyodrębnianie działa najlepiej w przypadku zawartości, która ma wyraźną strukturę z nagłówkami hierarchicznymi.

Uwaga

Wyodrębnianie artykułów pomocy technicznej jest nową funkcją i jest na wczesnym etapie. Najlepiej sprawdza się w przypadku prostych stron, które są dobrze ustrukturyzowane i nie zawierają złożonych nagłówków/stopek.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

Importowanie i eksportowanie baza wiedzy

Pliki TSV i XLS z wyeksportowanych baza wiedzy mogą być używane tylko przez zaimportowanie plików ze strony Ustawienia w portalu usługi QnA Maker. Nie można ich używać jako źródeł danych podczas tworzenia baza wiedzy lub funkcji + Dodaj plik lub + Dodaj adres URL na stronie Ustawienia.

Podczas importowania bazy wiedzy za pomocą tych plików TSV i XLS pary pytań i odpowiedzi są dodawane do źródła redakcyjnego, a nie do źródeł, z których zostały wyodrębnione QnAs w wyeksportowanej bazie wiedzy.

Następne kroki

Zobacz pełną listę typów zawartości i przykładów