匯入檔和 URL 的格式指導方針

請檢閱這些格式指導方針,以取得內容的最佳結果。

格式化考慮

匯入檔案或 URL 之後,QnA Maker 會以 Markdown 格式轉換並儲存您的內容。 轉換程式會在文字中加入新的行,例如 \n\n。 Markdown 格式的知識可協助您瞭解已轉換的內容及管理 知識庫 內容。

如果您直接在 知識庫 中新增或編輯內容,請使用 Markdown 格式來建立 RTF 內容,或變更已在答案中的 Markdown 格式內容。 QnA Maker 支援許多 Markdown 格式,以將 RTF 功能帶入您的內容。 不過,用戶端應用程式,例如聊天機器人可能不支援相同的 Markdown 格式集。 請務必測試用戶端應用程式的答案顯示。

請參閱內容類型和範例的完整清單

基本檔案格式設定

QnA Maker 會根據視覺線索,識別檔案中的區段和子區段和關聯性,例如:

  • 字型大小
  • 字型樣式
  • 編號
  • colors

注意

我們目前不支援從上傳的檔擷取影像。

產品手冊

手冊通常是產品隨附的指引材料。 它可協助用戶設定、使用、維護及疑難解答產品。 當 QnA Maker 處理手動時,它會將標題和子標題擷取為問題,並將後續內容擷取為解答。 請參閱這裡的範例

以下是具有索引頁面和階層式內容的手動範例

Product Manual example for a knowledge base

注意

擷取適用於具有目錄和/或索引頁面的手冊,以及具有階層式標題的清楚結構。

摺頁冊、指導方針、檔和其他檔案

許多其他類型的檔也可以處理以產生 QA 配對,前提是它們具有清楚的結構和版面配置。 其中包括:小冊子、指導方針、報告、白皮書、科學論文、政策、書籍等。請參閱這裡的範例

以下是半結構化檔的範例,不含索引:

Azure Blob storage semi-structured Doc

非結構化文件支援

自定義問題解答現在支援非結構化檔。 文件沒有以妥善定義的階層式方式組織其內容、遺漏集合結構,或將其內容自由流動視為非結構化檔。

以下是非結構化 PDF 檔的範例:

Unstructured document example for a knowledge base

這項功能目前只能透過檔上傳使用,僅適用於 PDF 和 DOC 檔案格式。

重要

非結構化檔案/內容的支援僅適用於問題解答。

結構化 QnA 檔

DOC 檔案中結構化問答的格式是以每行交替的問題和解答的形式,每行一個問題後面接著下一行的答案,如下所示:

Question1

Answer1

Question2

Answer2

以下是結構化 QnA 單字檔的範例:

Structured QnA document example for a knowledge base

結構化 TXTTSVXLS 檔案

結構化 .txt.tsv.xls 檔案形式的 QnA 也可以上傳至 QnA Maker,以建立或增強 知識庫。 這些可以是純文本,或可以在 RTF 或 HTML 中擁有內容。 QnA 配對 具有選擇性的元數據欄位,可用來將 QnA 配對分組為類別。

問題 回答 元資料 (1 個索引鍵:1 個值)
問題 1 Answer1 Key1:Value1 | Key2:Value2
問題 2 Answer2 Key:Value

系統會忽略原始程序檔中的任何其他數據行。

結構化 Excel 檔案的範例

以下是具有 HTML 內容的結構化 QnA .xls 檔案範例:

Structured QnA excel example for a knowledge base

Excel 檔案中單一答案的替代問題範例

以下是結構化 QnA .xls 檔案的範例,其中包含數個單一答案的替代問題:

Example of alternate questions for single answer in Excel file

匯入檔案之後,問答組會位於 知識庫 中,如下所示:

Screenshot of alternate questions for single answer imported into knowledge base

透過匯入的結構化數據格式

匯入 知識庫 會取代現有 知識庫 的內容。 匯入需要包含數據源信息的結構化 .tsv 檔案。 這項資訊可協助 QnA Maker 將問答組分組,並將其歸因於特定數據源。 QnA 配對 具有選擇性的元數據欄位,可用來將 QnA 配對分組為類別。

問題 回答 來源 元資料 (1 個索引鍵:1 個值)
問題 1 Answer1 Url1 Key1:Value1 | Key2:Value2
問題 2 Answer2 編輯 Key:Value

多回合檔格式設定

  • 使用標題和子標題來表示階層。 例如,您可以 h1 表示父 QnA 和 h2,以表示應以提示顯示 QnA。 使用小型標題大小來表示後續階層。 請勿使用樣式、色彩或其他機制來暗示檔中的結構,QnA Maker 不會擷取多回合提示。
  • 標題的第一個字元必須大寫。
  • 請勿以問號結束標題。 ?

範例檔
Surface Pro (docx)
Contoso 權益 (docx)
Contoso 權益 (pdf)

常見問題 URL

QnA Maker 可以支援 3 種不同形式的常見問題網頁:

  • 一般常見問題頁面
  • 包含連結的常見問題頁面
  • 主題首頁的常見問題頁面

一般常見問題頁面

這是最常見的常見問題頁面類型,其中答案會緊接在相同頁面中的問題後面。

以下是一般常見問題頁面的範例:

Plain FAQ page example for a knowledge base

在此類型的常見問題頁面中,問題會匯總在一起,並連結到位於相同頁面的不同區段或不同頁面中的解答。

以下是常見問題頁面的範例,其中包含相同頁面上各節的連結:

Section Link FAQ page example for a knowledge base

這種類型的常見問題有一個主題頁面,其中每個主題都會連結到不同頁面上的一組對應的問題和解答。 QnA Maker 會編目所有鏈接的頁面,以擷取對應的問題和答案。

以下是主題頁面的範例,其中包含不同頁面中常見問題區段的連結。

Deep link FAQ page example for a knowledge base

支援 URL

QnA Maker 可以處理半結構化支援網頁,例如描述如何執行指定工作的 Web 文章、如何診斷和解決指定問題,以及指定程式的最佳作法。 擷取最適合具有階層式標題之清楚結構的內容。

注意

支援文章的擷取是新功能,而且處於早期階段。 它最適合結構良好的簡單頁面,而且不包含複雜的頁首/頁尾。

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

匯入和導出 知識庫

從導出 知識庫 的 TSV 和 XLS 檔案,只能藉由從 QnA Maker 入口網站中的 [設定] 頁面匯入檔案來使用。 在 知識庫 建立期間,或從 [設定] 頁面上的 [+ 新增檔案] 或 [+ 新增 URL] 功能,它們無法當做數據源使用。

當您透過這些 TSV 和 XLS 檔案匯入知識庫時,QnA 配對會新增至編輯來源,而不是從導出的知識庫中擷取 QnAs 的來源。

下一步

請參閱內容類型和範例的完整清單