快速入門:在 Azure 入口網站中建立 Azure 認知搜尋索引

使用匯入 資料 精靈和包含虛構旅館資料的內建範例資料來源,建立您的第一個搜尋索引。 精靈會引導您建立搜尋索引 (hotels-sample-index),讓您在幾分鐘內撰寫有趣的查詢。

雖然您不會在此快速入門中使用這些選項,但精靈也包含 AI 擴充頁面,因此可以影像檔案與非結構化文字中擷取文字與結構。 如需包含 AI 擴充的類似逐步解說,請參閱 + 快速入門:建立技能集

必要條件

檢查空間

許多客戶開始使用此免費服務。 免費層限制為三個索引、三個數據源和三個索引子。 開始之前,請先確定您有空間可容納額外的項目。 本教學課程會建立各一個物件。

請查看服務概觀頁面,以瞭解您已擁有的索引、索引子和資料來源數目。

Lists of indexes, indexers, and datasources

建立索引和載入資料

搜尋查詢會逐一查看索引,其中包含會將特定搜尋行為最佳化的可搜尋資料、中繼資料及其他建構。

在此教學課程中,我們使用可以透過匯入資料精靈使用索引子搜耙的內建範例資料集。 索引子是來源特定的編目程式,可以從支援的 Azure 資料來源讀取中繼資料和內容。 使用索引子時通常會採用程式設計方式,但在入口網站中,您也可以存取透過匯入資料精靈存取索引子。

步驟 1 - 啟動匯入資料精靈並建立資料來源

  1. 使用您的 Azure 帳戶登入 Azure 入口網站

  2. 尋找您的搜尋服務,然後在 [概觀] 頁面上,按一下命令列上的 [匯入資料],以建立及填入搜尋索引。

    Screenshot of the Import data command

  3. 在精靈中,按一下 [連線到您的資料]>[範例]>[hotels-sample]。 此資料來源是內建的。 如果您建立自己的資料來源,則必須指定名稱、類型和連線資訊。 一旦建立,就會變成可在其他匯入作業中重複使用的「現有資料來源」。

    Select sample dataset

  4. 繼續進行下一頁。

步驟 2 - 略過 [擴充內容] 頁面

此精靈支援建立可將認知服務 AI 演算法併入索引編製中的 AI 擴充管線

我們將暫時略過此步驟,而直接進行自訂目標索引

Skip cognitive skill step

提示

您可以透過快速入門教學課程,逐步執行 AI 索引編製範例。

步驟 3 - 設定索引

針對內建旅館範例索引,系統會為您定義預設索引架構。 除了一些進階篩選範例之外,以旅館範例索引為目標的檔和範例中的查詢將會在此索引定義上執行:

Generated hotels index

一般而言,在以程式碼為基礎的練習中,索引建立會在載入資料之前完成。 匯入資料精靈會藉由為可編目的任何資料來源產生基本索引來壓縮這些步驟。 索引至少需要有名稱和欄位的集合;其中一個欄位應標示為文件索引鍵,以便唯一識別每份文件。 此外,如果您需要自動完成或建議查詢,您可以指定語言分析器或建議工具。

欄位具有資料類型和屬性。 上方的核取方塊為「索引屬性」,可控制欄位的使用方式。

  • 表示它會出現在搜尋結果清單中。 您可以清除此核取方塊,將個別欄位標示為關閉搜尋結果的限制,例如,僅使用於篩選運算式的欄位。
  • 索引鍵是唯一的文件識別碼。 它一律是字串,而且是必要的。
  • [可篩選]、[可排序] 和 [可面向化] 可決定欄位是要用於篩選、排序還是多面向導覽結構。
  • 表示欄位包含在全文檢索搜尋中。 字串可以搜尋。 數字欄位和布林值欄位通常會標示為不可搜尋。

儲存體需求不會因您的選擇而改變。 例如,如果您對多個欄位設定 [可擷取] 屬性,儲存體需求也不會因此而增加。

根據預設,精靈會掃描資料來源中的唯一識別碼做為索引鍵欄位的基礎。 「字串」具有可擷取可搜尋的特性。 「整數」具有可擷取可篩選可排序可 Fact 處理的特性。

  1. 接受預設值。

    如果您使用現有的旅館資料來源再次執行精靈,系統將不會使用預設屬性來設定索引。 您必須以手動方式對未來的匯入選取屬性。

  2. 繼續進行下一頁。

步驟 4 - 設定索引子

同樣在 [匯入資料] 精靈中,按一下 [索引子]>[名稱],並且鍵入索引子的名稱。

此物件定義可執行的程序。 您就可以將其放入週期性排程,但現在請先使用預設選項,立即執行索引子一次。

按一下 [提交] 以建立並同時執行索引子。

hotels indexer

監視進度

精靈應會將您導向至索引子清單,讓您可以監視進度。 如需自我流覽,請移至 [概觀] 頁面,然後按一下 [ 索引子] 索引標籤

入口網站更新頁面可能需要幾分鐘的時間,但您應該會在清單中看到新建立的索引子 (其狀態顯示為「進行中」或成功),以及已編製索引的文件數目。

Indexer progress message

檢視索引

服務概觀頁面提供 Azure 認知搜尋服務中建立之資源的連結。 若要檢視您剛才建立的索引,請從連結的清單中按一下 [索引]。

等候入口網站頁面重新整理。 幾分鐘後,您應該會看到具有文件計數和儲存體大小的索引。

Indexes list on the service dashboard

在此清單中,您可以按一下剛剛建立的 hotels-sample 索引、檢視索引結構描述, 以及選擇性地新增欄位。

[欄位] 索引標籤會顯示索引結構描述。 如果您要撰寫查詢,而且需要檢查欄位是否可篩選或可排序,此索引標籤會顯示內容。

捲動至清單底部可輸入新欄位。 雖然您一律可以建立新的欄位,但在大多數情況下,您無法變更現有的欄位。 現有的欄位在搜尋服務中有實體標記法,因此無法修改,甚至不能在程式碼中。 若要對現有欄位進行重大變更,請建立新索引並,捨棄原始欄位。

sample index definition

您可以隨時新增其他建構,例如評分設定檔和 CORS 選項。

若要清楚地了解您在索引設計期間可以編輯和無法編輯的項目,請花點時間檢視索引定義選項。 灰色的選項表示無法修改或刪除選項值。

使用搜尋總管進行查詢

您現在有可使用 [搜尋總管] 查詢的搜尋索引。

搜尋總管 會傳送符合 搜尋檔 API的 REST 呼叫。 此工具支援 簡單的查詢語法完整的 Lucene 查詢剖析器

  1. 選取命令列上的 [搜尋總管 ]。

    Search explorer command

  2. [索引] 中選擇 「hotels-sample-index」。

    Index and API commands

  3. 在搜尋列中,貼上下列範例中的查詢字串,然後選取 [ 搜尋]。

    Query string and search button

查詢範例

本節中的所有查詢都是針對 搜尋總 管和旅館範例索引所設計。 結果會以詳細 JSON 文件的形式傳回。 索引中標示為「可擷取」的所有欄位都可以出現在結果中。 如需查詢的詳細資訊,請參閱 Azure 認知搜尋中的查詢

查詢 描述
search=spa 具有前 N 個結果的簡單全文檢索查詢。 參數 search= 用於關鍵字搜尋,在此案例中,會傳回檔中任何可搜尋欄位中包含 spa 的旅館資料。
search=beach &$filter=Rating gt 4 篩選的查詢。 在此案例中為大於 4 的評等。
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 參數化查詢。 & 符號用來附加搜尋參數 (可依任何順序指定)。
$select 參數會傳回欄位子集,以取得更精簡的搜尋結果。
$count=true parameter 會傳回所有符合查詢的檔總數。
$top=10 傳回總計中排名最高的 10 份檔。 根據預設,Azure 認知搜尋會傳回前 50 個最相符項目。 您可以使用此參數來增加或減少數量。
search=* &facet=Category &$top=2 Facet 查詢,用來傳回符合您所提供 Facet 值的匯總檔計數。 在空白或未限定的搜尋上,會代表所有檔。 在旅館索引中,[類別] 欄位會標示為「可多面向」。
search=spa &facet=Rating 數值上的 Facet。 此查詢是評分的 Facet,在文字搜尋 「spa」。 「評等」一詞可以指定為 Facet,因為欄位在索引中標示為可擷取、可篩選且可多面向,而且其數值 (1 到 5) 適合以每個值分組結果。
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags 點擊醒目提示。 在 [描述] 欄位中出現時,將會反白顯示 「beach」 一詞。
search=seatle 其次
search=seatle~ &queryType=full
模糊搜尋。 根據預設,拼錯的查詢字詞 (例如將 "Seattle" 誤拼為 seatle) 無法在一般搜尋中傳回相符項目。 第一個範例不會傳回任何結果。 新增 queryType=full 會叫用完整的 Lucene 查詢剖析器,其支援 ~ 模糊搜尋的運算元。
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true 地理空間搜尋。 此範例查詢會篩選位置資料的所有結果,其中結果小於指定點的 5 公里,如緯度和經度座標所指定, (本範例使用華盛頓州 Redmond 作為起點) 。

重要心得

本教學課程提供了使用 Azure 入口網站執行 Azure 認知搜尋的快速簡介。

您已了解如何使用匯入資料精靈建立搜尋索引。 您已建立第一個 索引子 ,並瞭解索引設計的基本工作流程。

在 Azure 入口網站中使用 搜尋總管 ,您已透過實作範例瞭解一些基本查詢語法,這些範例示範了篩選、叫用醒目提示、模糊搜尋和地理空間搜尋等重要功能。

清除資源

使用您自己的訂用帳戶時,在專案結束後確認您是否還需要您建立的資源,是很好的做法。 讓資源繼續執行可能會產生費用。 您可以個別刪除資源,或刪除資源群組以刪除整組資源。

您可以使用左導覽窗格中的 [所有資源] 或 [資源群組] 連結,在入口網站中尋找和管理資源。

如果您使用免費服務,請記住您會有三個索引、索引子和資料來源的限制。 您可以在入口網站中刪除個別項目,以避免超出限制。

後續步驟

使用入口網站精靈,產生可在瀏覽器中執行的立即可用 Web 應用程式。 您可以在剛才建立的小型索引上試用此精靈,也可以使用其中一個內建的資料集範例,來獲得更豐富的搜尋體驗。