將數據載入 Azure AI 搜尋中的搜尋索引

本文說明如何在預先定義的搜尋索引中匯入、重新整理和管理內容。 在 Azure AI 搜尋服務中,會 建立搜尋索引,並 遵循數據匯 入作為第二個步驟。 例外狀況是匯入數據精靈和索引器管線,它會在一個工作流程中建立和載入索引。

搜尋服務會匯入 JSON 中的文字和向量,用於全文搜索、向量搜尋、混合式搜尋和知識採礦案例。 文字內容可從外部數據源的英數位元欄位、在搜尋案例中很有用的元數據,或技能集建立的豐富內容取得(技能可以從影像和非結構化內容擷取或推斷文字描述)。 向量內容是使用外部內嵌模型整合向量化進行向量化(預覽)。

一旦編製數據索引,索引的實體數據結構就會鎖定在 中。 如需可變更和無法變更之專案的指引,請參閱 卸除和重建索引

索引不是背景進程。 搜尋服務會平衡索引編製和查詢工作負載,但如果 查詢延遲太高,您可以 新增容量 或識別低查詢活動的期間來載入索引。

載入檔

搜尋服務會接受符合索引架構的 JSON 檔。

您可以自行準備這些檔,但如果內容位於支持的數據源,執行索引器或匯入數據精靈可以將檔擷取、JSON 串行化和編製索引自動化。

在 Azure 入口網站 中,使用匯入數據精靈在無縫工作流程中建立和載入索引。 如果您想要載入現有的索引,請選擇替代方法。

  1. 使用您的 Azure 帳戶登入 Azure 入口網站

  2. 尋找您的搜尋服務,然後在 [概觀] 頁面上,選取 [匯入數據] 或 [匯入] 並向量化命令行上的數據,以建立及填入搜尋索引。 您可以遵循下列連結來檢閱工作流程:快速入門: 建立 Azure AI 搜尋索引快速入門:整合向量化 (預覽)

    Screenshot of the Import data command

如果已經定義索引器,您可以從 Azure 入口網站 重設並執行索引器,這在累加新增字段時很有用。 重設會強制索引器重新開始,從所有源文檔挑選所有欄位。

刪除孤立檔

Azure AI 搜尋支援檔層級作業,讓您可以隔離查閱、更新和刪除特定檔。 下列範例示範如何刪除檔。 在搜尋服務中,檔不相關,因此刪除檔不會影響索引的其餘部分。

  1. 識別哪一個字段是檔索引鍵。 在入口網站中,您可以檢視每個索引的欄位。 檔索引鍵是字串字段,並以索引鍵圖示表示,使其更容易發現。

  2. 檢查檔索引鍵欄位的值: search=*&$select=HotelId。 簡單的字串很簡單,但如果索引使用base-64編碼欄位,或從設定產生 parsingMode 搜尋檔,您可能會使用您不熟悉的值。

  3. 查閱檔以驗證文件 識別碼的值,並在刪除檔之前檢閱其內容。 在要求中指定金鑰或檔案識別碼。 下列範例說明 Hotels 範例索引的簡單字串串,以及 cog-search-demo 索引metadata_storage_path索引的 base-64 編碼字串。

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. 刪除檔 ,使其從搜尋索引中移除。

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

另請參閱