什麼是 Azure AI 搜尋?

Azure AI 搜尋服務(先前稱為「Azure 認知搜尋」)可透過傳統和產生的 AI 搜尋應用程式中的使用者擁有內容,大規模提供安全的資訊擷取。

資訊擷取是呈現文字和向量的任何應用程式的基礎。 常見案例包括目錄或文件搜尋、數據探索,以及越來越多的聊天樣式應用程式,以透過專屬的地面數據。 當您建立搜尋服務時,您可以使用下列功能:

在架構上,搜尋服務位於包含未編製索引數據的外部數據存放區之間,以及將查詢要求傳送至搜尋索引並處理回應的用戶端應用程式。

Azure AI Search architecture

在您的用戶端應用程式中,搜尋體驗是使用來自 Azure AI 搜尋服務的 API 來定義,並可包含相關性微調、語意排名、自動完成、同義字比對、模糊比對、模式比對、篩選和排序。

在 Azure 平臺中,Azure AI 搜尋可以與其他 Azure 服務整合,其形式是索引器,以自動從 Azure 數據源擷取/擷取數據,以及整合來自 Azure AI 服務的消費性 AI 的技能集,例如影像和自然語言處理,或您在 Azure Functions 中建立的自定義 AI 機器學習 或包裝在 Azure Functions 内。

在搜尋服務內

在搜尋服務本身上,兩個主要工作負載是 編製索引查詢

  • 編製 索引是一種進入程式,可將內容載入您的搜尋服務,並讓它可供搜尋。 在內部,輸入文字會處理成令牌,並儲存在反向索引中,而輸入向量會儲存在向量索引中。 Azure AI 搜尋可編製索引的檔格式為 JSON。 您可以上傳您已組合的 JSON 檔,或使用索引器來擷取數據並將其串行化為 JSON。

    透過認知技能進行 AI 擴充是索引編製的延伸。 如果您在源檔中有影像或大型非結構化文字,您可以附加執行 OCR、描述影像、推斷結構、翻譯文字等技能。 您也可以附加執行 數據區塊化和向量化的技能。

  • 當您的用戶端應用程式將查詢要求傳送至搜尋服務並處理回應時,一旦索引填入可搜尋的內容,就會發生查詢。 所有查詢執行都是透過您所控制的搜尋索引。

    語意排名 是查詢執行的延伸。 它會將語言理解新增至搜尋結果處理,將最語意上相關的結果提升至頂端。

Azure AI 搜尋非常適合下列應用程式案例:

  • 將它用於傳統的全文搜索和新一代向量相似度搜尋。 使用利用關鍵詞和相似性搜尋強度的資訊擷取來備份您的產生 AI 應用程式。 使用這兩種形式來擷取最相關的結果。

  • 將異質內容合併為由向量和文字組成的用戶定義的和填入搜尋索引。 您擁有並控制可搜尋的內容。

  • 整合數據區塊化和向量化 ,以進行 Generative AI 和 RAG 應用程式。

  • 在檔層級套用細微訪問控制

  • 將索引編製和查詢工作負載卸除至專用的搜尋服務。

  • 輕鬆實作搜尋相關功能:相關性微調、多面向導覽、篩選(包括地理空間搜尋)、同義字對應和自動完成。

  • 將儲存在 Azure Blob 儲存體 或 Azure Cosmos DB 中的大型未區分文字或圖像檔或應用程式檔轉換成可搜尋的區塊。 透過從 Azure AI 新增外部處理的認知技能,在編製索引期間達成此目的。

  • 新增語言或自定義文字分析。 如果您有非英文內容,Azure AI 搜尋支援 Lucene 分析器和 Microsoft 的自然語言處理器。 您也可以設定分析器來達成原始內容的特製化處理,例如篩選出變音符號,或辨識和保留字串中的模式。

如需特定功能的詳細資訊,請參閱 Azure AI 搜尋的功能

如何開始使用

功能會透過 azure SDK for .NETAzure 入口網站、簡單的 REST API 或 Azure SDK 公開。 Azure 入口網站 支援服務管理和內容管理,以及用來建立原型和查詢索引和技能集的工具。

核心搜尋功能的端對端探索可以在四個步驟中完成:

  1. 決定階層 和區域。 每個訂用帳戶允許一個免費搜尋服務。 所有快速入門都可以在免費層上完成。 如需更多容量和功能,您需要 計費層

  2. 在 Azure 入口網站 中建立搜尋服務

  3. 從 [匯入數據精靈] 開始。 選擇內建範例或支持的數據源,以在幾分鐘內建立、載入及查詢索引。

  4. 使用入口網站客戶端查詢您剛才建立的搜尋索引,使用搜尋總管完成。

或者,您可以在不可部分完成的步驟中建立、載入及查詢搜尋索引:

  1. 使用入口網站、REST API.NET SDK 或其他 SDK 建立搜尋索引。 索引架構會定義可搜尋內容的結構。

  2. 使用「推送」模型上傳內容,以從任何來源推送 JSON 檔,或如果您的源數據是支援的型別,請使用「提取」模型(索引器)。

  3. 在入口網站、REST API.NET SDK 或其他 SDK 中使用搜尋總管來查詢索引

提示

如需複雜或自定義解決方案的協助, 請連絡合作夥伴 ,以深入瞭解 Azure AI 搜尋技術。

比較搜尋選項

客戶通常會詢問 Azure AI 搜尋與其他搜尋相關解決方案的比較方式。 下表摘要說明主要差異。

主要差異
Microsoft Search Microsoft 搜尋 適用於需要查詢 SharePoint 中內容的 Microsoft 365 已驗證使用者。 Azure AI 搜尋會跨 Azure 和任何 JSON 數據集提取內容。
Bing Bing API 會查詢 Bing.com 上的索引,以取得相符的字詞。 Azure AI 搜尋會搜尋填入您內容之索引的索引。 您可以控制數據擷取和架構。
資料庫搜尋 SQL Server 具有 全文搜索 ,而 Azure Cosmos DB 和類似的技術具有可查詢的索引。 當您需要語彙分析器和相關性微調或異質來源的內容等功能時,Azure AI 搜尋會成為有吸引力的替代方案。 資源使用率是另一個轉捩點。 編製索引和查詢會耗用大量運算。 從 DBMS 卸除搜尋會保留系統資源以進行事務處理。
專用搜尋解決方案 假設您已決定使用完整頻譜功能的專用搜尋,則搜尋技術之間的最終類別比較。 在雲端提供者中,Azure AI 搜尋對於 Azure 上內容的向量、關鍵詞和混合式工作負載最強,適用於主要依賴搜尋資訊擷取和內容瀏覽的應用程式。

主要優點包括:

  • 儲存、索引和搜尋向量內嵌句子、影像、圖形等等。
  • 尋找語意上類似於搜尋查詢的資訊,即使搜尋字詞不完全相符也一樣。
  • 使用混合式搜尋來尋找關鍵詞和向量搜尋的最佳專案。
  • 透過語意排名和評分配置檔進行相關性微調。
  • 索引層的數據整合(編目程式)。
  • 適用於可搜尋內容文字和向量之轉換的 Azure AI 整合。
  • 信任連線的 Microsoft Entra 安全性,以及無因特網案例中私人連線的 Azure Private Link。
  • 完整搜尋體驗:56 種語言的語言和自定義文字分析。 多面向、自動完成查詢和建議的結果,以及同義字。
  • Azure 規模、可靠性和全球觸達。