什麼是 Azure AI 搜尋?
Azure AI 搜尋服務(先前稱為「Azure 認知搜尋」)可透過傳統和產生的 AI 搜尋應用程式中的使用者擁有內容,大規模提供安全的資訊擷取。
資訊擷取是呈現文字和向量的任何應用程式的基礎。 常見案例包括目錄或文件搜尋、數據探索,以及越來越多的聊天樣式應用程式,以透過專屬的地面數據。 當您建立搜尋服務時,您可以使用下列功能:
- 透過搜尋索引搜尋 向量搜尋 和 全文 搜索和 混合式搜尋 的搜尋引擎
- 使用整合式數據區塊化和向量化進行豐富的索引編製、文字的語彙分析,以及內容擷取和轉換的選擇性 AI 擴充
- 適用於向量查詢、文字搜尋、混合式查詢、模糊搜尋、自動完成、地理搜尋等豐富查詢語法
- Azure 調整、安全性和觸達
- 數據層、機器學習層、Azure AI 服務和 Azure OpenAI 的 Azure 整合
在架構上,搜尋服務位於包含未編製索引數據的外部數據存放區之間,以及將查詢要求傳送至搜尋索引並處理回應的用戶端應用程式。
在您的用戶端應用程式中,搜尋體驗是使用來自 Azure AI 搜尋服務的 API 來定義,並可包含相關性微調、語意排名、自動完成、同義字比對、模糊比對、模式比對、篩選和排序。
在 Azure 平臺中,Azure AI 搜尋可以與其他 Azure 服務整合,其形式是索引器,以自動從 Azure 數據源擷取/擷取數據,以及整合來自 Azure AI 服務的消費性 AI 的技能集,例如影像和自然語言處理,或您在 Azure Functions 中建立的自定義 AI 機器學習 或包裝在 Azure Functions 内。
在搜尋服務內
在搜尋服務本身上,兩個主要工作負載是 編製索引 和 查詢。
編製 索引是一種進入程式,可將內容載入您的搜尋服務,並讓它可供搜尋。 在內部,輸入文字會處理成令牌,並儲存在反向索引中,而輸入向量會儲存在向量索引中。 Azure AI 搜尋可編製索引的檔格式為 JSON。 您可以上傳您已組合的 JSON 檔,或使用索引器來擷取數據並將其串行化為 JSON。
透過認知技能進行 AI 擴充是索引編製的延伸。 如果您在源檔中有影像或大型非結構化文字,您可以附加執行 OCR、描述影像、推斷結構、翻譯文字等技能。 您也可以附加執行 數據區塊化和向量化的技能。
當您的用戶端應用程式將查詢要求傳送至搜尋服務並處理回應時,一旦索引填入可搜尋的內容,就會發生查詢。 所有查詢執行都是透過您所控制的搜尋索引。
語意排名 是查詢執行的延伸。 它會將語言理解新增至搜尋結果處理,將最語意上相關的結果提升至頂端。
為何要使用 Azure AI 搜尋?
Azure AI 搜尋非常適合下列應用程式案例:
將它用於傳統的全文搜索和新一代向量相似度搜尋。 使用利用關鍵詞和相似性搜尋強度的資訊擷取來備份您的產生 AI 應用程式。 使用這兩種形式來擷取最相關的結果。
將異質內容合併為由向量和文字組成的用戶定義的和填入搜尋索引。 您擁有並控制可搜尋的內容。
整合數據區塊化和向量化 ,以進行 Generative AI 和 RAG 應用程式。
將索引編製和查詢工作負載卸除至專用的搜尋服務。
輕鬆實作搜尋相關功能:相關性微調、多面向導覽、篩選(包括地理空間搜尋)、同義字對應和自動完成。
將儲存在 Azure Blob 儲存體 或 Azure Cosmos DB 中的大型未區分文字或圖像檔或應用程式檔轉換成可搜尋的區塊。 透過從 Azure AI 新增外部處理的認知技能,在編製索引期間達成此目的。
新增語言或自定義文字分析。 如果您有非英文內容,Azure AI 搜尋支援 Lucene 分析器和 Microsoft 的自然語言處理器。 您也可以設定分析器來達成原始內容的特製化處理,例如篩選出變音符號,或辨識和保留字串中的模式。
如需特定功能的詳細資訊,請參閱 Azure AI 搜尋的功能
如何開始使用
功能會透過 azure SDK for .NET 等 Azure 入口網站、簡單的 REST API 或 Azure SDK 公開。 Azure 入口網站 支援服務管理和內容管理,以及用來建立原型和查詢索引和技能集的工具。
核心搜尋功能的端對端探索可以在四個步驟中完成:
決定階層 和區域。 每個訂用帳戶允許一個免費搜尋服務。 所有快速入門都可以在免費層上完成。 如需更多容量和功能,您需要 計費層。
從 [匯入數據精靈] 開始。 選擇內建範例或支持的數據源,以在幾分鐘內建立、載入及查詢索引。
或者,您可以在不可部分完成的步驟中建立、載入及查詢搜尋索引:
使用「推送」模型上傳內容,以從任何來源推送 JSON 檔,或如果您的源數據是支援的型別,請使用「提取」模型(索引器)。
提示
如需複雜或自定義解決方案的協助, 請連絡合作夥伴 ,以深入瞭解 Azure AI 搜尋技術。
比較搜尋選項
客戶通常會詢問 Azure AI 搜尋與其他搜尋相關解決方案的比較方式。 下表摘要說明主要差異。
與 | 主要差異 |
---|---|
Microsoft Search | Microsoft 搜尋 適用於需要查詢 SharePoint 中內容的 Microsoft 365 已驗證使用者。 Azure AI 搜尋會跨 Azure 和任何 JSON 數據集提取內容。 |
Bing | Bing API 會查詢 Bing.com 上的索引,以取得相符的字詞。 Azure AI 搜尋會搜尋填入您內容之索引的索引。 您可以控制數據擷取和架構。 |
資料庫搜尋 | SQL Server 具有 全文搜索 ,而 Azure Cosmos DB 和類似的技術具有可查詢的索引。 當您需要語彙分析器和相關性微調或異質來源的內容等功能時,Azure AI 搜尋會成為有吸引力的替代方案。 資源使用率是另一個轉捩點。 編製索引和查詢會耗用大量運算。 從 DBMS 卸除搜尋會保留系統資源以進行事務處理。 |
專用搜尋解決方案 | 假設您已決定使用完整頻譜功能的專用搜尋,則搜尋技術之間的最終類別比較。 在雲端提供者中,Azure AI 搜尋對於 Azure 上內容的向量、關鍵詞和混合式工作負載最強,適用於主要依賴搜尋資訊擷取和內容瀏覽的應用程式。 |
主要優點包括:
- 儲存、索引和搜尋向量內嵌句子、影像、圖形等等。
- 尋找語意上類似於搜尋查詢的資訊,即使搜尋字詞不完全相符也一樣。
- 使用混合式搜尋來尋找關鍵詞和向量搜尋的最佳專案。
- 透過語意排名和評分配置檔進行相關性微調。
- 索引層的數據整合(編目程式)。
- 適用於可搜尋內容文字和向量之轉換的 Azure AI 整合。
- 信任連線的 Microsoft Entra 安全性,以及無因特網案例中私人連線的 Azure Private Link。
- 完整搜尋體驗:56 種語言的語言和自定義文字分析。 多面向、自動完成查詢和建議的結果,以及同義字。
- Azure 規模、可靠性和全球觸達。