選擇 Azure 認知服務技術

Azure 認知服務是一組雲端式 API,可用於 AI 應用程式和資料流程。 它提供預先定型的模型,這些模型已準備好在應用程式中使用,不需要任何資料,也不需要您部分的模型定型。 這些服務是由 Microsoft AI 和研究小組所開發,並公開最新的深度學習演算法。 它們會透過 HTTP REST 介面取用。 此外,SDK 適用于許多常見的應用程式開發架構。

主要優點:

  • 最先進的 AI 服務開發工作最少。 使用預先定義的演算法,或在預先建置的程式庫之上建立自訂演算法。
  • 透過 HTTP REST 介面輕鬆整合至應用程式。
  • 所有技能層級的開發人員和資料科學家可以輕鬆地將 AI 功能新增至應用程式。

考量因素:

  • 這些服務只能透過 Web 取得。 通常需要網際網路連線。 例外狀況是自訂視覺服務,其定型模型您可以在裝置和 IoT 邊緣匯出以進行預測。
  • 雖然支援相當大的自訂,但可用的服務可能不符合所有預測性分析需求。

Azure 認知服務的類別

Azure 中提供數十項認知服務。 以下是依其支援的功能區域分類的清單:

服務 決策指南的連結 描述
語言 選擇語言服務 語言認知服務是提供自然語言處理 (NLP) 功能來瞭解和分析文字的服務。
語音 選擇語音服務 語音認知服務是提供語音轉換文字、文字轉換語音、語音翻譯和說話者辨識等語音功能的服務。
視覺 選擇視覺服務 視覺認知服務是提供影像和視訊辨識功能的服務。
決策服務

應用 AI 服務
選擇決策 API 或套用的 AI 服務 決策認知服務是提供 NLP 功能的服務,可產生明智且有效率決策的建議。
Azure OpenAI 服務 N/A Azure OpenAI 服務提供 REST API 存取功能強大的 OpenAI 語言模型。

一般使用案例

以下是 Azure 認知服務的一些常見使用案例。

使用案例 類別
將聽得見的語音謄寫成可讀取且可搜尋的文字。 語音
將文字轉換為逼真的語音以讓介面更自然。 語音
將即時語音翻譯整合到您的應用程式。 語音
使用語音特性來識別和驗證說話的人員。 語音
識別常用的和網域特定詞彙。 語言
自動偵測文字中的情感和意見。 語言
將資訊擷取成易於流覽的問題和解答。 語言
讓您的應用程式能夠透過自然語言與使用者互動。 語言
翻譯超過 100 種語言和方言。 語言
識別和分析影像和影片中的內容。 視覺
自訂影像辨識以符合您的業務需求。 視覺
儘早找出潛在問題。 決策服務/異常偵測程式
偵測可能具冒犯性或不應出現的內容。 決策服務 / Content Moderator
為每位使用者建立豐富的個人化體驗。 決策服務/個人化工具
將進階編碼和語言模型套用至各種使用案例。 Azure OpenAI

索引鍵選取準則

若要縮小選擇範圍,請從回答下列問題開始:

  • 您是否正在處理與口語相關的專案,或正在處理文字、影像或檔?

  • 您是否有資料可定型模型? 如果是,請考慮使用自訂服務,讓您使用所提供的資料來定型其基礎模型。 這樣做可以改善精確度和效能。

此流程圖可協助您為使用案例選擇最佳的 API 服務。

Diagram that shows how to select a Cognitive Services API.

  • 如果您的使用案例需要語音轉換文字、文字轉換語音或語音轉換,請使用 語音 API
  • 如果您的使用案例需要語言分析、文字評量或文字到文字,請使用 語言 API
  • 如果您需要分析影像、影片或文字,請使用 視覺 API
  • 如果您需要做出決策,請使用 決策 API 或套用的 AI 服務

部署服務

當您 部署認知服務 時,您可以獨立部署服務,或使用認知服務多服務資源。 多服務資源會部署決策、語言、語音、視覺和已套用的 AI 服務。

  • 如果您不需要其他服務,或想要以個別服務為基礎管理存取和計費,請部署個別服務。
  • 如果您使用多個服務,而且想要同時管理所有服務的存取和計費,請部署多服務資源。

注意

這些 API 服務中的資源類別經常變更。 請務必檢查最新檔是否有新類別。

投稿人

本文由 Microsoft 維護。 原始投稿人如下。

主要作者:

其他投稿人:

若要查看非公用LinkedIn設定檔,請登入 LinkedIn。

下一步