什麼是電腦視覺?

重要

現在會對此服務的所有 HTTP 要求強制執行傳輸層安全性 (TLS) 1.2 。 如需詳細資訊,請參閱 Azure 認知服務安全性

Azure 的電腦視覺服務可讓您存取進階演算法,以根據您感興趣的視覺功能來處理影像並傳回資訊。

服務 描述
光學字元辨識 (OCR) 服務會將影像中的文字解壓縮。 您可以使用新的讀取 API,從相片和檔中取出列印和手寫文字。 它會使用深度學習模型,並使用各種表面和背景的文字。 這些包括商務檔、發票、收據、海報、名片、信件和白板。 OCR Api 支援以 數種語言解壓縮印刷文字。 遵循 OCR 快速入門 開始使用。
影像分析服務會從影像(例如物件、臉部、成人內容和自動產生的文字描述)解壓縮許多視覺特徵。 遵循 映射分析快速入門 開始使用。
空間分析服務會分析影片摘要中人員的存在和移動,並產生其他系統可回應的事件。 安裝 空間分析容器 以開始使用。

用於管理數位資產的電腦視覺

電腦視覺可以支援許多數位資產管理 (DAM) 案例。 DAM 是組織、儲存和抓取多媒體資產,以及管理數位權利和權限的商務程序。 例如,公司可以根據可見的標誌、臉部、物件或色彩等項目來分組和識別影像。 或者,您可以自動產生影像的標題並附加關鍵字,讓這些影像可供搜尋。 如需可使用認知服務、Azure 認知搜尋和智慧型報告的全能 DAM 解決方案,請參閱 GitHub 上的知識採礦解決方案加速器指南。 如需其他 DAM 範例,請參閱電腦視覺解決方案範本存放庫。

影像需求

電腦視覺可分析符合下列需求的影像:

  • 必須以 JPEG、PNG、GIF 或 BMP 格式呈現的影像
  • 影像的檔案大小必須小於 4 MB
  • 影像的維度必須大於 50 x 50 像素
    • 針對讀取 API,影像的大小必須介於 50 x 50 與 10000 x 10000 像素之間。

資料隱私權和安全性

和所有認知服務一樣,使用電腦視覺服務的開發人員應該要了解 Microsoft 對於客戶資料的政策。 請參閱 Microsoft 信任中心上的認知服務頁面,以進行深入了解。

後續步驟

遵循快速入門,以慣用的開發語言來執行和執行服務。