什麼是影像分析?

重要

現在會對此服務的所有 HTTP 要求強制執行傳輸層安全性 (TLS) 1.2 。 如需詳細資訊,請參閱 Azure 認知服務安全性

電腦視覺影像分析服務可以從影像中解壓縮各式各樣的視覺功能。 例如,它可以判斷影像是否包含成人內容、尋找特定品牌或物件,或尋找人臉。

您可以透過用戶端程式庫 SDK 或直接呼叫 REST API 來使用影像分析。 遵循 快速入門 以開始使用。

本檔包含下列類型的文章:

  • 快速入門是逐步指示,可讓您對服務進行呼叫,並在短時間內取得結果。
  • 操作 指南 包含以更具體或自訂的方式使用服務的指示。
  • 概念文章提供服務功能和功能的深入說明。
  • 教學課程是更長的指南,示範如何使用此服務做為更廣泛商務解決方案中的元件。

影像分析功能

您可以分析影像,以提供與其視覺特徵和特性有關的深入解析。 下列清單中的所有功能都是由「 分析影像 API」提供。 請遵循快速入門以開始使用。

標記視覺特徵

從一組數千個可辨識的物件、生物、景象和動作,識別及標記影像中的視覺特徵。 若標記不明確或不屬於常識,API 回應會提供提示來釐清標記的內容。 標記並未限定於主體 (例如前景中的人物),而是包含周遭環境 (室內或室外)、家具、工具、植物、動物、配件和小工具等。 標記視覺特徵

具有標記的 skateboarder 影像會在右側接聽

偵測物件

物件偵測與標記功能類似,但 API 會傳回每個所套用標記的週框方塊座標。 例如,如果影像包含狗、貓或人物,「偵測」作業就會列出這些物件及其在影像中的座標。 您可以使用此功能來處理影像中物件間的進一步關聯性。 當影像中有多個相同標記的執行個體時,此功能也會讓您知道。 偵測物件

在膝上型電腦周圍繪製矩形的辦公室影像

偵測品牌

從擁有數千個全球商標的資料庫中,識別影像或視訊內的商業品牌。 例如,您可以使用這項功能探索哪些品牌在社交媒體最受歡迎或在媒體產品位置中最常見。 偵測品牌

將影像分類

使用具有父/子承襲階層的類別分類法來識別及分類整個影像。 類別可單獨使用,或與我們新的標記模型搭配使用。
目前,英文是唯一支援影像標記和分類的語言。 將影像分類

說明影像

以一般人看得懂的語言,使用完整的句子產生整個影像的描述。 電腦視覺的演算法會根據在影像中識別出來的物件產生各種描述。 這些描述會個別受到評估,並產生信賴分數。 接著會傳回一份清單,並依照信賴分數由高至低排序。 說明影像

具有右邊簡單描述的 cows 影像

偵測臉部

偵測影像中的臉部,並提供與每個偵測到的臉部有關的資訊。 電腦視覺會針對每個偵測到的臉部傳回座標、矩形、性別和年齡。
電腦視覺提供部分的臉部服務功能。 您可以使用臉部服務進行更詳細的分析,例如臉部識別和姿勢偵測。 偵測臉部

偵測影像類型

偵測影像的關於特性,例如影像是否為線條繪圖,或影像為美工圖案的可能性。 偵測影像類型

偵測特定領域內容

使用領域模型可偵測及識別影像中的特定領域內容,例如名人和地標。 例如,如果影像包含人物,電腦視覺即可使用名人領域模型,判斷影像中偵測到的人物是否為知名人士。 偵測特定領域內容

偵測色彩配置

分析影像中的用色方式。 電腦視覺可判斷影像是黑白還是彩色的,如果是彩色影像,則會找出主色和輔色。 偵測色彩配置

產生縮圖

分析影像的內容,為其產生適當的縮圖。 「電腦視覺」會先產生高品質的縮圖,然後分析該影像內的物件,以判斷「關注區域」。 接著,「電腦視覺」會裁剪影像以符合關注區域的需求。 產生的縮圖可以使用與原始影像的外觀比例不同的外觀比例來呈現,視您的需求而定。 產生縮圖

山區上的人員影像,右邊有裁剪的版本

取得關注區域

分析影像的內容以傳回「關注區域」的座標。 「電腦視覺」會傳回該區域的週框方塊座標,而不會裁剪影像並產生縮圖,因此呼叫端應用程式可以視需要修改原始影像。 取得關注區域

調節影像中的內容

您可以使用電腦視覺在影像中偵測成人內容,並傳回不同分類的信賴分數。 為內容加上旗標的閾值可用滑動標尺來設定,以配合您的喜好設定。

影像需求

影像分析適用于符合下列需求的影像:

  • 必須以 JPEG、PNG、GIF 或 BMP 格式呈現的影像
  • 影像的檔案大小必須小於 4 MB
  • 影像的維度必須大於 50 x 50 像素

資料隱私權和安全性

和所有認知服務一樣,使用電腦視覺服務的開發人員應該要了解 Microsoft 對於客戶資料的政策。 請參閱 Microsoft 信任中心上的認知服務頁面,以進行深入了解。

後續步驟

遵循您慣用開發語言的快速入門手冊,開始使用影像分析: