Azure AI Vision の新機能

[アーティクル]
2024/09/03

Azure AI Vision の新機能について説明します。このページを確認して、新機能、機能の強化、修正、ドキュメントの更新についての最新情報を入手してください。

2025 年 2 月

Face ライブネスクライアント側 SDK 1.1.0 リリース

ライブネスクライアント側 SDK リリース 1.1.0

この更新プログラムには、複数の強化機能が含まれています。

エンドユーザーがフローを完了する時間を増やすために、顔を向けるシナリオのタイムアウトを大きくします。
Microsoft Intune モバイルアプリケーション管理 SDK との互換性の問題を解決するための iOS および Android SDK の修正。
セキュリティ関連の修正/機能強化。

詳しくは、SDK リリースノートをご覧ください。

2025 年 1 月

Face ライブネス検出 GA

Face ライブネス検出機能が一般提供 (GA) になりました。

サーバー側 API: Face API v1.2
クライアント側 SDK: Azure AI Vision SDK 1.0.0

この SDK を使用すると、開発者はネイティブモバイルアプリケーションと Web ブラウザーアプリケーションの両方で本人確認シナリオに顔のライブネスチェックを使用できます。

新しい SDK では、パッシブモードとパッシブ/アクティブモードの両方がサポートされます。ハイブリッドパッシブ/アクティブモードは、よくない照明状態でのみ Active モーションを必要とするように設計され、最適な照明ではパッシブライブネスチェックの速度と効率を使用します。

詳しくは、SDK リリースノートをご覧ください。

Image Analysis 4.0 Preview API の非推奨

2025 年 3 月 31 日に、Image Analysis 4.0 Preview API は廃止されます。その日付より前に、Azure Image Analysis ワークロードを Image Analysis 4.0 GA API に移行する必要があります。

マルチモーダル埋め込み、同期 OCR、人物検出、画像タグ付け、スマートトリミング、キャプション、高密度キャプション、画像の物体検出などの機能強化にアクセスできるように、早めに移行することをお勧めします。これらの Image Analysis 4.0 プレビュー API は、2025 年 3 月 31 日に廃止されます。

2022-07-31-preview
2022-10-12-preview
2023-02-01-preview
2023-04-01-preview
2023-07-01-preview
v4.0-preview.1

次の機能は、プレビュー API バージョンの廃止に伴い利用できなくなり、2025 年 1 月 10 日付けで Studio のエクスペリエンスから削除されます。

モデルのカスタマイズ
背景の削除
Product Recognition

モデルの円滑な動作を維持するには、現在一般提供されている Azure AI Custom Vision に移行してください。 Custom Vision は、これらの廃止機能と同様の機能を提供しています。

2024 年 8 月

顔の新しい検出可能な属性

眼鏡、オクルージョン、ぼかし、露出の属性は、最新の検出 03 モデルで使用できます。詳細については、「顔検出モデルを指定する」を参照してください。

2024 年 5 月

新しい Face SDK 1.0.0-beta.1 (破壊的変更)

Face SDK は、Azure SDK のガイドラインと設計原則をより適切に満たすために、バージョン 1.0.0-beta.1 で書き換えられました。サポートされている言語は、C#、Python、Java、JavaScript です。使用を開始するには、クイックスタートに従ってください。

2024 年 2 月

マルチモーダル埋め込み GA: 新しい多言語モデル

マルチモーダル埋め込み API が更新され、一般公開されました。新しい 2024-02-01 API には、102 個の言語でのテキスト検索をサポートする新しいモデルが含まれています。元の英語のみのモデルは引き続き使用できますが、同じ検索インデックス内で新しいモデルと組み合わせることはできません。英語のみのモデルを使用してテキストと画像をベクター化した場合、これらのベクターは多言語テキストと画像のベクターと互換性がありません。

サポートされている言語の一覧については、言語サポートのページを参照してください。

2024 年 1 月

新しい Image Analysis SDK 1.0.0-beta.1 (破壊的変更)

Image Analysis SDK はバージョン 1.0.0-beta.1 で書き換えられ、他の Azure SDK との連携が強化されました。すべての API が変更されています。新しい SDK の使用方法については、更新されたクイックスタート、サンプル、およびハウツーガイドを参照してください。

重大な変更:

SDK により、プレビュー Computer Vision REST API (2023-04-01-preview) ではなく、一般公開されている Computer Vision REST API (2023-10-01) が呼び出されるようになりました。
JavaScript のサポートが追加されました。
C++ のサポートは終了しました。
カスタムモデルを使用した画像解析と、画像のセグメント化 (背景の削除) は、Computer Vision REST API (2023-10-01) でまだサポートされていないため、SDK でサポートされなくなりました。いずれかの機能を使用するには、Computer Vision REST API (2023-04-01-preview) を直接呼び出します (Analyze 操作と Segment 操作をそれぞれ使用)。

2023 年 11 月

Analyze Image 4.0 の一般提供

Analyze Image 4.0 REST API の一般提供が開始されました。使用を開始するには、Analyze Image 4.0 のクイックスタートに従ってください。

モデルのカスタマイズ、背景の削除、マルチモーダル埋め込みなど、Image Analysis のその他の機能は、パブリックプレビューのままです。

ライブネス検出用の Faceクライアント側 SDK

Face Liveness SDK は、ユーザーのモバイルまたはエッジデバイスでのライブネス検出をサポートします。 Java/Kotlin for Android と Swift/Objective-C for iOS で利用できます。

当社のライブネス検出サービスは、iBeta レベル 1 および 2 ISO/IEC 30107-3 コンプライアンスを満たしています。

2023 年 9 月

期限切れの Computer Vision API バージョンの廃止

Computer Vision API バージョン 1.0、2.0、3.0、3.1 は、2026 年 9 月 13 日に廃止されます。開発者は、その日以降、これらの API に対して API 呼び出しを行うことはできません。影響を受けるすべてのユーザーは、できる限り早くこのクイックスタートに従って、一般公開されている Computer Vision 3.2 API にワークロードを移行することをお勧めします。また、最新かつ最も優れた画像解析機能を備えている Image Analysis 4.0 API (プレビュー) への移行も検討する必要があります。

質問については、Q&A をご覧ください。

2023 年 5 月

Image Analysis 4.0 Product Recognition (パブリックプレビュー)

Product Recognition API を使用すると、小売店の棚の写真を分析できます。製品の有無を検出し、境界ボックス座標を取得できます。モデルのカスタマイズと組み合わせて使用して、特定の製品を識別するモデルをトレーニングします。 Product Recognition の結果を店舗のプラノグラムドキュメントと比較することもできます。 Product Recognition.

2023 年 4 月

Face の制限付きアクセストークン

独立系ソフトウェアベンダー (ISV) が、通常は限定的な Face 機能へのアクセスを許可するアクセストークンを発行することで、クライアントの Face API の使用状況を管理する方法について説明します。これにより、クライアント企業は正式な承認プロセスを経ることなく Face API を使用できます。制限付きアクセストークンを使用します。

2023 年 3 月

Azure AI Vision Image Analysis 4.0 SDK パブリックプレビュー

Florence の基盤モデルは、Azure AI Vision に統合されました。改良された Vision サービスを利用することで、開発者は、さまざまな業界の市場に対応した責任ある Azure AI Vision アプリケーションを作成することができます。お客様は、データをシームレスにデジタル化し、分析し、自然言語対話に接続することで、画像やビデオコンテンツから強力な分析情報を引き出し、アクセシビリティのサポート、SEO による取得の促進、有害コンテンツからのユーザー保護、セキュリティ強化、インシデント応答時間の短縮化を実現できるようになりました。詳細については、Microsoft の Florence の基盤モデルの発表に関するページを参照してください。

Image Analysis 4.0 SDK (パブリックプレビュー)

Image Analysis 4.0 が、C#、C++、Python のクライアントライブラリ SDK を通じて利用できるようになりました。この更新には、人間と同等のパフォーマンスの Florence を利用した画像キャプションと高密度キャプションも含まれます。

Image Analysis V4.0 のキャプションと高密度キャプション (パブリックプレビュー):

V4.0 では、"Describe" が "Caption" に置き換えられました。これは、詳細と意味理解が豊富な、改善された画像キャプション機能です。高密度キャプションを使用すると、画像全体の説明に加えて、画像の最大 10 個の領域について 1 文の説明が生成され、より詳細な情報が提供されます。高密度キャプションからは、説明の対象になっている画像領域の境界ボックスの座標も返されます。新しい性別に依存しないパラメーターもあります。これにより、顧客は、代替テキストと Seeing AI アプリケーションで、確率的性別推論を有効にするかどうかを選択できます。デジタルコンテンツをサポートするために、豊富なキャプション、アクセス可能な代替テキスト、SEO の最適化、インテリジェントな写真キュレーションが自動的に提供されます。画像キャプション.

ビデオ要約とフレームロケーター (パブリックプレビュー):

考えたり書いたりするのと同じ直感的な方法で、ビデオコンテンツを検索して操作します。追加のメタデータを必要とせずに、関連するコンテンツを見つけます。 Vision Studio でのみ使用できます。

Image Analysis 4.0 のモデルカスタマイズ (パブリックプレビュー)

Vision Studio または v4.0 REST API を使用して、独自のカスタム画像分類モデルと物体検出モデルを作成してトレーニングできるようになりました。

マルチモーダル埋め込み API (パブリックプレビュー)

Image Analysis 4.0 API の一部であるマルチモーダル埋め込み API を使用すると、画像とテキストの ベクター化 クエリが可能になります。これにより、画像とテキストを多次元ベクトル空間内の座標に変換できます。ベクター類似検索を使用して、自然言語で検索して関連する画像を見つけることができるようになりました。

背景削除 API (パブリックプレビュー)

Image Analysis 4.0 API の一部である背景削除 API を使用すると、画像の背景を削除できます。この操作では、背景を透明にして検出された前景オブジェクトの画像を出力すること、または検出された前景オブジェクトの不透明度を示すグレースケールアルファマット画像を出力することができます。

Azure AI Vision 3.0 と 3.1 プレビューの廃止

Azure AI Vision 3.0 および 3.1 API のプレビューバージョンは、2023 年 9 月 30 日に廃止される予定です。お客様は、この日付を過ぎてこれらの API を呼び出すことはできません。代わりに、ワークロードを一般提供 (GA) 3.2 API に移行することをお勧めします。プレビューバージョンから 3.2 API に移行するときは、次の変更点に注意してください。

Analyze Image と Read API の呼び出しでは、使用する AI モデルを指定するために使用できるオプションの model-version パラメーターが使用されます。既定では、最新のモデルが使用されます。
Analyze Image と Read API の呼び出しでは、成功した API 応答で model-version フィールドも返されます。このフィールドは、使用されたモデルを報告します。
Azure AI Vision 3.2 API では、別のエラー報告形式が使用されます。 error-handling コードを調整する方法については、API リファレンスドキュメントを参照してください。

2022 年 10 月

Azure AI Vision Image Analysis 4.0 (パブリックプレビュー)

Image Analysis 4.0 がパブリックプレビューでリリースされました。新しい API には、画像のキャプション作成、画像のタグ付け、物体検出、スマートトリミング、人物検出、OCR の読み取り機能が含まれており、1 つの Analyze Image 操作ですべて使用できます。 OCR は、OCR を利用したエクスペリエンスをワークフローに簡単に埋め込むことができる、パフォーマンスが向上した同期 API 内で、ドキュメント以外の一般的な画像用に最適化されています。

2022 年 9 月

Azure AI Vision 3.0/3.1 Read プレビューの非推奨化

Azure AI Vision 3.0 および 3.1 Read API のプレビューバージョンは、2023 年 1 月 31 日に廃止される予定です。代わりに、一般提供 (GA) バージョンの Read API を用うには、ハウツーとクイックスタートに関する記事を参照することをお勧めします。最新の GA バージョンには、次のベネフィットがあります。

2022 年の最新の一般提供 OCR モデル
手書きテキストのサポートを含む、OCR の対応言語の大幅な拡大
OCR の品質の向上

2022 年 6 月

Vision Studio の提供開始

Vision Studio は、Azure AI Vision の機能を調べ、ビルドし、アプリケーションに統合できるようにする UI ツールです。

Vision Studio は、さまざまなサービス機能を試し、そこから返される結果を視覚的に確認するためのプラットフォームとなります。 Studio を使用すると、コードを記述せずに始められ、それからアプリケーションで使用可能なクライアントライブラリと REST API を使用できるようになります。

Face での責任ある AI

顔のわかりやすさに関するメモ

わかりやすさに関するメモでは、誤った識別やその他のエラーのケースを検出して解決するための意味のある人間によるレビューを組み込み、結果が正しくないと思っているユーザーにサポートを提供し、運用状況の変化による正確性の変動を特定して対処することで、お客様がシステムの正確性と公平性を向上できるようにするガイダンスを提供します。

機密性の高い属性の廃止

性別、年齢、笑顔、顔ひげ、髪、メイクなど、感情的な状態の推測や属性の特定を行おうとする顔分析機能を廃止しました。
顔検出機能 (ぼかし、露出、眼鏡、ヘッドポーズ、ランドマーク、ノイズ、オクルージョン、顔境界ボックスの検出を含む) は一般公開されたままであり、申請は必要ありません。

Fairlearn パッケージと Microsoft の公平性ダッシュボード

オープンソースの Fairlearn パッケージと Microsoft の公平性ダッシュボードは、お客様が独自のデータで Microsoft の顔検証アルゴリズムの公平性を測定できるようにサポートすることを目的としています。これにより、テクノロジをデプロイする前に、さまざまな人口統計グループに影響を与える可能性のある潜在的な公平性の問題を特定して対処できます。

制限付きアクセスポリシー

更新された責任ある AI 標準に Face を準拠させる一環として、Face API と Azure AI Vision 用に新しい制限付きアクセスポリシーが実装されました。既存のお客様が提供したユースケースに基づいて顔認識サービスへの継続的なアクセスを申請して承認を受けるために 1 年の期間が設けられています。 Face および Azure AI Vision の制限付きアクセスの詳細については、それぞれこちらとこちらをご覧ください。

Azure AI Vision 3.2 プレビューの廃止

3.2 API のプレビューバージョンは、2022 年 12 月に廃止される予定です。代わりに、この API の一般提供 (GA) バージョンを使用することをお勧めします。 3.2-preview バージョンから移行するときは、次の変更点に注意してください。

Analyze Image と Read API の呼び出しでは、使用する AI モデルを指定するために使用できるオプションのmodel-version パラメーターが使用されるようになりました。既定では、最新のモデルが使用されます。
Analyze Image と Read API の呼び出しでは、成功した API 応答で model-version フィールドも返されます。このフィールドは、使用されたモデルを報告します。
画像分析の API では、別の error-reporting 形式が使用されるようになりました。 error-handling コードを調整する方法については、API リファレンスドキュメントを参照してください。

2022 年 5 月

OCR (Read) API モデルが一般公開 (GA) になりました

Azure AI Vision の OCR (Read) API の最新モデルが 164 の言語に対応し、クラウドサービスとコンテナーとして一般公開されました。

印刷テキストの OCR サポートが、ロシア語、アラビア語、ヒンディー語、その他キリル文字、アラビア文字、デーバナーガリー文字を使用する言語を含む 164 の言語に拡張されます。
手書きテキストの OCR サポートが、英語、簡体中国語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、スペイン語の 9 の言語に拡張されます。
単一文字、手書きの日付、金額、名前、その他領収書や請求書でよく見られるエンティティのサポートが強化されました。
デジタル PDF ドキュメントの処理が改善されました。
入力ファイルのサイズ制限が 10x から 500 MB に増加しました。
パフォーマンスと待機時間の改善。
クラウドサービスおよび Docker コンテナーとして使用できます。

GA モデルを使用する方法については、OCR ハウツーガイドを参照してください。

Read API の概要

2022 年 2 月

OCR (Read) API パブリックプレビューが 164 の言語に対応

Azure AI Vision の OCR (Read) API は、対応する言語が最新のプレビューで 164 に拡張されます。

印刷テキストの OCR サポートは、アラビア語やヒンディー語など、アラビア文字やデーバナーガリー文字を使用した言語を含む 42 の新しい言語に拡張されます。
手書きテキストに対する OCR サポートは、英語、簡体中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語に加えて、日本語と韓国語に拡張されます。
手書きの日付、金額、名前、単一文字ボックスのサポート向上を含む機能強化が行われています。
一般的なパフォーマンスと AI の品質の向上

新しいプレビュー機能を使用する方法については、OCR ハウツーガイドを参照してください。

Read API の概要

Detection_01 および Detection_03 の新しい品質属性

システムビルダーとその顧客が Face API からの高品質の出力に必要な高品質の画像をキャプチャできるように、新しい品質属性 QualityForRecognition を導入します。これは、画像が顔認識を試みるのに十分な品質であるかどうかを判断するのに役立ちます。値は、低、中、または高の非公式評価です。この新しい属性は、検出モデル detection_01 または detection_03 と、認識モデル recognition_03 または recognition_04 の任意の組み合わせを使用している場合にのみ使用できます。個人の登録には "高" 品質の画像のみ、識別シナリオでは "中" 以上の品質をお勧めします。新しい品質属性の詳細については、「顔検出と属性」を参照し、クイックスタートで使用方法を参照してください。

2021 年 9 月

OCR (Read) API パブリックプレビューが 122 の言語に対応

Azure AI Vision の OCR (Read) API は、対応する言語が最新のプレビューで 122 に拡張されます。

49 の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対する OCR サポート。
6 つの新しい言語 (英語、簡体中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語など) での手書きテキストに対する OCR サポート。
ID ドキュメント内の機械読み取り可能ゾーン (MRZ) テキストおよびデジタル PDF を処理する機能の強化。
一般的なパフォーマンスと AI の品質の向上

新しいプレビュー機能を使用する方法については、OCR ハウツーガイドを参照してください。

Read API の概要

2021 年 8 月

画像のタグ付け言語の拡張

画像のタグ付け機能の最新バージョン (v3.2) では、50 言語のタグがサポートされるようになりました。詳細については、言語サポートに関するページを参照してください。

2021 年 7 月

Detection_03 の新しい HeadPose とランドマークの向上

Detection_03 モデルが更新され、顔のランドマークがサポートされるようになりました。
Detection_03 のランドマーク機能は、特に視線追跡に不可欠な眼球ランドマークでは、はるかに正確です。

2021 年 5 月

空間分析コンテナーの更新

新しい機能セットが含まれる空間分析コンテナーの新しいバージョンがリリースされています。この Docker コンテナーを使用すると、リアルタイムストリーミングビデオを分析して、物理環境における人物とその動きとの間の空間的な関係を把握できます。

空間分析操作を構成して、人が向いている方向を検出できるようになりました。
- 向き分類子は、enable_orientation パラメーターを構成することで、personcrossingline および personcrossingpolygon 操作に対して有効にすることができます。既定ではオフに設定されています。
空間分析操作では、歩いたり走ったりしている人の速度を検出する構成も提供されるようになりました
- 速度は、enable_speed 分類子をオンにすることによって、personcrossingline および personcrossingpolygon 操作について検出できます。既定ではオフになっています。出力は、speed、avgSpeed、minSpeed の各出力に反映されます。

2021 年 4 月

Azure AI Vision v3.2 GA

Azure AI Vision API v3.2 の一般提供が開始されました。次の点が更新されています。

改善された画像のタグ付けモデル: ビジュアルコンテンツが分析され、画像に表示されているオブジェクト、アクション、コンテンツに基づいて、関連するタグが生成されます。このモデルは、Tag Image API を介して利用できます。詳細については、画像分析の使用法ガイドおよび概要に関するページを参照してください。
更新されたコンテンツモデレーションモデル: アダルトコンテンツの存在が検出され、成人向け、わいせつ、または不快なビジュアルコンテンツを含む画像をフィルター処理するためのフラグが提供されます。このモデルは、Analyze API を介して利用できます。詳細については、画像分析の使用法ガイドおよび概要に関するページを参照してください。
73 言語で利用可能な OCR (Read)。これには、簡易字中国語と繁体字中国語、日本語、韓国語、ラテン語系の言語が含まれます。
OCR (Read) は、オンプレミスデプロイ用のディストリビューションレスコンテナーとしても利用できます。

Azure AI Vision v3.2 GA をご覧ください

PersonDirectory のデータ構造 (プレビュー)

類似の識別や検索といった顔認識操作を実行するために、Face API のお客様は、Person オブジェクトの類別された一覧を作成する必要があります。新しい PersonDirectory は、ディレクトリに追加された Person の各 ID について、一意の ID、オプションの名前文字列、およびオプションのユーザーメタデータ文字列が格納されたデータ構造です。現在、Face API には同様の機能を持つ LargePersonGroup 構造が用意されていますが、100 万の ID に制限されています。 PersonDirectory 構造は、最大 7,500 万の ID までスケールアップできます。
PersonDirectory と以前のデータ構造のもう 1 つの大きな違いは、顔を Person オブジェクトに追加した後にトレーニングの呼び出しを行う必要がなくなったことです。更新プロセスは自動的に行われます。詳細については、「PersonDirectory 構造を使用する」を参照してください。

2021 年 3 月

Azure AI Vision 3.2 パブリックプレビューの更新

Azure AI Vision API v3.2 パブリックプレビューが更新されました。プレビューリリースには、すべての Azure AI Vision 機能に加えて、更新された Read および Analyze API が含まれています。

Azure AI Vision v3.2 パブリックプレビュー 3 をご覧ください

2021 年 2 月

Read API v3.2 のパブリックプレビューが 73 言語の OCR に対応

クラウドサービスおよび Docker コンテナーとして利用できる Azure AI Vision Read API v3.2 パブリックプレビューには、こちらの更新が含まれます。

OCR が 73 言語に対応。簡易字中国語と繁体字中国語、日本語、韓国語、ラテン語系の言語が含まれます。
テキスト行出力に自然な読みの順序を使用 (ラテン語系の言語のみ)
テキスト行に対する手書きスタイルの分類と信頼度スコア (ラテン語系の言語のみ)。
複数ページから成るドキュメントで選択ページのみのテキストを抽出。
オンプレミスデプロイ用のディストリビューションレスコンテナーとして利用可能。

詳細については、Read API の攻略ガイドを参照してください。

Read API v3.2 パブリックプレビューを使用する

新しい Face API 検出モデル

新しい Detection 03 モデルは、現在使用できる最も正確な検出モデルです。新しいお客様の場合は、このモデルを使用することをお勧めします。検出 03 では、画像内で見つかった小さい顔のリコールと精度が向上しています (64x64 ピクセル)。その他の改善点としては、偽陽性が全体的に削減されたことと、回転した顔の向きの検出が向上したことがあります。 Detection 03 と新しい Recognition 04 モデルを組み合わせることにより、認識の精度も向上します。詳細については、「顔検出モデルを指定する」を参照してください。

顔の新しい検出可能な属性

faceMask 属性は、最新の Detection 03 モデルで使用できます。また、フェイスマスクによって、意図されたとおりに鼻と口の両方がカバーされるように装着されているかどうかを検出する追加の "noseAndMouthCovered" 属性を使用できます。最新のマスク検出機能を使用するには、ユーザーが API 要求で検出モデルを指定する必要があります。detectionModel パラメーターに detection_03 を設定してモデルのバージョンを割り当てます。詳細については、「顔検出モデルを指定する」を参照してください。

新しい Face API 認識モデル

新しい Recognition 04 モデルは、現在使用できる最も正確な認識モデルです。新しいお客様の場合は、検証と識別にこのモデルを使用することをお勧めします。これにより、Recognition 03 の精度が向上し、フェイスマスク (サージカルマスク、N95 マスク、布マスク) を装着したユーザーの認識が向上します。フェイスカバーを装着しているユーザーの画像の登録は、認識品質が低下するためお勧めしません。最新の Detection 03 モデルを使用して、ユーザーがフェイスカバーを装着しているかどうかを検出し、最新の Recognition 04 モデルを使用してそれらのユーザーを認識する、安全でシームレスなユーザーエクスペリエンスを構築できるようになりました。詳細については、「顔認識モデルを指定する」を参照してください。

2021 年 1 月

空間分析コンテナーの更新

人物がマスクなどの顔を保護するものを装着しているかどうかを検出するように空間分析操作を構成できるようになりました。
- マスク分類子は、ENABLE_FACE_MASK_CLASSIFIER パラメーターを構成することで、personcount、personcrossingline、および personcrossingpolygon 操作に対して有効にすることができます。
- ビデオストリームで検出された人物それぞれの信頼度スコアと共に、face_mask および face_noMask 属性がメタデータとして返されます
personcrossingpolygon 操作が拡張され、人がゾーン内で費やした滞在時間を計算できるようになりました。この操作のゾーンの構成で type パラメーターを zonedwelltime に設定できます。これにより、personZoneDwellTimeEvent 型の新しいイベントに、人がゾーン内で費やした時間 (ミリ秒単位) が設定された durationMs フィールドが含まれるようになります。
破壊的変更:personZoneEvent イベントの名前が personZoneEnterExitEvent に変更されました。人がゾーンに出入りするときに personcrossingpolygon イベントが発生し、交差したゾーンの番号付き側に方向情報を提供します。
ビデオの URL を、すべての操作で "Private Parameter/obfuscated" として指定できます。難読化はオプションになり、KEY および IV が環境変数として指定されている場合にのみ機能します。
既定では、すべての操作で較正が有効になっています。無効にするには、do_calibration: false を設定します。
enable_recalibration パラメーターによる自動再較正 (既定では無効) のサポートを追加しました。詳細については、「空間分析操作」を参照してください
カメラ較正のパラメーターを DETECTOR_NODE_CONFIG にします。詳細については、「空間分析操作」を参照してください。

待ち時間の軽減

Face チームは、サービス使用時の待機時間の潜在的な原因と、考えられる軽減戦略について詳しく説明されている、新しい記事を公開しました。「Face サービスを使用するときの待機時間を軽減する」を参照してください。

2020 年 12 月

Face ID ストレージのお客様の構成

Face サービスにはお客様の画像は格納されませんが、抽出された顔の特徴がサーバーに格納されます。 Face ID は顔の特徴の識別子であり、Face - Identify、Face - Verify、Face - Find Similar で使用されます。格納されている顔の特徴は、元の検出呼び出しから 24 時間後に有効期限が切れ、削除されます。これらの Face ID がキャッシュされる時間の長さを、お客様が決定できるようになりました。最大値は最大 24 時間で変わりませんが、最小値として 60 秒に設定できるようになりました。 Face ID がキャッシュされている新しい時間範囲は、60 秒から 24 時間までの任意の値です。詳細については、Face - Detect API リファレンス (faceIdTimeToLive パラメーター) を参照してください。

2020 年 11 月

サンプルの顔登録アプリ

チームは、サンプルの顔登録アプリを公開して、高品質の登録を通して意味のある同意を確立し、高精度の顔認識システムを作成するためのベストプラクティスを示しました。オープンソースのサンプルを登録アプリのビルドに関するガイドと GitHub に追加しました。開発者はすぐにデプロイまたはカスタマイズすることができます。

2020 年 10 月

Azure AI Vision API v3.1 GA

一般提供中の Azure AI Vision API は、v3.1 にアップグレードされました。

2020 年 9 月

空間分析コンテナープレビュー

空間分析コンテナーは現在プレビュー段階です。 Azure AI Vision の空間分析機能を使用すると、リアルタイムストリーミングビデオを分析して、物理環境における人物とその動きとの間の空間的な関係を把握できます。空間分析は、オンプレミスで使用できる Docker コンテナーです。

Read API v3.1 パブリックプレビューが新たに日本語の OCR に対応

Azure AI Vision Read API v3.1 パブリックプレビューで、こちらの機能が追加されました。

日本語の OCR
それぞれのテキスト行について、その体裁が手書きであるか印刷スタイルであるかが信頼度スコア (ラテン語系の言語のみ) と共に示されます。
複数ページから成るドキュメントから、選択されたページまたはページ範囲のテキストのみを抽出します。
この Read API のプレビューバージョンでは、英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、ポルトガル語、簡体字中国語、およびスペイン語がサポートされています。

詳細については、Read API の攻略ガイドを参照してください。

Read API v3.1 パブリックプレビュー 2 の詳細を確認する

2020 年 8 月

保存データのカスタマーマネージド暗号化

Face サービスでは、クラウドに永続化されるときにデータが自動的に暗号化されます。 Face サービスの暗号化によってデータは保護され、組織のセキュリティおよびコンプライアンスコミットメントを満たすのに役立ちます。サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。カスタマーマネージドキー (CMK) と呼ばれるユーザー独自のキーを使用してサブスクリプションを管理する新しいオプションもあります。詳細については、カスタマーマネージドキーに関するページを参照してください。

2020 年 7 月

Read API v3.1 のパブリックプレビューが簡体字中国語の OCR に対応

Azure AI Vision Read API v3.1 パブリックプレビューで、簡体字中国語のサポートが追加されました。

この Read API のプレビューバージョンでは、英語、オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、簡体字中国語、およびスペイン語がサポートされています。

詳細については、Read API の攻略ガイドを参照してください。

Read API v3.1 パブリックプレビュー 1 の詳細を確認する

2020 年 5 月

Azure AI Vision API v3.0 が一般提供になり、Read API が更新されています。

英語、オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、およびスペイン語のサポート
精度の向上
抽出された各単語の信頼度スコア
新しい出力形式

詳細については、OCR の概要に関するページを参照してください。

2020 年 4 月

新しい Face API 認識モデル

新しい認識 03 モデルは、現在使用できる最も正確なモデルです。新しいお客様の場合は、このモデルを使用することをお勧めします。 Recognition 03 を使うと、類似性比較と人物照合比較の両方の正確性が向上します。詳細については、「顔認識モデルを指定する」を参照してください。

2020 年 3 月

TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。詳しくは、Azure AI サービスのセキュリティをご覧ください。

2020 年 1 月

Read API 3.0 パブリックプレビュー

Read API のバージョン3.0 を使用すると、印刷されたテキストまたは手書きテキストを画像から抽出できます。以前のバージョンと比較して、3.0 では以下のものが提供されます。

精度の向上
新しい出力形式
抽出された各単語の信頼度スコア
言語パラメーターでのスペイン語と英語のサポート

3\.0 API の使用を開始するには、テキストの抽出に関するクイックスタートに従ってください。

2019 年 6 月

新しい Face API 検出モデル

新しい Detection 02 モデルの特徴は、小さい顔、横顔、隠れた顔、ぼやけた顔における精度の向上です。 Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、LargePersonGroup Person - Add Face で、detectionModel パラメーターに新しい顔検出モデル名 detection_02 を指定して使用してください。詳細については、検出モデルの指定方法に関するページを参照してください。

2019 年 4 月

属性の精度の向上

age と headPose 属性の全体的な精度の向上。 headPose 属性も、pitch 値で更新されます。これらの属性を、Face - DetectreturnFaceAttributesパラメーターの returnFaceAttributes パラメーターに指定して使用します。

処理速度の向上

Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、および LargePersonGroup Person - Add Face 各操作の速度が向上しました。

2019 年 3 月

新しい Face API 認識モデル

Recognition 02 モデルの精度が向上しています。 Face - Detect、FaceList - Create、LargeFaceList - Create、PersonGroup - Create、LargePersonGroup - Create で、recognitionModel パラメーターに新しい顔認識モデル名 recognition_02 を指定して使用してください。詳細については、認識モデルの指定方法に関するページを参照してください。

2019 年 1 月

Face Snapshot 機能

Snapshot 機能により、サブスクリプション間のデータ移行がサポートされます。

重要

2023 年 6 月 30 日の時点で、Face Snapshot API は廃止されました。

2018 年 10 月

API メッセージ

「PersonGroup - Get Training Status (PersonGroup - トレーニングの状態の取得)」、「LargePersonGroup - Get Training Status (LargePersonGroup - トレーニングの状態の取得)」、および「LargeFaceList - Get Training Status (LargeFaceList - トレーニング状態の取得)」で、status、createdDateTime、lastActionDateTime、および lastSuccessfulTrainingDateTime の説明を改善しました。

2018 年 5 月

属性の精度の向上

gender 属性が大幅に改善され、age、glasses、facialHair、hair、makeup 属性も改善されました。 Face - DetectreturnFaceAttributes パラメーターを通じてそれらを使用します。

ファイルサイズの上限の引き上げ

Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、LargePersonGroup Person - Add Face で入力画像ファイルのサイズ上限が 4 MB から 6 MB に増えました。

2018 年 3 月

新しいデータ構造

(LargeFaceList と LargePersonGroup)。詳細については、「登録されたユーザーの数の増分に対応するためにスケーリングする方法」を参照してください。
Face - IdentifymaxNumOfCandidatesReturned パラメーターを [1, 5] から [1, 100] に増やしました。既定値は 10 です。

2017 年 5 月

顔の新しい検出可能な属性

hair、makeup、accessory、occlusion、blur、exposure、noise 属性を Face - DetectreturnFaceAttributes パラメーターに追加しました。
PersonGroup と Face - Identify で 1 万人に対応しました。
PersonGroup Person - List がオプションパラメーターの start と top で改ページに対応しました。
さまざまな FaceLists と PersonGroup のさまざまな人に対する顔の追加/削除でコンカレンシーに対応しました。

2017 年 3 月

顔の新しい検出可能な属性

Face - DetectreturnFaceAttributes パラメーターに emotion 属性を追加しました。

修正された問題

FaceList - Add Face と PersonGroup Person - Add Face で targetFace として Face - Detect から返された顔を長方形で再検出することができませんでした。
検出可能な顔サイズは、厳密に 36 x 36 から 4096 x 4096 ピクセルになるように設定されています。

2016 年 11 月

新しいサブスクリプションレベル

同一人物確認や同様の照合に PersonGroup Person - Add Face または FaceList - Add Face を使用するとき、保存する顔の数を増やすために Face ストレージ Standard サブスクリプションを追加しました。保存した画像には、顔 1000 個あたり 0.5 ドルの料金がかかります。この料金は日割りで課金されます。 Free レベルのサブスクリプションは引き続き合計 1,000 人に制限されます。

2016 年 10 月

API メッセージ

FaceList - Add Face と PersonGroup Person - Add Face で、targetFace の複数の顔に対するエラーメッセージが 'There are more than one face in the image' から 'There is more than one face in the image' に変更されました。

2016 年 7 月

新機能

Face - Verify が Face to Person のオブジェクト認証に対応しました。
mode というオプションパラメーターが追加され、Face - Find Similar で matchPerson と matchFace という 2 つの作業モードを選択できるようになりました。指定しなければ、matchPerson です。
confidenceThreshold というオプションパラメーターを追加しました。Face - Identify で、ある顔がある Person オブジェクトに属するかどうかを示すしきい値をこのパラメーターで設定できます。
PersonGroup - List にオプションパラメーターの start と top を追加しました。一覧表示する開始点と合計 PersonGroups 数を指定できます。

V1.0 の V0 からの変更点

サービスルートエンドポイントが https://westus.api.cognitive.microsoft.com/face/v0/ から https://westus.api.cognitive.microsoft.com/face/v1.0/ に更新されました。変更は Face - Detect、Face - Identify、Face - Find Similar、Face - Group に適用されます。
顔の検出可能な最小サイズが 36 x 36 ピクセルに変更されました。 36 x 36 ピクセルより小さな顔は検出されません。
Face V0 では、PersonGroup データと Person データが非推奨になりました。それらのデータには Face V1.0 サービスでアクセスできません。
2016 年 6 月 30 日をもって Face API の V0 エンドポイントが非推奨になりました。

Azure AI サービスの更新プログラム

Azure AI サービスに対する Azure 更新プログラムのお知らせ

次の方法で共有

Azure AI Vision の新機能

2025 年 2 月

Face ライブネス クライアント側 SDK 1.1.0 リリース

2025 年 1 月

Face ライブネス検出 GA

Image Analysis 4.0 Preview API の非推奨

2024 年 8 月

顔の新しい検出可能な属性

2024 年 5 月

新しい Face SDK 1.0.0-beta.1 (破壊的変更)

2024 年 2 月

マルチモーダル埋め込み GA: 新しい多言語モデル

2024 年 1 月

新しい Image Analysis SDK 1.0.0-beta.1 (破壊的変更)

2023 年 11 月

Analyze Image 4.0 の一般提供

ライブネス検出用の Faceクライアント側 SDK

2023 年 9 月

期限切れの Computer Vision API バージョンの廃止

2023 年 5 月

Image Analysis 4.0 Product Recognition (パブリック プレビュー)

2023 年 4 月

Face の制限付きアクセス トークン

2023 年 3 月

Azure AI Vision Image Analysis 4.0 SDK パブリック プレビュー

Image Analysis 4.0 SDK (パブリック プレビュー)

Image Analysis V4.0 のキャプションと高密度キャプション (パブリック プレビュー):

ビデオ要約とフレーム ロケーター (パブリック プレビュー):

Image Analysis 4.0 のモデル カスタマイズ (パブリック プレビュー)

マルチモーダル埋め込み API (パブリック プレビュー)

背景削除 API (パブリック プレビュー)

Azure AI Vision 3.0 と 3.1 プレビューの廃止

2022 年 10 月

Azure AI Vision Image Analysis 4.0 (パブリック プレビュー)

2022 年 9 月

Azure AI Vision 3.0/3.1 Read プレビューの非推奨化

2022 年 6 月

Vision Studio の提供開始

Face での責任ある AI

顔のわかりやすさに関するメモ

機密性の高い属性の廃止

Fairlearn パッケージと Microsoft の公平性ダッシュボード

制限付きアクセス ポリシー

Azure AI Vision 3.2 プレビューの廃止

2022 年 5 月

OCR (Read) API モデルが一般公開 (GA) になりました

2022 年 2 月

OCR (Read) API パブリック プレビューが 164 の言語に対応

Detection_01 および Detection_03 の新しい品質属性

2021 年 9 月

OCR (Read) API パブリック プレビューが 122 の言語に対応

2021 年 8 月

画像のタグ付け言語の拡張

2021 年 7 月

Detection_03 の新しい HeadPose とランドマークの向上

2021 年 5 月

空間分析コンテナーの更新

2021 年 4 月

Azure AI Vision v3.2 GA

PersonDirectory のデータ構造 (プレビュー)

2021 年 3 月

Azure AI Vision 3.2 パブリック プレビューの更新

2021 年 2 月

Read API v3.2 のパブリック プレビューが 73 言語の OCR に対応

新しい Face API 検出モデル

顔の新しい検出可能な属性

新しい Face API 認識モデル

2021 年 1 月

空間分析コンテナーの更新

待ち時間の軽減

2020 年 12 月

Face ID ストレージのお客様の構成

2020 年 11 月

サンプルの顔登録アプリ

2020 年 10 月

Azure AI Vision API v3.1 GA

2020 年 9 月

空間分析コンテナー プレビュー

Read API v3.1 パブリック プレビューが新たに日本語の OCR に対応

Face ライブネスクライアント側 SDK 1.1.0 リリース

Image Analysis 4.0 Product Recognition (パブリックプレビュー)

Face の制限付きアクセストークン

Azure AI Vision Image Analysis 4.0 SDK パブリックプレビュー

Image Analysis 4.0 SDK (パブリックプレビュー)

Image Analysis V4.0 のキャプションと高密度キャプション (パブリックプレビュー):

ビデオ要約とフレームロケーター (パブリックプレビュー):

Image Analysis 4.0 のモデルカスタマイズ (パブリックプレビュー)

マルチモーダル埋め込み API (パブリックプレビュー)

背景削除 API (パブリックプレビュー)

Azure AI Vision Image Analysis 4.0 (パブリックプレビュー)

制限付きアクセスポリシー

OCR (Read) API パブリックプレビューが 164 の言語に対応

OCR (Read) API パブリックプレビューが 122 の言語に対応

Azure AI Vision 3.2 パブリックプレビューの更新

Read API v3.2 のパブリックプレビューが 73 言語の OCR に対応

空間分析コンテナープレビュー

Read API v3.1 パブリックプレビューが新たに日本語の OCR に対応

保存データのカスタマーマネージド暗号化

Read API v3.1 のパブリックプレビューが簡体字中国語の OCR に対応

Read API 3.0 パブリックプレビュー

ファイルサイズの上限の引き上げ

新しいサブスクリプションレベル