Computer Vision とは

Azure の Computer Vision サービスを使用すると、関心のある視覚的特徴に基づいて、画像を処理して情報を返す高度なアルゴリズムにアクセスできます。

サービス 説明
光学式文字認識 (OCR) 光学式文字認識 (OCR) サービスは、画像からテキストを抽出します。 新しい Read API を使用して、印刷されたテキストと手書きのテキストを写真やドキュメントから抽出することができます。 ディープラーニングベースのモデルを使用して、さまざまなサーフェスや背景のテキストを操作します。 たとえば、ビジネス ドキュメント、請求書、レシート、ポスター、名刺、レター、ホワイトボードが対象となります。 OCR API では、複数の言語で印刷されたテキストの抽出がサポートされます。 使用を開始するには、OCR クイックスタートに従ってください。
画像分析 画像分析サービスは、物、顔、成人向けコンテンツ、自動生成されたテキストの説明など、さまざまな視覚的特徴を画像から抽出します。 使用を開始するには、画像分析のクイックスタートに従ってください。
Face Face サービスは、画像に含まれている人の顔を検出、認識、分析する AI アルゴリズムを提供します。 顔認識ソフトウェアは、本人確認、タッチレス アクセス制御、プライバシーのための顔ぼかしなど、さまざまなシナリオで重要です。 使用を開始するには、Face のクイックスタートに従ってください。
空間分析 空間分析サービスは、ビデオ フィードでの人々の存在と移動を分析し、他のシステムが応答できるイベントを生成します。 使用を開始するには、空間分析コンテナーをインストールしてください。

デジタル資産管理用の Computer Vision

Computer Vision は、多くのデジタル資産管理 (DAM) シナリオに活用できます。 DAM は、リッチ メディア アセットの整理、保管、取得、およびデジタルの権利とアクセス許可の管理を行うビジネス プロセスです。 たとえば、会社では、表示されるロゴ、顔、オブジェクト、色などに基づいて、画像をグループ化し、識別することができます。 または、自動的に画像のキャプションを生成し、キーワードを添付して検索できるようにすることもできます。 Cognitive Services、Azure Cognitive Search、およびインテリジェント レポートを使用するオールインワンの DAM ソリューションについては、GitHub 上の「ナレッジ マイニング ソリューション アクセラレータ ガイド」を参照してください。 その他の DAM の例については、Computer Vision ソリューション テンプレートのリポジトリを参照してください。

作業の開始

Vision Studio を使用して、Web ブラウザーですばやく Computer Vision の機能を試すことができます。

アプリへの Computer Vision の組み込みを開始するには、クイックスタートに従います。

イメージの要件

Computer Vision では、次の要件に合ったイメージを分析できます。

  • イメージが、JPEG、PNG、GIF、または BMP で提示されている
  • イメージのファイル サイズが 4 メガバイト (MB) 未満である
  • イメージのディメンションが 50 x 50 ピクセルよりも大きい値である
    • Read API の場合、画像の寸法は、50 x 50 から 10,000 x 10,000 ピクセルの間である必要があります。

データのプライバシーとセキュリティ

Cognitive Services 全般に言えることですが、Computer Vision サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。 詳細については、Microsoft セキュリティ センターの Cognitive Services のページを参照してください。

次のステップ

クイックスタートに従って、任意の開発言語でサービスを実装して実行します。