Cloudmersive Image Processing

画像認識および処理 API を使用すると、機械学習を使用してイメージを認識および処理し、便利なイメージ変更操作を実行できます。

このコネクタは、次の製品および地域で利用可能です。

Service クラス 地域
Logic Apps 標準 以下を除くすべての Logic Apps 地域 :
     -   Azure 政府の地域
     -   Azure 中国の地域
     -   国防総省 (DoD)
Power Automate プレミアム 以下を除くすべての Power Automate 地域 :
     -   米国政府 (GCC)
     -   米国政府 (GCC High)
     -   21Vianet が運用する中国のクラウド
     -   国防総省 (DoD)
Power Apps プレミアム 以下を除くすべての Power Apps 地域 :
     -   米国政府 (GCC)
     -   米国政府 (GCC High)
     -   21Vianet が運用する中国のクラウド
     -   国防総省 (DoD)
連絡先
URL https://account.cloudmersive.com/contact-support
コネクタ メタデータ
公開元 Cloudmersive, LLC
Web サイト https://cloudmersive.com/image-recognition-and-processing-api
プライバシー ポリシー https://cloudmersive.com/privacy-policy

このコネクタは、あらゆる画像処理アプリケーションにおいて、イメージの処理 (トリミング、コンポジット、レイヤリング、フィルタリングなどを含む)、ディープ ラーニングによるイメージの認識 (イメージ中の人物、顔、オブジェクトなどを含む)、フォーマット間でのイメージ ファイルの変換を非常に高い忠実度で行うために不可欠です。 Cloudmersive Image Processing は、PNG、BMP、JPEG、WEBP、PSD、その他 100 を超えるファイル形式を含む幅広い一般的なファイル形式をカバーしています。 ステートレスな高セキュリティと高性能処理により、高速パフォーマンスと強力なセキュリティが保証されます。 詳細についてはイメージ認識および処理 API ページをご覧ください。

このコネクタを使用するには、Cloudmersive アカウントが必要です。 Microsoft アカウントでサインアップするか、Cloudmersive アカウントを作成できます。 以下の手順に従って、API キーを取得してください。

API キーとシークレットを取得する

  • Cloudmersive アカウントに登録する
  • Cloudmersive アカウントを使用してログインし、API キーをクリックする

ここでは、API キー ページに表示される API キーを作成して確認できます。 この API キーをコピーして Cloudmersive Image Processing コネクタに貼り付けるだけです。

これで、Cloudmersive Image Processing コネクタの使用を開始する準備が整いました。

接続の作成

コネクタは、次の認証タイプをサポートしています:

既定 接続を作成するためのパラメーター。 すべての地域 共有不可

既定

適用できるもの: すべての領域

接続を作成するためのパラメーター。

これは共有可能な接続ではありません。 パワー アプリが別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

件名 タイプ 内容 必要
API キー (https://cloudmersive.com) securestring この API の API キー True

調整制限

名前 呼び出し 更新期間
接続ごとの API 呼び出し 100 60 秒

アクション

2 つのイメージを合成する

2 つの入力イメージを合成します。ベース イメージ上にレイヤー化されたイメージ。 最初に入力するイメージはベース イメージです。 2 番目のイメージ (レイヤード イメージ) は、このベース イメージの上に合成されます。 PNG の透過性をサポートします。 パディングを制御するために、必要に応じて、レイヤー化されたイメージの境界に透明なピクセルを含めることができます。

EXIF と解像度を含むイメージ メタデータを返します

ファイルの種類、EXIF (利用可能な場合)、解像度など、イメージのメタデータ情報を返します。

イメージからポイント ノイズを除去するためのスペックル除去

ポイント ノイズの除去 / 入力イメージのスペックル除去

イメージから透過性を削除します

イメージ内のアクティブな透過性をすべて削除します。 白い背景の上に同じファイル形式で同じ解像度でイメージを効果的にレンダリングし、透過性を取り除きます。

イメージにテキストを描画する

カスタマイズされたビジュアルを使用して、1 つまたは複数のテキストをイメージに描画します

イメージに多角形を描画します

カスタマイズされたビジュアルを使用して、1 つまたは複数の多角形をイメージに描画します

イメージに長方形を描画します

カスタマイズされたビジュアルを使用して、1 つまたは複数の長方形をイメージに描画します

イメージのエッジを検出してハイライトします

入力イメージに対してエッジ検出操作を実行します

イメージのコントラストを適応的に調整して、より魅力的で見やすくします

人間の目の見え方に合わせてコントラストを調整するガンマを採用。 その結果、イメージの見やすさや視覚的な魅力が大幅に向上しました。

イメージの主な色を返します

高度なイメージ処理を使用して、イメージの上位 5 つの ドミナント カラー を抽出し、ドミナント の順に最も ドミナント な色を最初に返します。 これらは、視聴者が知覚するイメージで使用される主要な知覚色です。

イメージの回転を正規化し、EXIF 回転データを削除します

EXIF 情報に基づいて入力イメージの向きを自動的に設定してから、EXIF 情報を削除します。 EXIF は、カメラの向きに基づいて携帯電話のカメラで撮影された一部のイメージに保存される追加の情報セットです。 回転を正規化し、EXIF データを削除することで、これらのイメージの処理がはるかに簡単になります。

イメージをエンボス加工する

入力イメージに対してエンボス操作を実行します

イメージを任意の角度で回転させる

イメージを任意の角度で回転します

イメージを白黒のグレースケールに変換します

グレースケールの白黒イメージに変換して、イメージから色を削除します

イメージを矩形領域にトリミングします

イメージを目的の矩形領域に切り取る

イメージを自動的に芸術的な絵画に変換します

機械学習を使用して、イメージを自動的に芸術的な絵画に変換します。 AI の処理の深さのため、イメージ サイズによってはこの操作に最大 20 秒かかることがあります。

イメージサイズの変更

イメージのサイズを特定の幅と高さに変更します

イメージ内のシンボルの場所を見つける

イメージに記号が含まれているかどうかを確認し、含まれている場合は、イメージ内のその記号の位置を確認します。

イメージ内のタイプと場所を含むオブジェクトを検出します

イメージ内のオブジェクトの位置、サイズ、説明、および認識の信頼水準を特定します。 イメージ内の人間と物体の両方を検出します。

イメージ内の人の年齢を検出する

イメージの中の人の顔の年齢、位置、大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要はなく、別の方向、真横でも構いません。

イメージ内の人の性別を検出する

イメージの中の人の顔の性別、位置、大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要があります。

イメージ内の場所を含む人を検出する

イメージの中の人物の位置や大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要はなく、別の方向、真横でも構いません。

イメージ内の車両のナンバー プレートを検出する

イメージ内の車両のナンバー プレートの位置、サイズ、および内容を特定します。 ナンバー プレートは、カメラに対して軸上で 15 から 20 度以内にある必要があります。

イメージ内の顔やランドマークの目や鼻や口を検出して見つける

イメージ内のすべての顔の位置を、それぞれの目、眉毛、鼻、口のコンポーネントとともに見つけます

イメージ内の顔を検出して見つける

イメージ内のすべての顔の位置を見つけます

カスタマイズ可能なドロップ シャドウをイメージに追加します

カスタマイズ可能なドロップ シャドウをイメージに追加します

スワールでイメージを歪めます

スワールは、指定された度数だけイメージを歪ませます

ドキュメントの写真から細かいテキストを検出する

ドキュメントの写真内の小さい / 細かいテキストの位置とサイズを特定します。 写真に写っている文字やその他の高密度のテキストなど、小さなテキストの位置を特定することができます。 ドキュメントのスキャン、またはドキュメント、ページ、レシートの写真 (スマートフォンのカメラなど) に使用できます。 OCR の目的 - ディープ ラーニング OCR API をご覧ください。

ドキュメントの写真を検出して歪みを戻します

ドキュメントの写真 (携帯電話で撮影したものなど) を検出して、完全に正方形のイメージに戻します。 ドキュメント スキャン アプリケーションに最適です。このイメージが歪んでいなければ、Convert API による PDF への変換や、OCR API による光学式文字認識に最適です。

丸形トリミングでイメージを顔に切り抜く

イメージを顔に合わせてトリミングします (円形 / 丸形のトリミング)。 複数の顔が存在する場合は、最初の顔を選択してください。

入力イメージにガウシアンぼかしを実行します

入力イメージにガウシアンぼかしを実行します

入力イメージにモーション ブラーを実行します

特定の角度で入力イメージにモーション ブラーを実行します

入力イメージを GIF 形式に変換します

入力イメージを GIF 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力イメージを JPG、JPEG 形式に変換します

入力イメージを JPEG/JPG 形式に変換します。 エンコード パラメーターをカスタマイズします。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力イメージを PNG 形式に変換します

入力イメージを PNG 形式に変換します。 透過性がある場合は保持されます。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力イメージを TIFF 形式に変換します

入力イメージを TIFF 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力イメージを WebP 形式に変換します

入力イメージを WebP 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力イメージをビットマップ BMP 形式に変換します

入力イメージを PSD 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

入力画像を Photoshop PSD 形式に変換する

入力イメージを PSD 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

写真内の大きなテキストを検出する

写真内の大きなテキストの位置とサイズを特定します。 写真内の大きなテキストの場所を特定します。たとえば、看板やタイトルなど、その他の形式の大きな低密度のテキストです。 OCR を目的とした高密度テキスト (ドキュメントのスキャン、領収書など) には適していません。OCR については、ディープ ラーニング OCR API をご覧ください。

明確な色を減らしてイメージをポスタリゼーションする

イメージ内の一意の色数を指定されたレベルまで減らします

正方形トリミングでイメージを顔に切り抜く

イメージを顔に合わせてトリミングします (正方形トリミング)。 複数の顔が存在する場合は、最初の顔を選択してください。

縦横比を維持しながらイメージのサイズを変更する

イメージの元の縦横比を維持しながら、イメージのサイズを最大幅と最大高さに変更します

職場閲覧注意 NSFW わいせつコンテンツの分類

イメージを職場閲覧注意 (NSFW)/ポルノ/レイシー/コンテンツとセーフ コンテンツに分類します。

自然言語でイメージを説明する

イメージの英語のテキスト説明を文として生成します。

顔を比較して一致させる

入力イメージ内の顔を見つけ、参照イメージと比較して、参照イメージ内の顔と一致するかどうかを判断します。 参照イメージ (2 番目のパラメーター) には、正確に 1 つの顔が含まれている必要があります。

2 つのイメージを合成する

2 つの入力イメージを合成します。ベース イメージ上にレイヤー化されたイメージ。 最初に入力するイメージはベース イメージです。 2 番目のイメージ (レイヤード イメージ) は、このベース イメージの上に合成されます。 PNG の透過性をサポートします。 パディングを制御するために、必要に応じて、レイヤー化されたイメージの境界に透明なピクセルを含めることができます。

パラメーター

名前 キー 必須 説明
レイヤード イメージを合成する場所。可能な値は次のとおりです : 「中心 ...
location True string

レイヤード イメージを合成する場所。可能な値は次のとおりです : 「中心 ...

操作を実行する画像ファイル。 P などの一般的なファイル形式...
baseImage True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

ベース イメージの上に重ねるイメージ。
layeredImage True file

ベース イメージの上に重ねるイメージ。

戻り値

応答
binary

EXIF と解像度を含むイメージ メタデータを返します

ファイルの種類、EXIF (利用可能な場合)、解像度など、イメージのメタデータ情報を返します。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージからのメタデータ

本文​​
ImageMetadata

イメージからポイント ノイズを除去するためのスペックル除去

ポイント ノイズの除去 / 入力イメージのスペックル除去

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージから透過性を削除します

イメージ内のアクティブな透過性をすべて削除します。 白い背景の上に同じファイル形式で同じ解像度でイメージを効果的にレンダリングし、透過性を取り除きます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージにテキストを描画する

カスタマイズされたビジュアルを使用して、1 つまたは複数のテキストをイメージに描画します

パラメーター

名前 キー 必須 説明
BaseImageBytes
BaseImageBytes byte

テキストを描画するイメージ (バイト単位)。 代わりに BaseImageUrl を使用して、イメージ入力を URL として提供することもできます

BaseImageUrl
BaseImageUrl string

HTTP または HTTPS の完全修飾 URL としてテキストを描画するイメージ

Color string

使用する色 - 16 進数の値 (# 付き) または HTML の一般的な色名を指定できます。

FontFamilyName
FontFamilyName string

使用するフォント ファミリ。 既定で「Arial」になります。

FontSize
FontSize double

使用するフォント サイズ。

高さ
Height double

テキストを描画するテキスト ボックスのピクセル単位の高さ。テキストはこのボックス内で折り返されます

テキスト
Text string

描画するテキスト文字列

Width double

テキストを描画するテキスト ボックスのピクセル単位の幅。テキストはこのボックス内で折り返されます

X
X double

テキストの場所の左端のピクセルの場所

Y double

テキストの場所の上端のピクセルの場所

戻り値

応答
binary

イメージに多角形を描画します

カスタマイズされたビジュアルを使用して、1 つまたは複数の多角形をイメージに描画します

パラメーター

名前 キー 必須 説明
BaseImageBytes
BaseImageBytes byte

ポリゴンを描画するイメージ (バイト単位)。 代わりに BaseImageUrl を使用して、イメージ入力を URL として提供することもできます

BaseImageUrl
BaseImageUrl string

HTTP または HTTPS の完全修飾 URL として多角形を描画するイメージ

BorderColor
BorderColor string

使用する境界線の色 - 16 進値 (# 付き) または HTML の一般的な色名にすることができます。 透明色がサポートされています。

BorderWidth
BorderWidth double

境界線のピクセル単位の幅。 0 を渡すと、境界線のない多角形が描画されます

FillColor
FillColor string

使用する塗りつぶしの色 - 16 進数の値 (# 付き) または HTML の一般的な色名を指定できます。 透明色がサポートされています。 多角形を塗りつぶさないようにするには、空白のままにします。

X
X double

多角形内のこのポイントのピクセル単位の X 位置

Y double

多角形内のこのポイントのピクセル単位の Y 位置

戻り値

応答
binary

イメージに長方形を描画します

カスタマイズされたビジュアルを使用して、1 つまたは複数の長方形をイメージに描画します

パラメーター

名前 キー 必須 説明
BaseImageBytes
BaseImageBytes byte

長方形を描画するイメージ (バイト単位)。 代わりに BaseImageUrl を使用して、イメージ入力を URL として提供することもできます

BaseImageUrl
BaseImageUrl string

HTTP または HTTPS の完全修飾 URL として長方形を描画するイメージ

BorderColor
BorderColor string

使用する境界線の色 - 16 進値 (# 付き) または HTML の一般的な色名にすることができます。 透明色がサポートされています。

BorderWidth
BorderWidth double

境界線のピクセル単位の幅。 0 を渡すと、境界線のない長方形が描画されます

FillColor
FillColor string

使用する塗りつぶしの色 - 16 進数の値 (# 付き) または HTML の一般的な色名を指定できます。 透明色がサポートされています。 長方形を塗りつぶさないようにするには、空白のままにします。

高さ
Height double

長方形のピクセル単位の高さ

Width double

長方形のピクセル単位の幅

X
X double

長方形の位置の左端のピクセル位置

Y double

長方形の位置の上端のピクセル位置

戻り値

応答
binary

イメージのエッジを検出してハイライトします

入力イメージに対してエッジ検出操作を実行します

パラメーター

名前 キー 必須 説明
エッジ検出操作のピクセル単位の半径。半径が大きくなると ...
radius True integer

エッジ検出操作のピクセル単位の半径。半径が大きくなると ...

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージのコントラストを適応的に調整して、より魅力的で見やすくします

人間の目の見え方に合わせてコントラストを調整するガンマを採用。 その結果、イメージの見やすさや視覚的な魅力が大幅に向上しました。

パラメーター

名前 キー 必須 説明
イメージのコントラストを調整するためのガンマ値。 推奨値は次のとおりです...
gamma True double

イメージのコントラストを調整するためのガンマ値。 推奨値は次のとおりです...

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージの主な色を返します

高度なイメージ処理を使用して、イメージの上位 5 つの ドミナント カラー を抽出し、ドミナント の順に最も ドミナント な色を最初に返します。 これらは、視聴者が知覚するイメージで使用される主要な知覚色です。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

ドミナント カラー取得操作を実行した結果

本文​​
DominantColorResult

イメージの回転を正規化し、EXIF 回転データを削除します

EXIF 情報に基づいて入力イメージの向きを自動的に設定してから、EXIF 情報を削除します。 EXIF は、カメラの向きに基づいて携帯電話のカメラで撮影された一部のイメージに保存される追加の情報セットです。 回転を正規化し、EXIF データを削除することで、これらのイメージの処理がはるかに簡単になります。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージをエンボス加工する

入力イメージに対してエンボス操作を実行します

パラメーター

名前 キー 必須 説明
エンボス操作のピクセル単位の半径。半径を大きくすると ...
radius True integer

エンボス操作のピクセル単位の半径。半径を大きくすると ...

エンボス操作のシグマ、または分散
sigma True integer

エンボス操作のシグマ、または分散

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージを任意の角度で回転させる

イメージを任意の角度で回転します

パラメーター

名前 キー 必須 説明
イメージを回転させる程度。値の範囲は 0.0 から 360.0 です。
degrees True double

イメージを回転させる程度。値の範囲は 0.0 から 360.0 です。

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージを白黒のグレースケールに変換します

グレースケールの白黒イメージに変換して、イメージから色を削除します

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージを矩形領域にトリミングします

イメージを目的の矩形領域に切り取る

パラメーター

名前 キー 必須 説明
矩形のトリミング領域の左端 (ピクセル (X))。
left True integer

矩形のトリミング領域の左端 (ピクセル (X))。

矩形のトリミング領域の上端 (ピクセル (Y))。
top True integer

矩形のトリミング領域の上端 (ピクセル (Y))。

矩形のトリミング領域の幅 (ピクセル)。
width True integer

矩形のトリミング領域の幅 (ピクセル)。

矩形のトリミング領域の高さ (ピクセル)。
height True integer

矩形のトリミング領域の高さ (ピクセル)。

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージを自動的に芸術的な絵画に変換します

機械学習を使用して、イメージを自動的に芸術的な絵画に変換します。 AI の処理の深さのため、イメージ サイズによってはこの操作に最大 20 秒かかることがあります。

パラメーター

名前 キー 必須 説明
適用する絵のスタイル。 最初に、「udnie」という絵を描いてください ...
style True string

適用する絵のスタイル。 最初に、「udnie」という絵を描いてください ...

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージサイズの変更

イメージのサイズを特定の幅と高さに変更します

パラメーター

名前 キー 必須 説明
出力イメージの幅 - 最終的なイメージはまさにこの幅になります
width True integer

出力イメージの幅 - 最終的なイメージはまさにこの幅になります

出力イメージの高さ - 最終的なイメージは正確にこの高さになります
height True integer

出力イメージの高さ - 最終的なイメージは正確にこの高さになります

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

イメージ内のシンボルの場所を見つける

イメージに記号が含まれているかどうかを確認し、含まれている場合は、イメージ内のその記号の位置を確認します。

パラメーター

名前 キー 必須 説明
ターゲット イメージを検索するためのイメージ ファイル。
inputImage True file

ターゲット イメージを検索するためのイメージ ファイル。

入力イメージで検索するイメージ。
targetImage True file

入力イメージで検索するイメージ。

戻り値

入力イメージに対するシンボル検索操作の結果

本文​​
FindSymbolResult

イメージ内のタイプと場所を含むオブジェクトを検出します

イメージ内のオブジェクトの位置、サイズ、説明、および認識の信頼水準を特定します。 イメージ内の人間と物体の両方を検出します。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内のオブジェクトを検出した結果

本文​​
ObjectDetectionResult

イメージ内の人の年齢を検出する

イメージの中の人の顔の年齢、位置、大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要はなく、別の方向、真横でも構いません。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内の人々の年齢を分類した結果

本文​​
AgeDetectionResult

イメージ内の人の性別を検出する

イメージの中の人の顔の性別、位置、大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要があります。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内の人々の性別を分類した結果

本文​​
GenderDetectionResult

イメージ内の場所を含む人を検出する

イメージの中の人物の位置や大きさを認識し、認識信頼度を表示します。 イメージ内の人物はカメラの方を向いている必要はなく、別の方向、真横でも構いません。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内のオブジェクトを検出した結果

本文​​
ObjectDetectionResult

イメージ内の車両のナンバー プレートを検出する

イメージ内の車両のナンバー プレートの位置、サイズ、および内容を特定します。 ナンバー プレートは、カメラに対して軸上で 15 から 20 度以内にある必要があります。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内の車両のナンバー プレートを検出した結果

イメージ内の顔やランドマークの目や鼻や口を検出して見つける

イメージ内のすべての顔の位置を、それぞれの目、眉毛、鼻、口のコンポーネントとともに見つけます

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内の顔の位置を特定した結果

イメージ内の顔を検出して見つける

イメージ内のすべての顔の位置を見つけます

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ内の顔の位置を特定した結果

本文​​
FaceLocateResponse

カスタマイズ可能なドロップ シャドウをイメージに追加します

カスタマイズ可能なドロップ シャドウをイメージに追加します

パラメーター

名前 キー 必須 説明
ドロップ シャドウの水平 (X) オフセット
X True integer

ドロップ シャドウの水平 (X) オフセット

ドロップ シャドウの垂直 (Y) オフセット
Y True integer

ドロップ シャドウの垂直 (Y) オフセット

ドロップ シャドウのシグマ (ぼかし距離)
sigma True integer

ドロップ シャドウのシグマ (ぼかし距離)

ドロップ シャドウの不透明度。0 は 0%、100 は 100%
opacity True integer

ドロップ シャドウの不透明度。0 は 0%、100 は 100%

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

スワールでイメージを歪めます

スワールは、指定された度数だけイメージを歪ませます

パラメーター

名前 キー 必須 説明
スワールの程度
degrees True integer

スワールの程度

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

ドキュメントの写真から細かいテキストを検出する

ドキュメントの写真内の小さい / 細かいテキストの位置とサイズを特定します。 写真に写っている文字やその他の高密度のテキストなど、小さなテキストの位置を特定することができます。 ドキュメントのスキャン、またはドキュメント、ページ、レシートの写真 (スマートフォンのカメラなど) に使用できます。 OCR の目的 - ディープ ラーニング OCR API をご覧ください。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

写真のテキストを検出する操作の結果

ドキュメントの写真を検出して歪みを戻します

ドキュメントの写真 (携帯電話で撮影したものなど) を検出して、完全に正方形のイメージに戻します。 ドキュメント スキャン アプリケーションに最適です。このイメージが歪んでいなければ、Convert API による PDF への変換や、OCR API による光学式文字認識に最適です。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

メールに適用するオプションの後処理効果。既定は「いいえ」です。
PostProcessingEffect string

メールに適用するオプションの後処理効果。既定は「いいえ」です。

戻り値

応答
binary

丸形トリミングでイメージを顔に切り抜く

イメージを顔に合わせてトリミングします (円形 / 丸形のトリミング)。 複数の顔が存在する場合は、最初の顔を選択してください。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージにガウシアンぼかしを実行します

入力イメージにガウシアンぼかしを実行します

パラメーター

名前 キー 必須 説明
ぼかし操作のピクセル単位の半径。半径を大きくすると ...
radius True integer

ぼかし操作のピクセル単位の半径。半径を大きくすると ...

ガウシアンぼかし操作のシグマ、または分散
sigma True integer

ガウシアンぼかし操作のシグマ、または分散

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージにモーション ブラーを実行します

特定の角度で入力イメージにモーション ブラーを実行します

パラメーター

名前 キー 必須 説明
ぼかし操作のピクセル単位の半径。半径を大きくすると ...
radius True integer

ぼかし操作のピクセル単位の半径。半径を大きくすると ...

モーション ブラー操作のシグマ、または分散
sigma True integer

モーション ブラー操作のシグマ、または分散

モーション ブラーの角度 (度単位)
angle True integer

モーション ブラーの角度 (度単位)

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージを GIF 形式に変換します

入力イメージを GIF 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージを JPG、JPEG 形式に変換します

入力イメージを JPEG/JPG 形式に変換します。 エンコード パラメーターをカスタマイズします。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
JPEG 品質レベルを設定します。最低品質は 1 (最高圧縮)、...
quality True integer

JPEG 品質レベルを設定します。最低品質は 1 (最高圧縮)、...

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージを PNG 形式に変換します

入力イメージを PNG 形式に変換します。 透過性がある場合は保持されます。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージを TIFF 形式に変換します

入力イメージを TIFF 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージを WebP 形式に変換します

入力イメージを WebP 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力イメージをビットマップ BMP 形式に変換します

入力イメージを PSD 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

入力画像を Photoshop PSD 形式に変換する

入力イメージを PSD 形式に変換します。 サポートされている入力ファイル形式には、AAI、ART、ARW、AVS、BPG、BMP、BMP2、BMP3、BRF、CALS、CGM、CIN、CMYK、CMYKA、CR2、CRW、CUR、CUT、DCM、DCR、DCX、DDS、DIB、DJVU、DNG、DOT、DPX、EMF、EPDF、EPI、EPS、EPS2、EPS3、EPSF、EPSI、EPT、EXR、FAX、FIG、FITS、FPX、GIF、GPLT、GRAY、HDR、HEIC、HPGL、HRZ、ICO、ISOBRL、ISBRL6、JBIG、JNG、JP2、JPT、J2C、J2K、JPEG/JPG、JXR、MAT、MONO、MNG、M2V、MRW、MTV、NEF、ORF、OTB、P7、PALM、PAM、PBM、PCD、PCDS、PCL、PCX、PDF、PEF、PES、PFA、PFB、PFM、PGM、PICON、PICT、PIX、PNG、PNG8、PNG00、PNG24、PNG32、PNG48、PNG64、PNM、PPM、PSB、PSD、PTIF、PWB、RAD、RAF、RGB、RGBA、RGF、RLA、RLE、SCT、SFW、SGI、SID、SUN、SVG、TGA、TIFF、TIM、UIL、VIFF、VICAR、VBMP、WDP、WEBP、WPG、X、XBM、XCF、XPM、XWD、X3F、YCbCr、YCbCrA、YUV が含まれます。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

写真内の大きなテキストを検出する

写真内の大きなテキストの位置とサイズを特定します。 写真内の大きなテキストの場所を特定します。たとえば、看板やタイトルなど、その他の形式の大きな低密度のテキストです。 OCR を目的とした高密度テキスト (ドキュメントのスキャン、領収書など) には適していません。OCR については、ディープ ラーニング OCR API をご覧ください。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

写真のテキストを検出する操作の結果

本文​​
TextDetectionResult

明確な色を減らしてイメージをポスタリゼーションする

イメージ内の一意の色数を指定されたレベルまで減らします

パラメーター

名前 キー 必須 説明
出力イメージに保持する一意の色の数
levels True integer

出力イメージに保持する一意の色の数

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

正方形トリミングでイメージを顔に切り抜く

イメージを顔に合わせてトリミングします (正方形トリミング)。 複数の顔が存在する場合は、最初の顔を選択してください。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

縦横比を維持しながらイメージのサイズを変更する

イメージの元の縦横比を維持しながら、イメージのサイズを最大幅と最大高さに変更します

パラメーター

名前 キー 必須 説明
出力イメージの最大幅 - 最終イメージは po... と同じ大きさになります
maxWidth True integer

出力イメージの最大幅 - 最終イメージは po... と同じ大きさになります

出力イメージの最大の高さ - 最終イメージは p... と同じ大きさになります
maxHeight True integer

出力イメージの最大の高さ - 最終イメージは p... と同じ大きさになります

操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

応答
binary

職場閲覧注意 NSFW わいせつコンテンツの分類

イメージを職場閲覧注意 (NSFW)/ポルノ/レイシー/コンテンツとセーフ コンテンツに分類します。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

NSFW 分類の結果

本文​​
NsfwResult

自然言語でイメージを説明する

イメージの英語のテキスト説明を文として生成します。

パラメーター

名前 キー 必須 説明
操作を実行する画像ファイル。 P などの一般的なファイル形式...
imageFile True file

操作を実行する画像ファイル。 P などの一般的なファイル形式...

戻り値

イメージ認識の結果

顔を比較して一致させる

入力イメージ内の顔を見つけ、参照イメージと比較して、参照イメージ内の顔と一致するかどうかを判断します。 参照イメージ (2 番目のパラメーター) には、正確に 1 つの顔が含まれている必要があります。

パラメーター

名前 キー 必須 説明
操作を実行するイメージファイル。このイメージには 1 つまたは ... を含めることができます
inputImage True file

操作を実行するイメージファイル。このイメージには 1 つまたは ... を含めることができます

比較および照合する単一の顔のイメージ。
matchFace True file

比較および照合する単一の顔のイメージ。

戻り値

イメージ内の顔を比較/照合した結果

本文​​
FaceCompareResponse

定義

AgeDetectionResult

イメージ内の人々の年齢を分類した結果

名前 パス 説明
PeopleIdentified
PeopleIdentified integer

イメージで年齢とともに特定された人数

PeopleWithAge
PeopleWithAge array of PersonWithAge

年齢情報で注釈が付けられたイメージ内の人々

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

ColorResult

個別の色

名前 パス 説明
B
B integer

この色の青 (B) チャンネルのピクセル値

G
G integer

この色の緑 (G) チャンネルのピクセル値

R
R integer

この色の赤 (R) チャンネルのピクセル値

DetectedLicensePlate

イメージにあるナンバー プレート

名前 パス 説明
高さ
Height integer

ピクセル単位のナンバー プレートの位置の高さ

LicensePlateRecognitionConfidenceLevel
LicensePlateRecognitionConfidenceLevel double

検出されたナンバープレートの精度の 0.0 から 1.0 の範囲の信頼スコア。スコアが高いほど優れています。約 0.75 の値は高い信頼性です

LicensePlateText_BestMatch
LicensePlateText_BestMatch string

ナンバー プレートからのテキスト、最も信頼性の高い結果

LicensePlateText_RunnerUp
LicensePlateText_RunnerUp string

2 番目に高い信頼性の結果に基づくナンバー プレートからの代替テキスト

LocationX
LocationX integer

写真の左端から始まるナンバー プレートの左端の X 位置 (X = 0)

LocationY
LocationY integer

写真の上端から始まるナンバー プレートの上端の Y 位置 (Y = 0)

Width integer

ピクセル単位のナンバー プレートの位置の幅

DetectedObject

イメージで検出された単一オブジェクト インスタンスと関連する詳細

名前 パス 説明
高さ
Height integer

オブジェクトの高さ (ピクセル単位)

ObjectClassName
ObjectClassName string

オブジェクトのクラス。 値の例は、「人」、「車」、「ダイニング テーブル」などです。

スコア
Score double

検出されたオブジェクトの信頼スコア。可能な値は 0.0 から 1.0 の間です。1.0 に近い値ほど信頼性が高くなります

Width integer

オブジェクトの幅 (ピクセル単位)

X
X integer

オブジェクトの左側の位置の X 位置 (ピクセル単位)。右側は X + 幅です

Y integer

オブジェクトの上側の位置の Y 位置 (ピクセル単位)。下側は Y + 高さです

DominantColorResult

ドミナント カラー取得操作を実行した結果

名前 パス 説明
DominantColors
DominantColors array of ColorResult

イメージ内の優勢な色。最も優勢な色が最初のインデックス位置 (0) にあり、2 番目に優勢な色がインデックス位置 1 にあるという順になっています

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

イメージ内の 1 つの顔の位置

名前 パス 説明
BottomY
BottomY integer

顔の下側の Y 座標

LeftX
LeftX integer

顔の左側の X 座標

RightX
RightX integer

顔の右側の X 座標

TopY
TopY integer

顔の上面の Y 座標

FaceCompareResponse

イメージ内の顔を比較/照合した結果

名前 パス 説明
ErrorDetails
ErrorDetails string

発生したエラーの詳細

FaceCount
FaceCount integer

イメージで見つかった顔の数

Faces array of FaceMatch

入力イメージに含まれる顔の配列

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

FaceLocateResponse

イメージ内の顔の位置を特定した結果

名前 パス 説明
ErrorDetails
ErrorDetails string

発生したエラーの詳細

FaceCount
FaceCount integer

イメージで見つかった顔の数

Faces array of Face

イメージに含まれる顔の配列

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

FaceLocateWithLandmarksResponse

イメージ内の顔の位置を特定した結果

名前 パス 説明
ErrorDetails
ErrorDetails string

発生したエラーの詳細

FaceCount
FaceCount integer

イメージで見つかった顔の数

Faces array of FaceWithLandmarks

イメージに含まれる顔の配列

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

FaceMatch

イメージの中の顔の位置と照合結果

名前 パス 説明
BottomY
BottomY integer

顔の下側の Y 座標

HighConfidenceMatch
HighConfidenceMatch boolean

信頼性の高い一致がある場合は true、それ以外の場合は false

LeftX
LeftX integer

顔の左側の X 座標

MatchScore
MatchScore double

一致スコアは 0.0 から 1.0 で、スコアが高いほど一致が大きいことを示します。0.7 を超えるスコアは一致を示します

RightX
RightX integer

顔の右側の X 座標

TopY
TopY integer

顔の上面の Y 座標

FacePoint

顔内のポイント位置

名前 パス 説明
X
X integer

X の位置。0 は左端のピクセルです

Y integer

Y の位置。0 は上端のピクセルです

FaceWithLandmarks

イメージ内の 1 つの顔の位置

名前 パス 説明
BottomAndSidesOfFace
BottomAndSidesOfFace array of FacePoint

顔の底面と側面 (頬とあご) の位置をポイントします

BottomY
BottomY integer

顔の下側の Y 座標

LeftEye
LeftEye array of FacePoint

左目 (イメージの左側に最も近い目) のポイント位置

LeftEyebrow
LeftEyebrow array of FacePoint

左眉 (写真の左端にある眉の位置) のポイント位置

LeftX
LeftX integer

顔の左側の X 座標

LipsInnerOutline
LipsInnerOutline array of FacePoint

唇の内側の輪郭のポイント位置

LipsOuterOutline
LipsOuterOutline array of FacePoint

唇の外側の輪郭のポイント位置

NoseBottom
NoseBottom array of FacePoint

鼻の下 (鼻孔) のポイント位置

NoseBridge
NoseBridge array of FacePoint

鼻峯のポイント位置 (鼻の垂直部分)

RightEye
RightEye array of FacePoint

右目 (イメージの右側に最も近い目) のポイント位置

RightEyebrow
RightEyebrow array of FacePoint

右眉 (写真の右端にある眉の位置) のポイント位置

RightX
RightX integer

顔の右側の X 座標

TopY
TopY integer

顔の上面の Y 座標

FindSymbolResult

入力イメージに対するシンボル検索操作の結果

名前 パス 説明
高さ
Height integer

見つかった場所の高さ (ピクセル単位)

MatchScore
MatchScore double

シンボルがどの程度一致しているかを測定する 0.0 から 1.0 の間のスコア。0.2 を超えるスコアは良好です

成功
Successful boolean

成功の場合は true 、それ以外の場合は false

Width integer

見つかった場所の幅 (ピクセル単位)

XLeft
XLeft integer

見つかった場所の左端の X 位置 (ピクセル単位)

YTop
YTop integer

見つかった場所の上端の Y 位置 (ピクセル単位)

FineTextDetectionResult

写真のテキストを検出する操作の結果

名前 パス 説明
成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

TextItems
TextItems array of FineTextItem

入力イメージで見つかったテキスト アイテム

TextItemsCount
TextItemsCount integer

入力イメージで見つかったテキストアイテムの数

FineTextItem

イメージに出現するテキストの個々のインスタンス。1 つのテキスト

名前 パス 説明
角度
Angle double

テキストのラジアン単位の回転角

BottomLeftX
BottomLeftX integer

左下のテキスト位置の X 座標。0 は入力イメージの左端を表します

BottomLeftY
BottomLeftY integer

左下のテキスト位置の Y 座標。0 は入力イメージの上端を表します

BottomRightX
BottomRightX integer

右下のテキスト位置の X 座標。0 は入力イメージの左端を表します

BottomRightY
BottomRightY integer

右下のテキスト位置の Y 座標。0 は入力イメージの上端を表します

高さ
Height integer

テキストのピクセル単位の高さ

TopLeftX
TopLeftX integer

左上のテキスト位置の X 座標。0 は入力イメージの左端を表します

TopLeftY
TopLeftY integer

左上のテキスト位置の Y 座標。0 は入力イメージの上端を表します

TopRightX
TopRightX integer

右上のテキスト位置の X 座標。0 は入力イメージの左端を表します

TopRightY
TopRightY integer

右上のテキスト位置の Y 座標。0 は入力イメージの上端を表します

Width integer

テキストのピクセル単位の幅

GenderDetectionResult

イメージ内の人々の性別を分類した結果

名前 パス 説明
PeopleIdentified
PeopleIdentified integer

イメージで性別で識別された人数

PersonWithGender
PersonWithGender array of PersonWithGender

性別情報で注釈が付けられたイメージ内の人々

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

ImageDescriptionResponse

イメージ認識の結果

名前 パス 説明
BestOutcome
BestOutcome RecognitionOutcome

特定の認識結果

Highconfidence
Highconfidence boolean

結果として得られる最良の結果の認識は、信頼性の高い結果ですか ?

RunnerUpOutcome
RunnerUpOutcome RecognitionOutcome

特定の認識結果

成功
Successful boolean

イメージは正常に処理されましたか ?

ImageMetadata

イメージからのメタデータ

名前 パス 説明
BitDepth
BitDepth integer

ピクセルあたりのビット数

ColorSpace
ColorSpace string

イメージの色空間

ExifProfileName
ExifProfileName string

使用される EXIF プロファイルの名前

ExifValues
ExifValues array of ImageMetadataExifValue

イメージに埋め込まれた EXIF タグと値

FileFormat
FileFormat string

イメージのファイル形式

高さ
Height integer

イメージの高さ (ピクセル単位)

成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

Width integer

イメージの幅 (ピクセル単位)

ImageMetadataExifValue

EXIF タグと値

名前 パス 説明
データ型
DataType string

EXIF 値の日付タイプ

DataValue
DataValue string

EXIF 値の文字列としてフォーマットされた値

タグ
Tag string

EXIF 値のタグ名

NsfwResult

NSFW 分類の結果

名前 パス 説明
ClassificationOutcome
ClassificationOutcome string

結果を 4 つのカテゴリに分類します: SafeContent_HighProbability、UnsafeContent_HighProbability、RacyContent、SafeContent_ModerateProbability

スコア
Score double

0.0 から 1.0 の間のスコア。 0.0 から 0.2 のスコアは、安全なコンテンツの可能性が高いことを示し、スコア 0.8 から 1.0 は、安全でないコンテンツの可能性が高いことを示しています。 0.2 から 0.8 の間のコンテンツは、レーシネスが増加します。

成功
Successful boolean

分類が正常に実行された場合は true、それ以外の場合は false

ObjectDetectionResult

イメージ内のオブジェクトを検出した結果

名前 パス 説明
ObjectCount
ObjectCount integer

シーンで検出されたオブジェクトの数

オブジェクト
Objects array of DetectedObject

シーン内で検出されたオブジェクトの配列

成功
Successful boolean

イメージは正常に処理されましたか ?

PersonWithAge

イメージ年齢分類操作で特定された人物

名前 パス 説明
年齢
Age double
AgeClass
AgeClass string

年齢範囲の分類は年単位になります。可能な値は、「0-2」、「4-6」、「8-13」、「15-20」、「25-32」、「38-43」、「48-53」、「60+」です

AgeClassificationConfidence
AgeClassificationConfidence double

年齢分類の信頼水準。可能な値は 0.0 から 1.0 の間です。高ければ高いほどよく、値 >0.50 の場合は信頼性の高い結果になります

FaceLocation
FaceLocation Face

イメージ内の 1 つの顔の位置

PersonWithGender

イメージ性別分類操作で特定された人物

名前 パス 説明
FaceLocation
FaceLocation Face

イメージ内の 1 つの顔の位置

GenderClass
GenderClass string

その人の特定された性別。可能な値は「男性」、「女性」、「不明」です

GenderClassificationConfidence
GenderClassificationConfidence double

性別分類の信頼水準。可能な値は 0.0 から 1.0 の間です。高ければ高いほどよく、値 >0.50 の場合は信頼性の高い結果になります

RecognitionOutcome

特定の認識結果

名前 パス 説明
ConfidenceScore
ConfidenceScore double

1 に近いスコアは、0 に近いスコアよりも優れています

内容
Description string

イメージの英語による説明

TextDetectionResult

写真のテキストを検出する操作の結果

名前 パス 説明
成功
Successful boolean

操作が成功した場合は true、それ以外の場合は false

TextItems
TextItems array of TextItem

入力イメージで見つかったテキスト アイテム

TextItemsCount
TextItemsCount integer

入力イメージで見つかったテキストアイテムの数

TextItem

イメージに出現するテキストの個々のインスタンス。1 つのテキスト

名前 パス 説明
高さ
Height integer

テキスト アイテムのピクセル単位の高さ

LeftX
LeftX integer

テキスト位置の左 X 座標。0 は入力の左端を表す

TopY
TopY integer

テキストの位置の上端 Y 座標。0 は入力イメージの上端を表す

Width integer

テキスト アイテムのピクセル単位の幅

VehicleLicensePlateDetectionResult

イメージ内の車両のナンバー プレートを検出した結果

名前 パス 説明
DetectedLicensePlateCount
DetectedLicensePlateCount integer

イメージで検出されたナンバー プレートの数

DetectedLicensePlates
DetectedLicensePlates array of DetectedLicensePlate

イメージにあるナンバー プレート

成功
Successful boolean

イメージは正常に処理されましたか ?

binary

これは基本的なデータ型 'バイナリ' です。