他の特徴の検出

Vision API では、画像の中のさまざまな特徴を検出できます。

光学式文字認識ラベルについては、それぞれの該当ページで詳しく説明されています。

クロップヒント

クロップヒントのリクエストでは、画像内の主要な物体や顔を囲む境界ボックスの座標が返されます。それらの座標を使用し、主要な物体が主体となるように画像をトリミングできます。

クロップヒント機能のタイプは CROP_HINTS です。

詳しくは、以下のドキュメントをご覧ください。

顔検出は、画像内から複数の顔を検出し、重要な顔の特徴となる座標を提供します。また、感情の状態の予測(喜び、怒り、驚きなど)や、帽子が擦り切れているかどうかなども返されます。

顔検出機能のタイプは FACE_DETECTION です。

詳しくは、以下のドキュメントをご覧ください。

画像プロパティ

画像プロパティのリクエストでは、画像のドミナント カラー(RGB 値)と、総ピクセル数に対するパーセント値が返されます。

画像プロパティ機能のタイプは IMAGE_PROPERTIES です。

詳しくは、以下のドキュメントをご覧ください。

ランドマーク

ランドマークのリクエストは、よく知られている自然のランドマークや人工のランドマークを検出し、エンティティ ID(Google Knowledge Graph で利用可能)、ランドマークの名前と場所、および画像内でそのランドマークを囲む境界ボックスなどの識別情報を返します。

ランドマーク機能のタイプは LANDMARK_DETECTION です。

詳しくは、以下のドキュメントをご覧ください。

ロゴ

ロゴ検出のリクエストでは、画像に含まれる一般的な商品ロゴや企業ロゴが検出されます。レスポンスには、ロゴの名前、エンティティ ID(Google Knowledge Graph で利用可能)、および画像内でのロゴの位置を囲む境界ボックスが含まれています。

ロゴ検出機能のタイプは LOGO_DETECTION. です。

詳しくは、以下のドキュメントをご覧ください。

セーフサーチのリクエストは、画像を調べて、安全でない、また望ましくない可能性のある内容が含まれているかどうかを示します。画像は次の 4 つのカテゴリ別に評価され、可能性レベルが返されます。

  • adult は、裸、性的行為、ポルノ(漫画やアニメを含む)など、一般に 18 歳以上限定のコンテンツであることを示します。

  • spoof は、面白くしたり攻撃的なものにしたりするためにコンテンツがオリジナルから改変されていることを示します。

  • medical は、手術や MRI などのコンテンツを示します。

  • violent は、暴力的なコンテンツを示します。それには、血、戦争の画像、武器、怪我、自動車事故やその他のものが含まれます。

可能性レベルは、VERY_UNLIKELY から VERY_LIKELY までの 4 つのカテゴリに分類されます。

セーフサーチ機能のタイプは SAFE_SEARCH_DETECTION です。

詳しくは、以下のドキュメントをご覧ください。

ウェブ エンティティ

ウェブ エンティティのリクエストは、Google Knowledge Graph に関連して、画像のコンテンツについての情報を返します。また、画像と、ウェブ上にある他のページや画像との関係も返します。

レスポンスには、検出されたエンティティ ID(Google Knowledge Graph で参照可能)、指定した画像を含むウェブページ、完全一致または部分一致する画像の URL、視覚的に類似する画像の URL が含まれています。

ウェブ エンティティの機能タイプは WEB_DETECTION です。

詳しくは、以下のドキュメントをご覧ください。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Vision API ドキュメント