検索のレスポンスとマルチ検出について

Vision API Product Search では、検索画像内にある単一の商品を検出し、それに対応する商品を示すことができます。また、画像内に複数の商品が存在する場合は、それらを特定して対応する商品のリストを取得することもできます。

単一の商品の画像とレスポンス

この検索画像には単一の商品が含まれています。

Cloud Storage バケットの洋服画像
gs://cloud-ai-vision-data/product-search-tutorial/images/468f782e70ba11e8941fd20059124800.jpg

Vision API Product Search を使用して類似商品を検索すると、画像内の 2 つの境界ボックス(一つは商品を囲むボックス、もう一つは画像全体を囲むボックス)を示すレスポンスが返されます。

レスポンス全体を見るには、下のセクションを開いてください。

境界ボックスと対応する商品

リクエストに対して返された 2 組の頂点によって、画像内で次の 2 つの商品(境界ボックス)が指定されています。

Vision API Product Search で識別されたボックスごとに、対応する商品のリストが返されます。

Cloud Storage バケットの洋服 3 着の画像
gs://cloud-samples-data/product_search/multiple_dresses.jpg

API のレスポンスでは、一致する商品の結果と境界ボックスは productGroupedResults フィールドに一覧表示されます。それらは、画像内で検出された商品ごとにグループ化されます。それぞれの boundingPoly エントリには、正規化された頂点(0 から 1 のスケールであり、画像の実際のピクセル値には対応していません)によって指定されたリージョンのリストが含まれます。その特定の領域に対応する商品のリストが返されます。

レスポンスの次のセクションは、洋服を囲んだ境界ボックスに対応しています。

results フィールドの後に対応する商品のリストが返され、一致スコアの降順でランク付けされます。スコアの範囲は 0(最低の信頼度)から 1(最高の信頼度)です。

5 件の対応商品の画像
Several matching products for the dress

レスポンスで返されるもう一方の boundingPoly は画像全体を囲んでいます。その正規化された頂点は次のように示されます。

  • [{},{"x": 1},{"x": 1,"y": 1},{"y": 1}]

座標値が 0 の場合、省略されます。したがって、上で指定された境界ポリゴンは次の座標に対応します。

  • [{"x": 0,"y": 0},{"x": 1, "y": 0},{"x": 1,"y": 1},{"y": 1}]

続いて、この境界ボックス(画像全体)に対応する商品のリストが同様に返されます。

複数商品の画像(マルチ検出)とレスポンス

次の検索画像には複数の商品が含まれています。

Cloud Storage バケットの洋服 3 着の画像
gs://cloud-samples-data/product_search/multiple_dresses.jpg

Vision API Product Search を使用して類似商品を検索すると、画像内の複数の境界ボックス(1 つは画像全体、残り 3 つは 3 着の洋服それぞれを囲むボックス)を示すレスポンスが返されます。

レスポンス全体を見るには、下のセクションを開いてください。

境界ボックスと対応する商品

次の画像には、この複数商品の画像内で Vision API Product Search によって識別されたすべての境界ボックスが示されています。

Cloud Storage バケットの洋服 3 着の画像
gs://cloud-samples-data/product_search/multiple_dresses.jpg

単一商品の画像と同様に、複数商品の画像のレスポンスでは、境界ボックスとそれに対応する商品の結果のリストが productGroupedResults フィールドに返されます。それぞれの商品は境界ポリゴンで識別され、対応する商品は検出された商品ごとにグループ化されます。

レスポンスの次のセクションは、中央の洋服を囲む境界ボックスに対応しています。

次の画像は、Vision API Product Search によって返された中央の洋服に対応するいくつかの商品を示したものです。

5 件の対応商品の画像
Several matching products for the middle dress

画像内には他にも次の境界ボックスがあります。それぞれに対応する商品のリストも返されます(ここには含まれていません)。

  • 左のドレス: {"x":0.03, "y":0.07},{"x":0.29, "y":0.07},{"x":0.29, "y":0.95},{"x":0.03, "y":0.95}
  • 右のドレス: {"x":0.63, "y":0.09},{"x":0.89, "y":0.09},{"x":0.89, "y":0.93},{"x":0.63, "y":0.93}
  • 画像全体:
    • {},{"x": 1},{"x": 1,"y": 1},{"y": 1}、また次のようにも表されます。
    • {"x": 0, "y": 0},{"x": 1,"y:0"},{"x": 1,"y": 1},{"x": 0,"y": 1}