- JSON 表現
- FaceAnnotation
- Landmark
- タイプ
- Position
- Likelihood
- EntityAnnotation
- LocationInfo
- Property
- LocalizedObjectAnnotation
- TextAnnotation
- Page
- TextProperty
- DetectedLanguage
- DetectedBreak
- BreakType
- Block
- Paragraph
- Word
- Symbol
- BlockType
- SafeSearchAnnotation
- ImageProperties
- DominantColorsAnnotation
- ColorInfo
- CropHintsAnnotation
- CropHint
- WebDetection
- WebEntity
- WebImage
- WebPage
- WebLabel
- ProductSearchResults
- Result
- GroupedResult
- ImageAnnotationContext
画像アノテーション リクエストに対するレスポンス。
JSON 表現 | |
---|---|
{ "faceAnnotations": [ { object ( |
フィールド | |
---|---|
faceAnnotations[] |
存在する場合、顔検出が正常に完了しています。 |
landmarkAnnotations[] |
存在する場合、ランドマーク検出が正常に完了しています。 |
logoAnnotations[] |
存在する場合、ロゴ検出が正常に完了しています。 |
labelAnnotations[] |
存在する場合、ラベル検出が正常に完了しています。 |
localizedObjectAnnotations[] |
存在する場合、ローカライズされたオブジェクト検出が正常に完了しています。信頼スコアの降順で並べ替えられます。 |
textAnnotations[] |
存在する場合、テキスト(OCR)検出が正常に完了しています。 |
fullTextAnnotation |
存在する場合、テキスト(OCR)検出またはドキュメント(OCR)テキスト検出が正常に完了しています。このアノテーションは、OCR で検出されたテキストの構造的階層を提供します。 |
safeSearchAnnotation |
存在する場合、セーフサーチ アノテーションが正常に完了しています。 |
imagePropertiesAnnotation |
存在する場合、画像のプロパティが正常に抽出されています。 |
cropHintsAnnotation |
存在する場合、クロップヒントが正常に完了しています。 |
webDetection |
存在する場合、ウェブ検出が正常に完了しています。 |
productSearchResults |
存在する場合、Product Search は正常に完了しています。 |
error |
設定されている場合、オペレーションのエラー メッセージを表します。 |
context |
存在する場合は、この画像の取得元を特定するためにコンテキスト情報が必要になります。 |
FaceAnnotation
顔アノテーション オブジェクトには、顔検出の結果が含まれます。
JSON 表現 | |
---|---|
{ "boundingPoly": { object ( |
フィールド | |
---|---|
boundingPoly |
顔の輪郭の境界ポリゴン。境界ボックスの座標は元の画像のスケールで示されます。人間のと考えられる顔を「囲む」ため、境界ボックスが計算されます。これは、ランドマーカーの結果に基づいています。アノテーションが付けられる画像に顔の一部だけが表示される場合には、 |
fdBoundingPoly |
(顔検出)接頭辞が使用されます。 |
landmarks[] |
検出された顔ランドマーク。 |
rollAngle |
ロール角。これは、画像の垂直方向を基準に、顔の垂直軸が時計回り / 反時計回りで回転する量を示します。範囲は [-180,180] です。 |
panAngle |
ヨー角。これは、画像の真正面方向を基準に、顔の真正面が向いている角度(左方向 / 右方向)を示します。範囲は [-180,180] です。 |
tiltAngle |
ピッチ角。これは、画像の水平方向を基準に、顔が向いている上方向 / 下方向の角度を示します。範囲は [-180,180] です。 |
detectionConfidence |
検出の信頼度。範囲は [0, 1] です。 |
landmarkingConfidence |
顔のランドマークの信頼度。範囲は [0, 1] です。 |
joyLikelihood |
喜んでいる可能性。 |
sorrowLikelihood |
悲しんでいる可能性。 |
angerLikelihood |
怒っている可能性。 |
surpriseLikelihood |
驚いている可能性。 |
underExposedLikelihood |
露出不足の可能性。 |
blurredLikelihood |
ピントが合っていない可能性。 |
headwearLikelihood |
ヘッドウェアを着けている可能性。 |
ランドマーク
顔特有のランドマーク(顔の特徴など)。
JSON 表現 | |
---|---|
{ "type": enum ( |
フィールド | |
---|---|
type |
顔のランドマークのタイプ。 |
position |
顔のランドマークの位置。 |
型
顔のランドマーク(特徴)のタイプ。左と右は、写真の一般的な鏡像投影を考慮せず、画像を見るユーザーの視点から定義されています。したがって LEFT_EYE
は通常、人物の右目です。
列挙型 | |
---|---|
UNKNOWN_LANDMARK |
検出された不明な顔のランドマーク。何も入力されていないはずです。 |
LEFT_EYE |
左目。 |
RIGHT_EYE |
右目。 |
LEFT_OF_LEFT_EYEBROW |
左眉毛の左。 |
RIGHT_OF_LEFT_EYEBROW |
左眉毛の右。 |
LEFT_OF_RIGHT_EYEBROW |
右眉毛の左。 |
RIGHT_OF_RIGHT_EYEBROW |
右眉毛の右。 |
MIDPOINT_BETWEEN_EYES |
目の間の中間点。 |
NOSE_TIP |
鼻の先端。 |
UPPER_LIP |
上唇。 |
LOWER_LIP |
下唇。 |
MOUTH_LEFT |
口の左側。 |
MOUTH_RIGHT |
口の右側。 |
MOUTH_CENTER |
口の中心。 |
NOSE_BOTTOM_RIGHT |
鼻、右下。 |
NOSE_BOTTOM_LEFT |
鼻、左下。 |
NOSE_BOTTOM_CENTER |
鼻、下中点。 |
LEFT_EYE_TOP_BOUNDARY |
左目、上部境界。 |
LEFT_EYE_RIGHT_CORNER |
左目、右隅。 |
LEFT_EYE_BOTTOM_BOUNDARY |
左目、下部境界。 |
LEFT_EYE_LEFT_CORNER |
左目、左隅。 |
RIGHT_EYE_TOP_BOUNDARY |
右目、上部境界。 |
RIGHT_EYE_RIGHT_CORNER |
右目、右隅。 |
RIGHT_EYE_BOTTOM_BOUNDARY |
右目、下部境界。 |
RIGHT_EYE_LEFT_CORNER |
右目、左隅。 |
LEFT_EYEBROW_UPPER_MIDPOINT |
左眉、上中点。 |
RIGHT_EYEBROW_UPPER_MIDPOINT |
右眉、上中点。 |
LEFT_EAR_TRAGION |
左耳の耳珠点。 |
RIGHT_EAR_TRAGION |
右耳の耳珠点。 |
LEFT_EYE_PUPIL |
左目の瞳孔。 |
RIGHT_EYE_PUPIL |
右目の瞳孔。 |
FOREHEAD_GLABELLA |
額の眉間点。 |
CHIN_GNATHION |
顎のオトガイ点。 |
CHIN_LEFT_GONION |
顎の左オトガイ点。 |
CHIN_RIGHT_GONION |
顎の右オトガイ点。 |
Position
画像で、主に顔検出ランドマークに使用される 3D 位置。有効な Position には、x 座標と y 座標の両方が指定されているはずです。位置の座標は元の画像と同じスケールです。
JSON 表現 | |
---|---|
{ "x": number, "y": number, "z": number } |
フィールド | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
z |
Z 座標(または深さ)。 |
Likelihood
バケット化された可能性の表現。これは、モデルのアップグレードで非常に安定した結果をクライアントに提供することを目的としています。
列挙型 | |
---|---|
UNKNOWN |
不明な可能性。 |
VERY_UNLIKELY |
指定されたカテゴリに画像が属している可能性はほとんどありません。 |
UNLIKELY |
指定されたカテゴリに画像が属している可能性は低いです。 |
POSSIBLE |
指定されたカテゴリに画像が属している可能性があります。 |
LIKELY |
指定されたカテゴリに画像が属している可能性は高いです。 |
VERY_LIKELY |
指定されたカテゴリに画像が属している可能性は非常に高いです。 |
EntityAnnotation
検出されたエンティティの特徴のセット。
JSON 表現 | |
---|---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
フィールド | |
---|---|
mid |
不透明エンティティの ID。一部の ID は Google Knowledge Graph Search API で使用できます。 |
locale |
エンティティ テキスト |
description |
エンティティ テキストの説明。 |
score |
結果の全体的なスコア。範囲は [0, 1] です。 |
confidence |
サポートを終了しました。代わりに |
topicality |
画像に対する ICA(Image Content Annotation)ラベルの関連度。たとえば、「Eiffel Tower」が検出された画像と遠方にある塔(Tower)が検出された画像の場合、塔があることの信頼度が同一であっても、「Tower」の関連度は「Eiffel Tower」が検出された画像の方が高くなります。範囲は [0, 1] です。 |
boundingPoly |
このエンティティが属する画像領域。 |
locations[] |
検出されたエンティティの位置情報。複数の |
properties[] |
エンティティの中には、エンティティを修飾するスコアや文字列など、オプションのユーザー指定 |
LocationInfo
検出されたエンティティの位置情報。
JSON 表現 | |
---|---|
{
"latLng": {
object ( |
フィールド | |
---|---|
latLng |
緯度 / 経度での位置座標。 |
プロパティ
Property
は、ユーザー指定の名前と値のペアで構成されます。
JSON 表現 | |
---|---|
{ "name": string, "value": string, "uint64Value": string } |
フィールド | |
---|---|
name |
プロパティの名前。 |
value |
プロパティの値。 |
uint64Value |
数値プロパティの値。 |
LocalizedObjectAnnotation
検出された境界ボックス付きオブジェクトのセット。
JSON 表現 | |
---|---|
{
"mid": string,
"languageCode": string,
"name": string,
"score": number,
"boundingPoly": {
object ( |
フィールド | |
---|---|
mid |
EntityAnnotation mid と一致するオブジェクト ID。 |
languageCode |
「en-US」や「sr-Latn」などの BCP-47 言語コード。詳細については、http://www.unicode.org/reports/tr35/#Unicode_locale_identifier をご覧ください。 |
name |
オブジェクト名。 |
score |
結果のスコア。範囲は [0, 1] です。 |
boundingPoly |
このオブジェクトが属する画像領域。この値は入力する必要があります。 |
TextAnnotation
TextAnnotation には、OCR 抽出テキストの構造化表現が含まれています。OCR 抽出テキスト構造の階層は、TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol のようになります。Page 以降の各構造コンポーネントには独自のプロパティが設定されていることがあります。プロパティは、検出された言語、区切りなどを記述します。詳しくは、以下の TextAnnotation.TextProperty
メッセージの定義をご覧ください。
JSON 表現 | |
---|---|
{
"pages": [
{
object ( |
フィールド | |
---|---|
pages[] |
OCR によって検出されたページのリスト。 |
text |
ページで検出された UTF-8 テキスト。 |
ページ
OCR から検出されたページ。
JSON 表現 | |
---|---|
{ "property": { object ( |
フィールド | |
---|---|
property |
ページで検出された追加情報。 |
width |
ページの幅。PDF の場合、単位はポイントです。画像(TIFF を含む)の場合、単位はピクセルです。 |
height |
ページの高さ。PDF の場合、単位はポイントです。画像(TIFF を含む)の場合、単位はピクセルです。 |
blocks[] |
このページのテキスト、画像などのブロックのリスト。 |
confidence |
ページの OCR 結果の信頼度。範囲は [0, 1] です。 |
TextProperty
構造コンポーネントで検出された追加情報。
JSON 表現 | |
---|---|
{ "detectedLanguages": [ { object ( |
フィールド | |
---|---|
detectedLanguages[] |
検出された言語と信頼度のリスト。 |
detectedBreak |
検出されたテキスト セグメントの開始または終了。 |
DetectedLanguage
検出された構造コンポーネントの言語。
JSON 表現 | |
---|---|
{ "languageCode": string, "confidence": number } |
フィールド | |
---|---|
languageCode |
「en-US」や「sr-Latn」などの BCP-47 言語コード。詳細については、http://www.unicode.org/reports/tr35/#Unicode_locale_identifier をご覧ください。 |
confidence |
検出された言語の信頼度。範囲は [0, 1] です。 |
DetectedBreak
検出された構造コンポーネントの開始または終了。
JSON 表現 | |
---|---|
{
"type": enum ( |
フィールド | |
---|---|
type |
検出された区切りのタイプ。 |
isPrefix |
区切りが要素の前にある場合は True。 |
BreakType
検出された区切りのタイプを示す列挙型。改行、スペースなどです。
列挙型 | |
---|---|
UNKNOWN |
不明な区切りラベルタイプ。 |
SPACE |
標準スペース。 |
SURE_SPACE |
広幅のスペース。 |
EOL_SURE_SPACE |
行折り返しの区切り。 |
HYPHEN |
テキストに存在しない行末ハイフン。SPACE 、LEADER_SPACE 、LINE_BREAK と組み合わせて出現することはありません。 |
LINE_BREAK |
段落を終了する改行。 |
ブロック
ページ上の論理的な要素。
JSON 表現 | |
---|---|
{ "property": { object ( |
フィールド | |
---|---|
property |
ブロックについて検出された追加情報。 |
boundingBox |
ブロックの境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例:
頂点の順序は (0, 1, 2, 3) のままです。 |
paragraphs[] |
このブロック内の段落のリスト(このブロックのタイプがテキストの場合)。 |
blockType |
このブロックの検出されたブロックタイプ(テキスト、イメージなど)。 |
confidence |
このブロックの OCR 実行結果の信頼性。範囲は [0, 1] です。 |
段落
多数の単語を特定の順序で示すテキストの構造単位。
JSON 表現 | |
---|---|
{ "property": { object ( |
フィールド | |
---|---|
property |
段落について検出された追加情報。 |
boundingBox |
段落の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
words[] |
この段落の単語のリスト。 |
confidence |
この段落の OCR 結果の信頼度。範囲は [0, 1] です。 |
Word
単語の表現。
JSON 表現 | |
---|---|
{ "property": { object ( |
フィールド | |
---|---|
property |
単語について検出された追加情報。 |
boundingBox |
単語の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
symbols[] |
単語内の記号のリスト。記号の順序は、自然な読み順に従います。 |
confidence |
単語に対する OCR 結果の信頼度。範囲は [0, 1] です。 |
記号
1 つの記号表現。
JSON 表現 | |
---|---|
{ "property": { object ( |
フィールド | |
---|---|
property |
記号について検出された追加情報。 |
boundingBox |
記号の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
text |
記号の実際の UTF-8 表現。 |
confidence |
記号の OCR 結果の信頼度。範囲は [0, 1] です。 |
BlockType
OCR で特定されたブロックのタイプ(テキスト、画像など)。
列挙型 | |
---|---|
UNKNOWN |
不明なブロックタイプ。 |
TEXT |
標準テキスト ブロック。 |
TABLE |
テーブル ブロック。 |
PICTURE |
画像ブロック。 |
RULER |
水平線 / 垂直線ボックス。 |
BARCODE |
バーコード ブロック。 |
SafeSearchAnnotation
画像の特徴のセット。これらの特徴は、セーフサーチ カテゴリ(アダルト、パロディ、医療、暴力など)に関してコンピュータ ビジョン メソッドにより計算されます。
JSON 表現 | |
---|---|
{ "adult": enum ( |
フィールド | |
---|---|
adult |
画像がアダルト コンテンツである可能性を表します。アダルト コンテンツには、ヌード、ポルノ画像や漫画、性行為などの要素が含まれている可能性があります。 |
spoof |
パロディの可能性。これは、面白くするため、または侮辱的にするため、正規の画像が改ざんされた可能性です。 |
medical |
医療画像である可能性。 |
violence |
この画像に暴力的なコンテンツが含まれている可能性。 |
racy |
リクエスト画像に露骨なコンテンツが含まれている可能性。露骨な内容には、露出度の高い服や薄手の服、意図的に一部が覆われたヌード、猥褻または挑発的なポーズ、または局部のクローズアップなどがあります。 |
ImageProperties
ドミナント カラーなどの画像プロパティを格納します。
JSON 表現 | |
---|---|
{
"dominantColors": {
object ( |
フィールド | |
---|---|
dominantColors |
存在する場合、ドミナント カラーが正常に完了しました。 |
DominantColorsAnnotation
ドミナント カラーとその対応するスコアのセット。
JSON 表現 | |
---|---|
{
"colors": [
{
object ( |
フィールド | |
---|---|
colors[] |
RGB カラーの値とそのスコアおよびピクセルの割合。 |
ColorInfo
カラー情報は、RGB チャネル、スコア、画像内でその色が占有する割合で構成されます。
JSON 表現 | |
---|---|
{
"color": {
object ( |
フィールド | |
---|---|
color |
色の RGB 構成要素。 |
score |
この色の画像固有のスコア。値の範囲は [0, 1] です。 |
pixelFraction |
画像でその色が占有するピクセルの割合。値の範囲は [0, 1] です。 |
CropHintsAnnotation
画像を処理するときに新しいクロップを生成するために使用されるクロップヒントのセット。
JSON 表現 | |
---|---|
{
"cropHints": [
{
object ( |
フィールド | |
---|---|
cropHints[] |
クロップヒントの結果。 |
CropHint
画像を処理するときに新しいクロップを生成するために使用される 1 つのクロップヒント。
JSON 表現 | |
---|---|
{
"boundingPoly": {
object ( |
フィールド | |
---|---|
boundingPoly |
クロップ領域の境界ポリゴン。境界ボックスの座標は元の画像のスケールで示されます。 |
confidence |
注目領域であることの信頼度。範囲は [0, 1] です。 |
importanceFraction |
元の画像を基準にしたこの注目領域の重要度の割合。 |
WebDetection
インターネットからの画像に関する関連情報。
JSON 表現 | |
---|---|
{ "webEntities": [ { object ( |
フィールド | |
---|---|
webEntities[] |
インターネット上の類似画像から推測されたエンティティ。 |
fullMatchingImages[] |
完全に一致するインターネット上の画像。クエリ画像のサイズを変更したコピーも含まれます。 |
partialMatchingImages[] |
部分的に一致するインターネットの画像。これらの画像は十分に類似しており、いくつかの主要な特徴を共有しています。たとえば、元の画像とそのクロップした画像とは部分一致する可能性があります。 |
pagesWithMatchingImages[] |
一致するインターネットの画像を含むウェブページ。 |
visuallySimilarImages[] |
視覚的に類似した画像結果。 |
bestGuessLabels[] |
サービスが、リクエスト画像のトピックに最も近いとする推測です。オープンウェブ上の類似画像から推定されます。 |
WebEntity
インターネット上の類似画像から推測されたエンティティ。
JSON 表現 | |
---|---|
{ "entityId": string, "score": number, "description": string } |
フィールド | |
---|---|
entityId |
不透明エンティティ ID。 |
score |
エンティティの全体的な関連性スコア。正規化されておらず、異なる画像クエリ間で比較することはできません。 |
description |
エンティティの標準的な説明(英語)。 |
WebImage
オンライン画像のメタデータ。
JSON 表現 | |
---|---|
{ "url": string, "score": number } |
フィールド | |
---|---|
url |
結果画像の URL。 |
score |
(非推奨)画像の全体的な関連性スコア。 |
WebPage
ウェブページのメタデータ。
JSON 表現 | |
---|---|
{ "url": string, "score": number, "pageTitle": string, "fullMatchingImages": [ { object ( |
フィールド | |
---|---|
url |
結果のウェブページの URL。 |
score |
(非推奨)ウェブページの全体的な関連性スコア。 |
pageTitle |
ウェブページのタイトル。HTML マークアップが含まれていることがあります。 |
fullMatchingImages[] |
ページ上の完全一致画像。クエリ画像のサイズを変更したコピーも含まれます。 |
partialMatchingImages[] |
ページ上の部分一致画像。これらの画像は十分に類似しており、いくつかの主要な特徴を共有しています。たとえば、元の画像とそのクロップした画像とは部分一致する可能性があります。 |
WebLabel
ウェブ検出のための追加メタデータを提供するラベル。
JSON 表現 | |
---|---|
{ "label": string, "languageCode": string } |
フィールド | |
---|---|
label |
追加メタデータのラベル。 |
languageCode |
「en-US」や「sr-Latn」などの |
ProductSearchResults
Product Search リクエストの結果。
JSON 表現 | |
---|---|
{ "indexTime": string, "results": [ { object ( |
フィールド | |
---|---|
indexTime |
これらの結果を生成したインデックスのタイムスタンプ。商品セットに追加された商品と、この期間の後に商品セットから削除された商品は、現在の結果に反映されません。 RFC3339 UTC「Zulu」形式のタイムスタンプ。精度はナノ秒。例: |
results[] |
一致する商品の結果リスト(商品ごとに 1 つ)。 |
productGroupedResults[] |
クエリ画像で検出された商品別にグループ化された結果のリスト。各エントリはクエリ画像内の 1 つの境界ポリゴンに対応し、その領域に固有の一致商品が含まれます。商品ごとのすべての検索結果では、重複した商品が存在する可能性があります。 |
結果
商品に関する情報。
JSON 表現 | |
---|---|
{
"product": {
object ( |
フィールド | |
---|---|
product |
Product。 |
score |
一致の信頼度レベル。0(最低の信頼度)から 1(最高の信頼度)の範囲になります。 |
image |
クエリに最も一致する商品の画像のリソース名。 |
GroupedResult
クエリ画像に含まれる 1 つの商品に類似する商品に関する情報。
JSON 表現 | |
---|---|
{ "boundingPoly": { object ( |
フィールド | |
---|---|
boundingPoly |
クエリ画像で検出された商品を囲む境界ポリゴン。 |
results[] |
一致する商品の結果リスト(商品ごとに 1 つ)。 |
ImageAnnotationContext
ファイルから(PDF など)画像が生成された場合は、このメッセージに画像のソースに関する情報が表示されます。
JSON 表現 | |
---|---|
{ "uri": string, "pageNumber": number } |
フィールド | |
---|---|
uri |
画像の生成に使用されるファイルの URI。 |
pageNumber |
ファイルが PDF または TIFF の場合、このフィールドには、画像の生成に使用されたファイル内のページ番号が示されます。 |