AnnotateImageResponse

对一个图片注释请求的响应。

JSON 表示法
{
  "faceAnnotations": [
    {
      object (FaceAnnotation)
    }
  ],
  "landmarkAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "logoAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "labelAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "localizedObjectAnnotations": [
    {
      object (LocalizedObjectAnnotation)
    }
  ],
  "textAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object (TextAnnotation)
  },
  "safeSearchAnnotation": {
    object (SafeSearchAnnotation)
  },
  "imagePropertiesAnnotation": {
    object (ImageProperties)
  },
  "cropHintsAnnotation": {
    object (CropHintsAnnotation)
  },
  "webDetection": {
    object (WebDetection)
  },
  "productSearchResults": {
    object (ProductSearchResults)
  },
  "error": {
    object (Status)
  },
  "context": {
    object (ImageAnnotationContext)
  }
}
字段
faceAnnotations[]

object (FaceAnnotation)

如果存在,则人脸检测已成功完成。

landmarkAnnotations[]

object (EntityAnnotation)

如果存在,则地标检测已成功完成。

logoAnnotations[]

object (EntityAnnotation)

如果存在,则徽标检测已成功完成。

labelAnnotations[]

object (EntityAnnotation)

如果存在,则标签检测已成功完成。

localizedObjectAnnotations[]

object (LocalizedObjectAnnotation)

如果存在,则本地化对象检测已成功完成。此值会按置信度分数降序排序。

textAnnotations[]

object (EntityAnnotation)

如果存在,则文本 (OCR) 检测已成功完成。

fullTextAnnotation

object (TextAnnotation)

如果存在,则文本 (OCR) 检测或文档 (OCR) 文本检测已成功完成。此注释提供 OCR 检测到的文本的结构性层次结构。

safeSearchAnnotation

object (SafeSearchAnnotation)

如果存在,则安全搜索注释已成功完成。

imagePropertiesAnnotation

object (ImageProperties)

如果存在,则已成功提取图片属性。

cropHintsAnnotation

object (CropHintsAnnotation)

如果存在,则剪裁提示已成功完成。

webDetection

object (WebDetection)

如果存在,则 Web 检测已成功完成。

productSearchResults

object (ProductSearchResults)

如果存在,则 Google 商品搜索已成功完成。

error

object (Status)

如果设置,则表示操作的错误消息。请注意,即便设置了 error,填充的图片注释也保证是正确的。

context

object (ImageAnnotationContext)

只要存在上下文信息,即可了解此图片的来源。

FaceAnnotation

包含人脸检测结果的人脸检测对象。

JSON 表示法
{
  "boundingPoly": {
    object (BoundingPoly)
  },
  "fdBoundingPoly": {
    object (BoundingPoly)
  },
  "landmarks": [
    {
      object (Landmark)
    }
  ],
  "rollAngle": number,
  "panAngle": number,
  "tiltAngle": number,
  "detectionConfidence": number,
  "landmarkingConfidence": number,
  "joyLikelihood": enum (Likelihood),
  "sorrowLikelihood": enum (Likelihood),
  "angerLikelihood": enum (Likelihood),
  "surpriseLikelihood": enum (Likelihood),
  "underExposedLikelihood": enum (Likelihood),
  "blurredLikelihood": enum (Likelihood),
  "headwearLikelihood": enum (Likelihood)
}
字段
boundingPoly

object (BoundingPoly)

脸部周围的边界多边形。边界框的坐标采用原始图片的比例。边界框是根据人的预期对脸部进行“框架”处理而计算出的。它以地标结果为依据。请注意,如果图片中只有局部脸部需要添加注释,则不得在 BoundingPoly 中生成一个或多个 x 和/或 y 坐标(系统将不会为多边形设置边界)。

fdBoundingPoly

object (BoundingPoly)

fdBoundingPoly 边界多边形比 boundingPoly 更严格,并且只包含人脸的皮肤部分。通常,它用于在可检测图片中可见的“皮肤面积”的任何图片分析中去除脸部。它并不基于地标结果,仅取决于初始人脸检测,因此

fd

(人脸检测)前缀。

landmarks[]

object (Landmark)

检测到的面部地标。

rollAngle

number

滚动角,表示人脸相对于垂直于脸部的轴的图片垂直面的顺时针/逆时针旋转量。介于 [-180,180] 范围内。

panAngle

number

偏转角,表示人脸相对于垂直于该图片的垂直平面向左/向右偏转的角度。介于 [-180,180] 范围内。

tiltAngle

number

俯仰角,表示人脸相对于图片的水平面向上/向下倾斜的角度。介于 [-180,180] 范围内。

detectionConfidence

number

检测可靠度。 介于 [0, 1] 范围内。

landmarkingConfidence

number

脸部标志可靠度。 介于 [0, 1] 范围内。

joyLikelihood

enum (Likelihood)

喜乐可能性。

sorrowLikelihood

enum (Likelihood)

悲伤可能性。

angerLikelihood

enum (Likelihood)

愤怒可能性。

surpriseLikelihood

enum (Likelihood)

惊喜可能性。

underExposedLikelihood

enum (Likelihood)

曝光不足的可能性。

blurredLikelihood

enum (Likelihood)

模糊可能性。

headwearLikelihood

enum (Likelihood)

头饰可能性。

地标

脸部特定的标志(例如,脸部特征)。

JSON 表示法
{
  "type": enum (Type),
  "position": {
    object (Position)
  }
}
字段
type

enum (Type)

脸部标志类型。

position

object (Position)

脸部标志位置。

类型

面部标志(特征)类型。左和右是根据图片观看者所在的位置定义的,而不考虑照片特有的镜像投影。因此,LEFT_EYE 通常是人的右眼。

枚举
UNKNOWN_LANDMARK 检测到的未知脸部标志。 不应填写。
LEFT_EYE 左眼。
RIGHT_EYE 右眼。
LEFT_OF_LEFT_EYEBROW 左眉毛左侧。
RIGHT_OF_LEFT_EYEBROW 左眉毛右侧。
LEFT_OF_RIGHT_EYEBROW 右眉毛左侧。
RIGHT_OF_RIGHT_EYEBROW 右眉毛右侧。
MIDPOINT_BETWEEN_EYES 两只眼睛的中点。
NOSE_TIP 鼻尖。
UPPER_LIP 上唇。
LOWER_LIP 下唇。
MOUTH_LEFT 嘴巴左侧。
MOUTH_RIGHT 嘴巴右侧。
MOUTH_CENTER 嘴巴中心。
NOSE_BOTTOM_RIGHT 鼻子右下角。
NOSE_BOTTOM_LEFT 鼻子,左下角。
NOSE_BOTTOM_CENTER 鼻子,底部中心。
LEFT_EYE_TOP_BOUNDARY 左眼,顶部边界。
LEFT_EYE_RIGHT_CORNER 左眼,右角。
LEFT_EYE_BOTTOM_BOUNDARY 左眼,底部边界。
LEFT_EYE_LEFT_CORNER 左眼,左角。
RIGHT_EYE_TOP_BOUNDARY 右眼,顶部边界。
RIGHT_EYE_RIGHT_CORNER 右眼,右角。
RIGHT_EYE_BOTTOM_BOUNDARY 右眼,底部边界。
RIGHT_EYE_LEFT_CORNER 右眼,左角。
LEFT_EYEBROW_UPPER_MIDPOINT 左眉毛,中部上方。
RIGHT_EYEBROW_UPPER_MIDPOINT 右眉毛,中部上方。
LEFT_EAR_TRAGION 左耳屏点。
RIGHT_EAR_TRAGION 右耳屏点。
LEFT_EYE_PUPIL 左眼瞳孔。
RIGHT_EYE_PUPIL 右眼瞳孔。
FOREHEAD_GLABELLA 前额眉间。
CHIN_GNATHION 下巴颔下点。
CHIN_LEFT_GONION 下巴左下颌点。
CHIN_RIGHT_GONION 下巴右下颌点。

位置

图片中的一个 3D 位置,主要用于人脸检测标志。一个有效的 Position 必须同时具有 x 坐标和 y 坐标。位置的坐标与原始图片采用相同的刻度。

JSON 表示法
{
  "x": number,
  "y": number,
  "z": number
}
字段
x

number

x 坐标。

y

number

y 坐标。

z

number

z 坐标(或深度)。

可能性

可能性的范围表示,旨在让客户在模型升级时获得高度稳定的结果。

枚举
UNKNOWN 未知可能性。
VERY_UNLIKELY 非常不可能。
UNLIKELY 不太可能。
POSSIBLE 可能。
LIKELY 很有可能。
VERY_LIKELY 非常有可能。

EntityAnnotation

所检测到的实体特征集。

JSON 表示法
{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object (BoundingPoly)
  },
  "locations": [
    {
      object (LocationInfo)
    }
  ],
  "properties": [
    {
      object (Property)
    }
  ]
}
字段
mid

string

不透明实体 ID。一些 ID 可以在 Google Knowledge Graph Search API 中找到。

locale

string

表示实体文本 description 的语言区域的语言代码。

description

string

实体文本说明,以 locale 语言表示。

score

number

结果的总分。介于 [0, 1] 范围内。

confidence
(deprecated)

number

已弃用。请改用 score图片中实体检测的准确性。例如,对于检测到“Eiffel Tower”实体的图片,此字段表示查询图片中有一个塔楼的置信度。介于 [0, 1] 范围内。

topicality

number

ICA(图片内容注释)标签与图片的相关性。例如,即使每个图片中都存在塔的置信度相同,“tower”与包含检测到的“Eiffel Tower”的图片的相关性也可能比包含检测到的遥远高层建筑图片的相关性更高。介于 [0, 1] 范围内。

boundingPoly

object (BoundingPoly)

此实体所属的图片区域。不针对 LABEL_DETECTION 功能生成。

locations[]

object (LocationInfo)

检测到的实体的位置信息。有可能存在多个 LocationInfo 元素,因为一个位置可能表示图片中的场景位置,而另一个位置可能表示图片的拍摄位置。地标通常存在位置信息。

properties[]

object (Property)

某些实体可能具有用户提供的可选 Property(名称/值)字段,例如符合实体要求的得分或字符串。

LocationInfo

检测到的实体位置信息。

JSON 表示法
{
  "latLng": {
    object (LatLng)
  }
}
字段
latLng

object (LatLng)

纬度/经度位置坐标。

属性

一个 Property 包含由用户提供的一个名称/值对。

JSON 表示法
{
  "name": string,
  "value": string,
  "uint64Value": string
}
字段
name

string

属性的名称。

value

string

属性的值。

uint64Value

string

数值属性的值。

LocalizedObjectAnnotation

在边界框内检测到的一组对象。

JSON 表示法
{
  "mid": string,
  "languageCode": string,
  "name": string,
  "score": number,
  "boundingPoly": {
    object (BoundingPoly)
  }
}
字段
mid

string

应与 EntityAnnotation mid 保持一致的对象 ID。

languageCode

string

BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier

name

string

对象名称,以 languageCode 语言表示。

score

number

结果的分数。介于 [0, 1] 范围内。

boundingPoly

object (BoundingPoly)

此对象所属的图片区域。必须填充此字段。

TextAnnotation

TextAnnotation 包含 OCR 提取的文本的结构化表示。OCR 提取的文本结构的层次结构如下:TextAnnotation -> 页面 -> 块 -> 段落 -> 字词 -> 符号。从“页面”开始,各结构组件均可进一步拥有其自己的属性。属性描述了所检测到的语言、中断符等。如需了解详情,请参阅下面的 TextAnnotation.TextProperty 消息定义。

JSON 表示法
{
  "pages": [
    {
      object (Page)
    }
  ],
  "text": string
}
字段
pages[]

object (Page)

OCR 检测到的页面列表。

text

string

页面上检测到 UTF-8 文本。

页面

通过 OCR 检测到的页面。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "width": number,
  "height": number,
  "blocks": [
    {
      object (Block)
    }
  ],
  "confidence": number
}
字段
property

object (TextProperty)

在页面上检测到的其他信息。

width

number

页面宽度。对于 PDF,其单位是点。对于图片(包括 TIFF),其单位是像素。

height

number

页面高度。对于 PDF,其单位是点。对于图片(包括 TIFF),其单位是像素。

blocks[]

object (Block)

此页面上的文本块、图片等列表。

confidence

number

页面上 OCR 结果的置信度。介于 [0, 1] 范围内。

TextProperty

在此结构化组件上检测到的其他信息。

JSON 表示法
{
  "detectedLanguages": [
    {
      object (DetectedLanguage)
    }
  ],
  "detectedBreak": {
    object (DetectedBreak)
  }
}
字段
detectedLanguages[]

object (DetectedLanguage)

检测到的语言及对应置信度的列表。

detectedBreak

object (DetectedBreak)

检测到的一个文本句段的开头或结尾。

DetectedLanguage

检测到的结构化组件的语言。

JSON 表示法
{
  "languageCode": string,
  "confidence": number
}
字段
languageCode

string

BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier

confidence

number

所检测到的语言的置信度。介于 [0, 1] 范围内。

DetectedBreak

检测到的结构化组件的开头或结尾。

JSON 表示法
{
  "type": enum (BreakType),
  "isPrefix": boolean
}
字段
type

enum (BreakType)

检测到的换行符类型。

isPrefix

boolean

如果换行符附加在元素前面,则为 true。

BreakType

指示所发现的中断符类型的枚举。包括换行符、空格等。

枚举
UNKNOWN 未知的换行符标签类型。
SPACE 普通空格。
SURE_SPACE 确定空间(非常宽)。
EOL_SURE_SPACE 换行符。
HYPHEN 文本中不存在的结束连字符;无法与 SPACELEADER_SPACELINE_BREAK 共存。
LINE_BREAK 用于终止段落的中断符。

阻止

页面上的逻辑元素。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "paragraphs": [
    {
      object (Paragraph)
    }
  ],
  "blockType": enum (BlockType),
  "confidence": number
}
字段
property

object (TextProperty)

针对块检测到的其他信息。

boundingBox

object (BoundingPoly)

块的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:

  • 文字在水平方向时可能如下所示:
    0----1
    |    |
    3----2
  • 围绕左上角旋转 180 度时,就会变为:
    2----3
    |    |
    1----0

且顶点顺序仍为 (0, 1, 2, 3)。

paragraphs[]

object (Paragraph)

此区块中的段落列表(如果此块为文本类型)。

blockType

enum (BlockType)

此块中检测到的块类型(文字、图片等)。

confidence

number

此块上 OCR 结果的置信度。介于 [0, 1] 范围内。

段落

按一定顺序展示多个字词的结构化文本单元。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "words": [
    {
      object (Word)
    }
  ],
  "confidence": number
}
字段
property

object (TextProperty)

为段落检测到的其他信息。

boundingBox

object (BoundingPoly)

段落的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。

words[]

object (Word)

此段落中的所有字词的列表。

confidence

number

段落的 OCR 结果置信度。介于 [0, 1] 范围内。

Word

字词表示法。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "symbols": [
    {
      object (Symbol)
    }
  ],
  "confidence": number
}
字段
property

object (TextProperty)

为字词检测到的其他信息。

boundingBox

object (BoundingPoly)

字词的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。

symbols[]

object (Symbol)

列出字词中的符号。符号的顺序与自然阅读顺序相同。

confidence

number

字词的 OCR 结果置信度。介于 [0, 1] 范围内。

符号

单个符号表示。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "text": string,
  "confidence": number
}
字段
property

object (TextProperty)

为符号检测到的其他信息。

boundingBox

object (BoundingPoly)

符号的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。

text

string

获取符号的实际 UTF-8 表示形式。

confidence

number

符号的 OCR 结果置信度。介于 [0, 1] 范围内。

BlockType

OCR 所标识的块类型(文字、图片等)。

枚举
UNKNOWN 未知的块类型。
TEXT 普通文本块。
TABLE 表格块。
PICTURE 图片块。
RULER 水平/垂直线框。
BARCODE 条形码块。

SafeSearchAnnotation

计算机视觉方法基于安全搜索类别(例如成人、欺骗、医疗、暴力)计算出的与图片有关的一组特征。

JSON 表示法
{
  "adult": enum (Likelihood),
  "spoof": enum (Likelihood),
  "medical": enum (Likelihood),
  "violence": enum (Likelihood),
  "racy": enum (Likelihood)
}
字段
adult

enum (Likelihood)

表示图片包含成人内容的概率。成人内容可能包含裸露、色情图片或漫画或性活动等元素。

spoof

enum (Likelihood)

包含欺骗性内容的概率。对图片的标准版本进行修改以使其变得有趣或令人反感的概率。

medical

enum (Likelihood)

此图片为医学影像的概率。

violence

enum (Likelihood)

此图片包含暴力内容的概率。

racy

enum (Likelihood)

请求的图片包含少儿不宜内容的概率。少儿不宜内容可能包括(但不限于)单薄或透明的服装、用策略手段遮住的裸体、猥亵或挑逗姿势,或者敏感身体部位的特写镜头。

ImageProperties

存储图片属性,例如主色。

JSON 表示法
{
  "dominantColors": {
    object (DominantColorsAnnotation)
  }
}
字段
dominantColors

object (DominantColorsAnnotation)

如果有,主色已成功完成。

DominantColorsAnnotation

一组主色及其对应的分数。

JSON 表示法
{
  "colors": [
    {
      object (ColorInfo)
    }
  ]
}
字段
colors[]

object (ColorInfo)

RGB 颜色值及其得分和像素分数。

ColorInfo

颜色信息,其中包含 RGB 通道、分数以及颜色在图片中所占的比例。

JSON 表示法
{
  "color": {
    object (Color)
  },
  "score": number,
  "pixelFraction": number
}
字段
color

object (Color)

颜色的 RGB 分量。

score

number

此颜色的图片特定分数。 值介于 [0, 1] 范围内。

pixelFraction

number

颜色在图片中占据的像素比例。 值介于 [0, 1] 范围内。

颜色

表示 RGBA 颜色空间中的一种颜色。此表示法旨在简化各种语言中颜色表示法之间的转换;例如,此表示法的字段可以简单地提供给 Java 中的“java.awt.Color”构造函数;它也可以简单地提供给 iOS 中的 UIColor 的“+colorWithRed:green:blue:alpha”方法;另外,只需做一点点工作,就可以轻松地将它的格式化转换为 JavaScript 中的CSS“rgba()”字符串。

注意:此 Proto 不包含应用于解释 RGB 值的绝对颜色空间(例如 sRGB、Adobe RGB、DCI-P3、BT.2020 等等)的相关信息。默认情况下,应用应采用 sRGB 颜色空间。

示例 (Java):

 import com.google.type.Color;

 // ...
 public static java.awt.Color fromProto(Color protocolor) {
   float alpha = protocolor.hasAlpha()
       ? protocolor.getAlpha().getValue()
       : 1.0;

   return new java.awt.Color(
       protocolor.getRed(),
       protocolor.getGreen(),
       protocolor.getBlue(),
       alpha);
 }

 public static Color toProto(java.awt.Color color) {
   float red = (float) color.getRed();
   float green = (float) color.getGreen();
   float blue = (float) color.getBlue();
   float denominator = 255.0;
   Color.Builder resultBuilder =
       Color
           .newBuilder()
           .setRed(red / denominator)
           .setGreen(green / denominator)
           .setBlue(blue / denominator);
   int alpha = color.getAlpha();
   if (alpha != 255) {
     result.setAlpha(
         FloatValue
             .newBuilder()
             .setValue(((float) alpha) / denominator)
             .build());
   }
   return resultBuilder.build();
 }
 // ...

示例 (iOS / Obj-C):

 // ...
 static UIColor* fromProto(Color* protocolor) {
    float red = [protocolor red];
    float green = [protocolor green];
    float blue = [protocolor blue];
    FloatValue* alpha_wrapper = [protocolor alpha];
    float alpha = 1.0;
    if (alpha_wrapper != nil) {
      alpha = [alpha_wrapper value];
    }
    return [UIColor colorWithRed:red green:green blue:blue alpha:alpha];
 }

 static Color* toProto(UIColor* color) {
     CGFloat red, green, blue, alpha;
     if (![color getRed:&red green:&green blue:&blue alpha:&alpha]) {
       return nil;
     }
     Color* result = [[Color alloc] init];
     [result setRed:red];
     [result setGreen:green];
     [result setBlue:blue];
     if (alpha <= 0.9999) {
       [result setAlpha:floatWrapperWithValue(alpha)];
     }
     [result autorelease];
     return result;
}
// ...

示例 (JavaScript):

// ...

var protoToCssColor = function(rgb_color) {
   var redFrac = rgb_color.red || 0.0;
   var greenFrac = rgb_color.green || 0.0;
   var blueFrac = rgb_color.blue || 0.0;
   var red = Math.floor(redFrac * 255);
   var green = Math.floor(greenFrac * 255);
   var blue = Math.floor(blueFrac * 255);

   if (!('alpha' in rgb_color)) {
      return rgbToCssColor_(red, green, blue);
   }

   var alphaFrac = rgb_color.alpha.value || 0.0;
   var rgbParams = [red, green, blue].join(',');
   return ['rgba(', rgbParams, ',', alphaFrac, ')'].join('');
};

var rgbToCssColor_ = function(red, green, blue) {
  var rgbNumber = new Number((red << 16) | (green << 8) | blue);
  var hexString = rgbNumber.toString(16);
  var missingZeros = 6 - hexString.length;
  var resultBuilder = ['#'];
  for (var i = 0; i < missingZeros; i++) {
     resultBuilder.push('0');
  }
  resultBuilder.push(hexString);
  return resultBuilder.join('');
};

// ...
JSON 表示法
{
  "red": number,
  "green": number,
  "blue": number,
  "alpha": number
}
字段
red

number

颜色中的红色量,以介于区间 [0, 1] 内的值表示。

green

number

颜色中的绿色量,以介于区间 [0, 1] 内的值表示。

blue

number

颜色中的蓝色量,以介于区间 [0, 1] 内的值表示。

alpha

number

此颜色在像素中的应用比例。也就是说,最终像素颜色由以下等式定义:

像素颜色 = alpha *(此颜色)+ (1.0 - alpha) *(背景颜色)

也就是说,值为 1.0 表示纯色,而值为 0.0 表示完全透明的颜色。它会使用封装容器消息,而非简单的浮动标量,以便区分默认值和未设置的值。如果省略此字段,此颜色对象将呈现为纯色(就像已明确给定 Alpha 值为 1.0)。

CropHintsAnnotation

一组剪裁提示,在传送图片时用于生成新的剪裁。

JSON 表示法
{
  "cropHints": [
    {
      object (CropHint)
    }
  ]
}
字段
cropHints[]

object (CropHint)

剪裁提示结果。

CropHint

单一剪裁提示,在传送图片时用于生成新的剪裁。

JSON 表示法
{
  "boundingPoly": {
    object (BoundingPoly)
  },
  "confidence": number,
  "importanceFraction": number
}
字段
boundingPoly

object (BoundingPoly)

剪裁区域的边界多边形。边界框的坐标采用原始图片的比例。

confidence

number

成为重要区域的置信度。介于 [0, 1] 范围内。

importanceFraction

number

此重要区域相对于原始图片的重要性比例。

WebDetection

互联网图片的相关信息。

JSON 表示法
{
  "webEntities": [
    {
      object (WebEntity)
    }
  ],
  "fullMatchingImages": [
    {
      object (WebImage)
    }
  ],
  "partialMatchingImages": [
    {
      object (WebImage)
    }
  ],
  "pagesWithMatchingImages": [
    {
      object (WebPage)
    }
  ],
  "visuallySimilarImages": [
    {
      object (WebImage)
    }
  ],
  "bestGuessLabels": [
    {
      object (WebLabel)
    }
  ]
}
字段
webEntities[]

object (WebEntity)

从相似的互联网图片中推导出的实体。

fullMatchingImages[]

object (WebImage)

与互联网完全匹配的图片。可包括查询图片的调整大小后的副本。

partialMatchingImages[]

object (WebImage)

与互联网局部匹配的图片。这些图片的相似度足够高,有一些与查询图片相同的关键特征。例如,原始图片与剪裁图片可能会部分匹配。

pagesWithMatchingImages[]

object (WebPage)

包含匹配的互联网图片的网页。

visuallySimilarImages[]

object (WebImage)

外观类似的图片结果。

bestGuessLabels[]

object (WebLabel)

该服务关于请求图片主题的最佳猜测。根据开放式 Web 上的类似图片推断得出。

WebEntity

从相似的互联网图片中推导出的实体。

JSON 表示法
{
  "entityId": string,
  "score": number,
  "description": string
}
字段
entityId

string

不透明实体 ID。

score

number

实体的总体相关度得分。不同图片查询之间的分数并非归一化分数,也不具有可比性。

description

string

实体的标准说明(采用英文)。

WebImage

在线图片的元数据。

JSON 表示法
{
  "url": string,
  "score": number
}
字段
url

string

结果图片网址。

score

number

(已弃用)图片的整体相关性分数。

WebPage

网页的元数据。

JSON 表示法
{
  "url": string,
  "score": number,
  "pageTitle": string,
  "fullMatchingImages": [
    {
      object (WebImage)
    }
  ],
  "partialMatchingImages": [
    {
      object (WebImage)
    }
  ]
}
字段
url

string

结果网页的网址。

score

number

(已弃用)网页的整体相关性得分。

pageTitle

string

网页的标题,可能包含 HTML 标记。

fullMatchingImages[]

object (WebImage)

与网页上的图片完全匹配。可包括查询图片的调整大小后的副本。

partialMatchingImages[]

object (WebImage)

与网页上的图片部分匹配。这些图片的相似度足够高,有一些与查询图片相同的关键特征。例如,原始图片与剪裁图片可能会部分匹配。

WebLabel

为网络检测提供额外元数据的标签。

JSON 表示法
{
  "label": string,
  "languageCode": string
}
字段
label

string

用于附加元数据的标签。

languageCode

string

label 的 BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier

ProductSearchResults

商品搜索请求的结果。

JSON 表示法
{
  "indexTime": string,
  "results": [
    {
      object (Result)
    }
  ],
  "productGroupedResults": [
    {
      object (GroupedResult)
    }
  ]
}
字段
indexTime

string (Timestamp format)

提供这些结果的索引的时间戳。在此时间之后添加到商品集的商品以及从商品集中移除的商品均不会反映在当前结果中。

此时间戳采用 RFC3339 世界协调时间 (UTC)(即“祖鲁时”)格式,且精确到纳秒。示例:"2014-10-02T15:01:23.045123456Z"

results[]

object (Result)

结果列表,每个结果对应每个商品匹配项。

productGroupedResults[]

object (GroupedResult)

在查询图片中检测到的依商品分组的结果列表。每个条目均对应于查询图片中的一个边界多边形,并包含特定于该区域的匹配商品。在每种商品的所有结果联合中,可能存在重复的商品匹配项。

结果

商品相关信息。

JSON 表示法
{
  "product": {
    object (Product)
  },
  "score": number,
  "image": string
}
字段
product

object (Product)

商品。

score

number

匹配项的置信度,范围从 0(零置信度)到 1(最高置信度)。

image

string

与查询最匹配的商品中的图片的资源名称。

GroupedResult

与查询图片中的单件商品类似的商品相关信息。

JSON 表示法
{
  "boundingPoly": {
    object (BoundingPoly)
  },
  "results": [
    {
      object (Result)
    }
  ],
  "objectAnnotations": [
    {
      object (ObjectAnnotation)
    }
  ]
}
字段
boundingPoly

object (BoundingPoly)

在查询图片中检测到的商品的边界多边形。

results[]

object (Result)

结果列表,每个结果对应每个商品匹配项。

objectAnnotations[]

object (ObjectAnnotation)

边界框中对象的常规预测列表。

ObjectAnnotation

边界框中对象的预测。

JSON 表示法
{
  "mid": string,
  "languageCode": string,
  "name": string,
  "score": number
}
字段
mid

string

应与 EntityAnnotation mid 保持一致的对象 ID。

languageCode

string

BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier

name

string

对象名称,以 languageCode 语言表示。

score

number

结果的分数。介于 [0, 1] 范围内。

ImageAnnotationContext

如果图片是通过文件(例如 PDF)生成的,则此消息将提供有关该图片来源的信息。

JSON 表示法
{
  "uri": string,
  "pageNumber": number
}
字段
uri

string

用于生成图片的文件的 URI。

pageNumber

number

如果文件是 PDF 或 TIFF,则此字段给出了用于生成图片的文件中的页码。