Method: images.annotate

HTTP 请求
请求正文
- JSON 表示法
响应正文
- JSON 表示法
授权范围
AnnotateImageRequest
- JSON 表示法
图片
- JSON 表示法
ImageSource
- JSON 表示法
AnnotateImageResponse
- JSON 表示法
FaceAnnotation
- JSON 表示法
地标
- JSON 表示法
类型
位置
- JSON 表示法
可能性
EntityAnnotation
- JSON 表示法
LocationInfo
- JSON 表示法
属性
- JSON 表示法
LocalizedObjectAnnotation
- JSON 表示法
TextAnnotation
- JSON 表示法
页面
- JSON 表示法
TextProperty
- JSON 表示法
DetectedLanguage
- JSON 表示法
DetectedBreak
- JSON 表示法
BreakType
块
- JSON 表示法
段落
- JSON 表示法
字词
- JSON 表示法
符号
- JSON 表示法
BlockType
SafeSearchAnnotation
- JSON 表示法
ImageProperties
- JSON 表示法
DominantColorsAnnotation
- JSON 表示法
ColorInfo
- JSON 表示法
CropHintsAnnotation
- JSON 表示法
CropHint
- JSON 表示法
WebDetection
- JSON 表示法
WebEntity
- JSON 表示法
WebImage
- JSON 表示法
WebPage
- JSON 表示法
WebLabel
- JSON 表示法
ProductSearchResults
- JSON 表示法
结果
- JSON 表示法
GroupedResult
- JSON 表示法
ImageAnnotationContext
- JSON 表示法

对一批图片运行图片检测和注释。

HTTP 请求

POST https://vision.googleapis.com/v1p3beta1/images:annotate

网址采用 gRPC 转码语法。

请求正文

请求正文中包含结构如下的数据：

JSON 表示法
{ "requests": [ { object(`AnnotateImageRequest`) } ] }

字段

字段
`requests[]`	`object(AnnotateImageRequest)` 此批次的各个图片注释请求。

requests[]

object(AnnotateImageRequest)

此批次的各个图片注释请求。

响应正文

如果成功，响应正文将包含结构如下的数据：

对一个批量图片注释请求的响应。

JSON 表示法
{ "responses": [ { object(`AnnotateImageResponse`) } ] }

字段

字段
`responses[]`	`object(AnnotateImageResponse)` 对批处理中图片注释请求的各个响应。

responses[]

object(AnnotateImageResponse)

对批处理中图片注释请求的各个响应。

授权范围

需要以下 OAuth 范围之一：

https://www.googleapis.com/auth/cloud-platform
https://www.googleapis.com/auth/cloud-vision

如需了解详情，请参阅身份验证概览。

AnnotateImageRequest

请求对用户提供的图片执行 Google Cloud Vision API 任务，并提供用户请求的特征。

JSON 表示法
{ "image": { object(`Image`) }, "features": [ { object(`Feature`) } ], "imageContext": { object(`ImageContext`) } }

字段

字段
`image`	`object(Image)` 要处理的图片。
`features[]`	`object(Feature)` 请求的功能。
`imageContext`	`object(ImageContext)` 图片可能随附的相关信息。

image

object(Image)

要处理的图片。

features[]

object(Feature)

请求的功能。

imageContext

object(ImageContext)

图片可能随附的相关信息。

图片

用于执行 Google Cloud Vision API 任务的客户端图片。

JSON 表示法
{ "content": string, "source": { object(`ImageSource`) } }

字段

字段
`content`	`string (bytes format)` 图片内容，由字节流表示。注意：与所有 `bytes` 字段一样，协议缓冲区使用纯二进制表示法，而 JSON 表示法使用 Base64。使用 base64 编码的字符串。
`source`	`object(ImageSource)` Google Cloud Storage 图片位置或可公开访问的图片网址。如果为图片提供了 `content` 和 `source`，则 `content` 优先，且用于执行图片注释请求。

content

string (bytes format)

图片内容，由字节流表示。注意：与所有 bytes 字段一样，协议缓冲区使用纯二进制表示法，而 JSON 表示法使用 Base64。

使用 base64 编码的字符串。

source

object(ImageSource)

Google Cloud Storage 图片位置或可公开访问的图片网址。如果为图片提供了 content 和 source，则 content 优先，且用于执行图片注释请求。

ImageSource

外来图片来源（Google Cloud Storage 或网址图片位置）。

JSON 表示法
{ "gcsImageUri": string, "imageUri": string }

字段

字段
`gcsImageUri`	`string` 请改用 `imageUri`。格式为 `gs://bucket_name/object_name` 的 Google Cloud Storage URI。不支持对象版本控制。如需了解详情，请参阅 Google Cloud Storage 请求 URI。
`imageUri`	`string` 源图片的 URI。这可以是以下任意一项：格式为 `gs://bucket_name/object_name` 的 Google Cloud Storage URI。不支持对象版本控制。如需了解详情，请参阅 Google Cloud Storage 请求 URI。可公开访问的图片 HTTP/HTTPS 网址。从 HTTP/HTTPS 网址中提取图片时，Google 无法保证请求将会完成。如果指定的主机拒绝请求（例如，由于请求限制或 DOS 攻击防范），或者如果 Google 为了防止滥用而限制对网站的请求，则您的请求可能会失败。对于生产应用，您不应依赖外部托管的图片。如果同时指定了 `gcsImageUri` 和 `imageUri`，则以 `imageUri` 为准。

gcsImageUri

string

请改用 imageUri。

格式为 gs://bucket_name/object_name 的 Google Cloud Storage URI。不支持对象版本控制。如需了解详情，请参阅 Google Cloud Storage 请求 URI。

imageUri

string

源图片的 URI。这可以是以下任意一项：

格式为 gs://bucket_name/object_name 的 Google Cloud Storage URI。不支持对象版本控制。如需了解详情，请参阅 Google Cloud Storage 请求 URI。
可公开访问的图片 HTTP/HTTPS 网址。从 HTTP/HTTPS 网址中提取图片时，Google 无法保证请求将会完成。如果指定的主机拒绝请求（例如，由于请求限制或 DOS 攻击防范），或者如果 Google 为了防止滥用而限制对网站的请求，则您的请求可能会失败。对于生产应用，您不应依赖外部托管的图片。

如果同时指定了 gcsImageUri 和 imageUri，则以 imageUri 为准。

AnnotateImageResponse

对一个图片注释请求的响应。

JSON 表示法

JSON 表示法
{ "faceAnnotations": [ { object(`FaceAnnotation`) } ], "landmarkAnnotations": [ { object(`EntityAnnotation`) } ], "logoAnnotations": [ { object(`EntityAnnotation`) } ], "labelAnnotations": [ { object(`EntityAnnotation`) } ], "localizedObjectAnnotations": [ { object(`LocalizedObjectAnnotation`) } ], "textAnnotations": [ { object(`EntityAnnotation`) } ], "fullTextAnnotation": { object(`TextAnnotation`) }, "safeSearchAnnotation": { object(`SafeSearchAnnotation`) }, "imagePropertiesAnnotation": { object(`ImageProperties`) }, "cropHintsAnnotation": { object(`CropHintsAnnotation`) }, "webDetection": { object(`WebDetection`) }, "productSearchResults": { object(`ProductSearchResults`) }, "error": { object(`Status`) }, "context": { object(`ImageAnnotationContext`) } }

{
  "faceAnnotations": [
    {
      object(FaceAnnotation)
    }
  ],
  "landmarkAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "logoAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "labelAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "localizedObjectAnnotations": [
    {
      object(LocalizedObjectAnnotation)
    }
  ],
  "textAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object(TextAnnotation)
  },
  "safeSearchAnnotation": {
    object(SafeSearchAnnotation)
  },
  "imagePropertiesAnnotation": {
    object(ImageProperties)
  },
  "cropHintsAnnotation": {
    object(CropHintsAnnotation)
  },
  "webDetection": {
    object(WebDetection)
  },
  "productSearchResults": {
    object(ProductSearchResults)
  },
  "error": {
    object(Status)
  },
  "context": {
    object(ImageAnnotationContext)
  }
}

字段
`faceAnnotations[]`	`object(FaceAnnotation)` 如果存在，则人脸检测已成功完成。
`landmarkAnnotations[]`	`object(EntityAnnotation)` 如果存在，则地标检测已成功完成。
`logoAnnotations[]`	`object(EntityAnnotation)` 如果存在，则徽标检测已成功完成。
`labelAnnotations[]`	`object(EntityAnnotation)` 如果存在，则标签检测已成功完成。
`localizedObjectAnnotations[]`	`object(LocalizedObjectAnnotation)` 如果存在，则本地化对象检测已成功完成。此值会按置信度分数降序排序。
`textAnnotations[]`	`object(EntityAnnotation)` 如果存在，则文本 (OCR) 检测已成功完成。
`fullTextAnnotation`	`object(TextAnnotation)` 如果存在，则文本 (OCR) 检测或文档 (OCR) 文本检测已成功完成。此注释提供 OCR 检测到的文本的结构性层次结构。
`safeSearchAnnotation`	`object(SafeSearchAnnotation)` 如果存在，则安全搜索注释已成功完成。
`imagePropertiesAnnotation`	`object(ImageProperties)` 如果存在，则已成功提取图片属性。
`cropHintsAnnotation`	`object(CropHintsAnnotation)` 如果存在，则剪裁提示已成功完成。
`webDetection`	`object(WebDetection)` 如果存在，则 Web 检测已成功完成。
`productSearchResults`	`object(ProductSearchResults)` 如果存在，则 Google 商品搜索已成功完成。
`error`	`object(Status)` 如果设置，则表示操作的错误消息。请注意，即便设置了 `error`，填充的图片注释也保证是正确的。
`context`	`object(ImageAnnotationContext)` 只要存在上下文信息，即可了解此图片的来源。

FaceAnnotation

包含人脸检测结果的人脸检测对象。

JSON 表示法

JSON 表示法
{ "boundingPoly": { object(`BoundingPoly`) }, "fdBoundingPoly": { object(`BoundingPoly`) }, "landmarks": [ { object(`Landmark`) } ], "rollAngle": number, "panAngle": number, "tiltAngle": number, "detectionConfidence": number, "landmarkingConfidence": number, "joyLikelihood": enum(`Likelihood`), "sorrowLikelihood": enum(`Likelihood`), "angerLikelihood": enum(`Likelihood`), "surpriseLikelihood": enum(`Likelihood`), "underExposedLikelihood": enum(`Likelihood`), "blurredLikelihood": enum(`Likelihood`), "headwearLikelihood": enum(`Likelihood`) }

{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "fdBoundingPoly": {
    object(BoundingPoly)
  },
  "landmarks": [
    {
      object(Landmark)
    }
  ],
  "rollAngle": number,
  "panAngle": number,
  "tiltAngle": number,
  "detectionConfidence": number,
  "landmarkingConfidence": number,
  "joyLikelihood": enum(Likelihood),
  "sorrowLikelihood": enum(Likelihood),
  "angerLikelihood": enum(Likelihood),
  "surpriseLikelihood": enum(Likelihood),
  "underExposedLikelihood": enum(Likelihood),
  "blurredLikelihood": enum(Likelihood),
  "headwearLikelihood": enum(Likelihood)
}

字段
`boundingPoly`	`object(BoundingPoly)` 脸部周围的边界多边形。边界框的坐标采用原始图片的比例，如 `ImageParams` 中返回的值。边界框是根据人的预期对脸部进行“框架”处理而计算出的。它以地标结果为依据。请注意，如果图片中只有局部脸部需要添加注释，则不得在 `BoundingPoly` 中生成一个或多个 x 和/或 y 坐标（系统将不会为多边形设置边界）。
`fdBoundingPoly`	`object(BoundingPoly)` `fdBoundingPoly` 边界多边形比 `boundingPoly` 更严格，并且只包含人脸的皮肤部分。通常，它用于在可检测图片中可见的“皮肤面积”的任何图片分析中去除脸部。它并不基于地标结果，仅取决于初始人脸检测，因此 `fd` （人脸检测）前缀。
`landmarks[]`	`object(Landmark)` 检测到的面部地标。
`rollAngle`	`number` 滚动角，表示人脸相对于垂直于脸部的轴的图片垂直面的顺时针/逆时针旋转量。介于 [-180,180] 范围内。
`panAngle`	`number` 偏转角，表示人脸相对于垂直于该图片的垂直平面向左/向右偏转的角度。介于 [-180,180] 范围内。
`tiltAngle`	`number` 俯仰角，表示人脸相对于图片的水平面向上/向下倾斜的角度。介于 [-180,180] 范围内。
`detectionConfidence`	`number` 检测可靠度。介于 [0, 1] 范围内。
`landmarkingConfidence`	`number` 脸部标志可靠度。介于 [0, 1] 范围内。
`joyLikelihood`	`enum(Likelihood)` 喜乐可能性。
`sorrowLikelihood`	`enum(Likelihood)` 悲伤可能性。
`angerLikelihood`	`enum(Likelihood)` 愤怒可能性。
`surpriseLikelihood`	`enum(Likelihood)` 惊喜可能性。
`underExposedLikelihood`	`enum(Likelihood)` 曝光不足的可能性。
`blurredLikelihood`	`enum(Likelihood)` 模糊可能性。
`headwearLikelihood`	`enum(Likelihood)` 头饰可能性。

地标

脸部特定的标志（例如，脸部特征）。

JSON 表示法
{ "type": enum(`Type`), "position": { object(`Position`) } }

字段

字段
`type`	`enum(Type)` 脸部标志类型。
`position`	`object(Position)` 脸部标志位置。

type

enum(Type)

脸部标志类型。

position

object(Position)

脸部标志位置。

类型

面部标志（特征）类型。左和右是根据图片观看者所在的位置定义的，而不考虑照片特有的镜像投影。因此，LEFT_EYE 通常是人的右眼。

枚举
`UNKNOWN_LANDMARK`	检测到的未知脸部标志。不应填写。
`LEFT_EYE`	左眼。
`RIGHT_EYE`	右眼。
`LEFT_OF_LEFT_EYEBROW`	左眉毛左侧。
`RIGHT_OF_LEFT_EYEBROW`	左眉毛右侧。
`LEFT_OF_RIGHT_EYEBROW`	右眉毛左侧。
`RIGHT_OF_RIGHT_EYEBROW`	右眉毛右侧。
`MIDPOINT_BETWEEN_EYES`	两只眼睛的中点。
`NOSE_TIP`	鼻尖。
`UPPER_LIP`	上唇。
`LOWER_LIP`	下唇。
`MOUTH_LEFT`	嘴巴左侧。
`MOUTH_RIGHT`	嘴巴右侧。
`MOUTH_CENTER`	嘴巴中心。
`NOSE_BOTTOM_RIGHT`	鼻子右下角。
`NOSE_BOTTOM_LEFT`	鼻子，左下角。
`NOSE_BOTTOM_CENTER`	鼻子，底部中心。
`LEFT_EYE_TOP_BOUNDARY`	左眼，顶部边界。
`LEFT_EYE_RIGHT_CORNER`	左眼，右角。
`LEFT_EYE_BOTTOM_BOUNDARY`	左眼，底部边界。
`LEFT_EYE_LEFT_CORNER`	左眼，左角。
`RIGHT_EYE_TOP_BOUNDARY`	右眼，顶部边界。
`RIGHT_EYE_RIGHT_CORNER`	右眼，右角。
`RIGHT_EYE_BOTTOM_BOUNDARY`	右眼，底部边界。
`RIGHT_EYE_LEFT_CORNER`	右眼，左角。
`LEFT_EYEBROW_UPPER_MIDPOINT`	左眉毛，中部上方。
`RIGHT_EYEBROW_UPPER_MIDPOINT`	右眉毛，中部上方。
`LEFT_EAR_TRAGION`	左耳屏点。
`RIGHT_EAR_TRAGION`	右耳屏点。
`LEFT_EYE_PUPIL`	左眼瞳孔。
`RIGHT_EYE_PUPIL`	右眼瞳孔。
`FOREHEAD_GLABELLA`	前额眉间。
`CHIN_GNATHION`	下巴颔下点。
`CHIN_LEFT_GONION`	下巴左下颌点。
`CHIN_RIGHT_GONION`	下巴右下颌点。

位置

图片中的一个 3D 位置，主要用于人脸检测标志。一个有效的 Position 必须同时具有 x 坐标和 y 坐标。位置的坐标与原始图片采用相同的刻度。

JSON 表示法
{ "x": number, "y": number, "z": number }

字段

字段
`x`	`number` x 坐标。
`y`	`number` y 坐标。
`z`	`number` z 坐标（或深度）。

x

number

x 坐标。

y

number

y 坐标。

z

number

z 坐标（或深度）。

可能性

可能性的范围表示，旨在让客户在模型升级时获得高度稳定的结果。

枚举
`UNKNOWN`	未知可能性。
`VERY_UNLIKELY`	图片属于指定类别的可能性极小。
`UNLIKELY`	图片属于指定类别的可能性较小。
`POSSIBLE`	图片可能属于指定类别。
`LIKELY`	图片属于指定类别的可能性较大。
`VERY_LIKELY`	图片属于指定类别的可能性很大。

EntityAnnotation

所检测到的实体特征集。

JSON 表示法

JSON 表示法
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object(`BoundingPoly`) }, "locations": [ { object(`LocationInfo`) } ], "properties": [ { object(`Property`) } ] }

{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object(BoundingPoly)
  },
  "locations": [
    {
      object(LocationInfo)
    }
  ],
  "properties": [
    {
      object(Property)
    }
  ]
}

字段
`mid`	`string` 不透明实体 ID。一些 ID 可以在 Google Knowledge Graph Search API 中找到。
`locale`	`string` 表示实体文本 `description` 的语言区域的语言代码。
`description`	`string` 实体文本说明，以 `locale` 语言表示。
`score`	`number` 结果的总分。介于 [0, 1] 范围内。
`confidence (deprecated)`	`number` 此项已弃用！已弃用。请改用 `score`。图片中实体检测的准确性。例如，对于检测到“Eiffel Tower”实体的图片，此字段表示查询图片中有一个塔楼的置信度。介于 [0, 1] 范围内。
`topicality`	`number` ICA（图片内容注释）标签与图片的相关性。例如，即使每个图片中都存在塔的置信度相同，“tower”与包含检测到的“Eiffel Tower”的图片的相关性也可能比包含检测到的遥远高层建筑图片的相关性更高。介于 [0, 1] 范围内。
`boundingPoly`	`object(BoundingPoly)` 此实体所属的图片区域。不针对 `LABEL_DETECTION` 功能生成。
`locations[]`	`object(LocationInfo)` 检测到的实体的位置信息。有可能存在多个 `LocationInfo` 元素，因为一个位置可能表示图片中的场景位置，而另一个位置可能表示图片的拍摄位置。地标通常存在位置信息。
`properties[]`	`object(Property)` 某些实体可能具有用户提供的可选 `Property`（名称/值）字段，例如符合实体要求的得分或字符串。

LocationInfo

检测到的实体位置信息。

JSON 表示法
{ "latLng": { object(`LatLng`) } }

字段

字段
`latLng`	`object(LatLng)` 纬度/经度位置坐标。

latLng

object(LatLng)

纬度/经度位置坐标。

属性

一个 Property 包含由用户提供的一个名称/值对。

JSON 表示法
{ "name": string, "value": string, "uint64Value": string }

字段

字段
`name`	`string` 属性的名称。
`value`	`string` 属性的值。
`uint64Value`	`string` 数值属性的值。

name

string

属性的名称。

value

string

属性的值。

uint64Value

string

数值属性的值。

LocalizedObjectAnnotation

在边界框内检测到的一组对象。

JSON 表示法
{ "mid": string, "languageCode": string, "name": string, "score": number, "boundingPoly": { object(`BoundingPoly`) } }

字段
`mid`	`string` 应与 EntityAnnotation mid 保持一致的对象 ID。
`languageCode`	`string` BCP-47 语言代码，例如“en-US”或“sr-Latn”。如需了解详情，请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。
`name`	`string` 对象名称，以 `languageCode` 语言表示。
`score`	`number` 结果的分数。介于 [0, 1] 范围内。
`boundingPoly`	`object(BoundingPoly)` 此对象所属的图片区域。必须填充此字段。

TextAnnotation

TextAnnotation 包含 OCR 提取的文本的结构化表示。OCR 提取的文本结构的层次结构如下：TextAnnotation -> 页面 -> 块 -> 段落 -> 字词 -> 符号。从“页面”开始，各结构组件均可进一步拥有其自己的属性。属性描述了所检测到的语言、中断符等。如需了解详情，请参阅下面的 TextAnnotation.TextProperty 消息定义。

JSON 表示法
{ "pages": [ { object(`Page`) } ], "text": string }

字段

字段
`pages[]`	`object(Page)` OCR 检测到的页面列表。
`text`	`string` 页面上检测到 UTF-8 文本。

pages[]

object(Page)

OCR 检测到的页面列表。

text

string

页面上检测到 UTF-8 文本。

页面

通过 OCR 检测到的页面。

JSON 表示法
{ "property": { object(`TextProperty`) }, "width": number, "height": number, "blocks": [ { object(`Block`) } ], "confidence": number }

字段
`property`	`object(TextProperty)` 在页面上检测到的其他信息。
`width`	`number` 页面宽度。对于 PDF，其单位是点。对于图片（包括 TIFF），其单位是像素。
`height`	`number` 页面高度。对于 PDF，其单位是点。对于图片（包括 TIFF），其单位是像素。
`blocks[]`	`object(Block)` 此页面上的文本块、图片等列表。
`confidence`	`number` 页面上 OCR 结果的置信度。介于 [0, 1] 范围内。

TextProperty

在此结构化组件上检测到的其他信息。

JSON 表示法
{ "detectedLanguages": [ { object(`DetectedLanguage`) } ], "detectedBreak": { object(`DetectedBreak`) } }

字段

字段
`detectedLanguages[]`	`object(DetectedLanguage)` 检测到的语言及对应置信度的列表。
`detectedBreak`	`object(DetectedBreak)` 检测到的一个文本句段的开头或结尾。

detectedLanguages[]

object(DetectedLanguage)

检测到的语言及对应置信度的列表。

detectedBreak

object(DetectedBreak)

检测到的一个文本句段的开头或结尾。

DetectedLanguage

检测到的结构化组件的语言。

JSON 表示法
{ "languageCode": string, "confidence": number }

字段

字段
`languageCode`	`string` BCP-47 语言代码，例如“en-US”或“sr-Latn”。如需了解详情，请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。
`confidence`	`number` 所检测到的语言的置信度。介于 [0, 1] 范围内。

languageCode

string

BCP-47 语言代码，例如“en-US”或“sr-Latn”。如需了解详情，请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。

confidence

number

所检测到的语言的置信度。介于 [0, 1] 范围内。

DetectedBreak

检测到的结构化组件的开头或结尾。

JSON 表示法
{ "type": enum(`BreakType`), "isPrefix": boolean }

字段

字段
`type`	`enum(BreakType)` 检测到的换行符类型。
`isPrefix`	`boolean` 如果换行符附加在元素前面，则为 true。

type

enum(BreakType)

检测到的换行符类型。

isPrefix

boolean

如果换行符附加在元素前面，则为 true。

BreakType

指示所发现的中断符类型的枚举。包括换行符、空格等。

枚举
`UNKNOWN`	未知的换行符标签类型。
`SPACE`	普通空格。
`SURE_SPACE`	确定空间（非常宽）。
`EOL_SURE_SPACE`	换行符。
`HYPHEN`	文本中不存在的结束连字符；无法与 `SPACE`、`LEADER_SPACE` 或 `LINE_BREAK` 共存。
`LINE_BREAK`	用于终止段落的中断符。

区块

页面上的逻辑元素。

JSON 表示法
{ "property": { object(`TextProperty`) }, "boundingBox": { object(`BoundingPoly`) }, "paragraphs": [ { object(`Paragraph`) } ], "blockType": enum(`BlockType`), "confidence": number }

字段
`property`	`object(TextProperty)` 针对块检测到的其他信息。
`boundingBox`	`object(BoundingPoly)` 块的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时，旋转的表示方式就是沿着左上角旋转，就像以“自然”的方向阅读文字时那样。例如：文字在水平方向时可能如下所示： `0----1 \| \| 3----2` 围绕左上角旋转 180 度时，就会变为： `2----3 \| \| 1----0` 且顶点顺序仍为 (0, 1, 2, 3)。
`paragraphs[]`	`object(Paragraph)` 此区块中的段落列表（如果此块为文本类型）。
`blockType`	`enum(BlockType)` 此块中检测到的块类型（文字、图片等）。
`confidence`	`number` 此块上 OCR 结果的置信度。介于 [0, 1] 范围内。

段落

按一定顺序展示多个字词的结构化文本单元。

JSON 表示法
{ "property": { object(`TextProperty`) }, "boundingBox": { object(`BoundingPoly`) }, "words": [ { object(`Word`) } ], "confidence": number }

字段
`property`	`object(TextProperty)` 为段落检测到的其他信息。
`boundingBox`	`object(BoundingPoly)` 段落的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时，旋转的表示方式就是沿着左上角旋转，就像以“自然”的方向阅读文字时那样。例如：* 文字在水平方向时可能如下所示： 0----1 \| \| 3----2 * 围绕左上角旋转 180 度时，就会变为： 2----3 \| \| 1----0 且顶点顺序仍为 (0, 1, 2, 3)。
`words[]`	`object(Word)` 此段落中的字词列表。
`confidence`	`number` 段落的 OCR 结果置信度。介于 [0, 1] 范围内。

Word

字词表示法。

JSON 表示法
{ "property": { object(`TextProperty`) }, "boundingBox": { object(`BoundingPoly`) }, "symbols": [ { object(`Symbol`) } ], "confidence": number }

字段
`property`	`object(TextProperty)` 为字词检测到的其他信息。
`boundingBox`	`object(BoundingPoly)` 字词的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时，旋转的表示方式就是沿着左上角旋转，就像以“自然”的方向阅读文字时那样。例如：* 文字在水平方向时可能如下所示： 0----1 \| \| 3----2 * 围绕左上角旋转 180 度时，就会变为： 2----3 \| \| 1----0 且顶点顺序仍为 (0, 1, 2, 3)。
`symbols[]`	`object(Symbol)` 列出字词中的符号。符号的顺序与自然阅读顺序相同。
`confidence`	`number` 字词的 OCR 结果置信度。介于 [0, 1] 范围内。

符号

单个符号表示。

JSON 表示法
{ "property": { object(`TextProperty`) }, "boundingBox": { object(`BoundingPoly`) }, "text": string, "confidence": number }

字段
`property`	`object(TextProperty)` 为符号检测到的其他信息。
`boundingBox`	`object(BoundingPoly)` 符号的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时，旋转的表示方式就是沿着左上角旋转，就像以“自然”的方向阅读文字时那样。例如：* 文字在水平方向时可能如下所示： 0----1 \| \| 3----2 * 围绕左上角旋转 180 度时，就会变为： 2----3 \| \| 1----0 且顶点顺序仍为 (0, 1, 2, 3)。
`text`	`string` 获取符号的实际 UTF-8 表示形式。
`confidence`	`number` 符号的 OCR 结果置信度。介于 [0, 1] 范围内。

BlockType

OCR 所标识的块类型（文字、图片等）。

枚举
`UNKNOWN`	未知的块类型。
`TEXT`	普通文本块。
`TABLE`	表格块。
`PICTURE`	图片块。
`RULER`	水平/垂直线框。
`BARCODE`	条形码块。

SafeSearchAnnotation

计算机视觉方法基于安全搜索类别（例如成人、欺骗、医疗、暴力）计算出的与图片有关的一组特征。

JSON 表示法
{ "adult": enum(`Likelihood`), "spoof": enum(`Likelihood`), "medical": enum(`Likelihood`), "violence": enum(`Likelihood`), "racy": enum(`Likelihood`) }

字段
`adult`	`enum(Likelihood)` 表示图片包含成人内容的概率。成人内容可能包含裸露、色情图片或漫画或性活动等元素。
`spoof`	`enum(Likelihood)` 包含欺骗性内容的概率。对图片的标准版本进行修改以使其变得有趣或令人反感的概率。
`medical`	`enum(Likelihood)` 此图片为医学影像的概率。
`violence`	`enum(Likelihood)` 此图片包含暴力内容的概率。
`racy`	`enum(Likelihood)` 请求的图片包含少儿不宜内容的概率。少儿不宜内容可能包括（但不限于）单薄或透明的服装、用策略手段遮住的裸体、猥亵或挑逗姿势，或者敏感身体部位的特写镜头。

ImageProperties

存储图片属性，例如主色。

JSON 表示法
{ "dominantColors": { object(`DominantColorsAnnotation`) } }

字段

dominantColors

object(DominantColorsAnnotation)

如果有，主色已成功完成。

DominantColorsAnnotation

一组主色及其对应的分数。

JSON 表示法
{ "colors": [ { object(`ColorInfo`) } ] }

字段

colors[]

object(ColorInfo)

RGB 颜色值及其得分和像素分数。

ColorInfo

颜色信息，其中包含 RGB 通道、分数以及颜色在图片中所占的比例。

JSON 表示法
{ "color": { object(`Color`) }, "score": number, "pixelFraction": number }

字段

color

object(Color)

颜色的 RGB 分量。

score

number

此颜色的图片特定分数。值介于 [0, 1] 范围内。

pixelFraction

number

颜色在图片中占据的像素比例。值介于 [0, 1] 范围内。

CropHintsAnnotation

一组剪裁提示，在传送图片时用于生成新的剪裁。

JSON 表示法
{ "cropHints": [ { object(`CropHint`) } ] }

字段

cropHints[]

object(CropHint)

剪裁提示结果。

CropHint

单一剪裁提示，在传送图片时用于生成新的剪裁。

JSON 表示法
{ "boundingPoly": { object(`BoundingPoly`) }, "confidence": number, "importanceFraction": number }

字段

boundingPoly

object(BoundingPoly)

剪裁区域的边界多边形。边界框的坐标采用原始图片的比例，如 ImageParams 中返回的值。

confidence

number

成为重要区域的置信度。介于 [0, 1] 范围内。

importanceFraction

number

此重要区域相对于原始图片的重要性比例。

WebDetection

互联网图片的相关信息。

JSON 表示法

{
  "webEntities": [
    {
      object(WebEntity)
    }
  ],
  "fullMatchingImages": [
    {
      object(WebImage)
    }
  ],
  "partialMatchingImages": [
    {
      object(WebImage)
    }
  ],
  "pagesWithMatchingImages": [
    {
      object(WebPage)
    }
  ],
  "visuallySimilarImages": [
    {
      object(WebImage)
    }
  ],
  "bestGuessLabels": [
    {
      object(WebLabel)
    }
  ]
}

字段
`webEntities[]`	`object(WebEntity)` 从相似的互联网图片中推导出的实体。
`fullMatchingImages[]`	`object(WebImage)` 与互联网完全匹配的图片。可包括查询图片的调整大小后的副本。
`partialMatchingImages[]`	`object(WebImage)` 与互联网局部匹配的图片。这些图片的相似度足够高，有一些与查询图片相同的关键特征。例如，原始图片与剪裁图片可能会部分匹配。
`pagesWithMatchingImages[]`	`object(WebPage)` 包含匹配的互联网图片的网页。
`visuallySimilarImages[]`	`object(WebImage)` 外观类似的图片结果。
`bestGuessLabels[]`	`object(WebLabel)` 该服务关于请求图片主题的最佳猜测。根据开放式 Web 上的类似图片推断得出。

WebEntity

从相似的互联网图片中推导出的实体。

JSON 表示法
{ "entityId": string, "score": number, "description": string }

字段

entityId

string

不透明实体 ID。

score

number

实体的总体相关度得分。不同图片查询之间的分数并非归一化分数，也不具有可比性。

description

string

实体的标准说明（采用英文）。

WebImage

在线图片的元数据。

JSON 表示法
{ "url": string, "score": number }

字段

url

string

结果图片网址。

score

number

（已弃用）图片的整体相关性分数。

WebPage

网页的元数据。

JSON 表示法
{ "url": string, "score": number, "pageTitle": string, "fullMatchingImages": [ { object(`WebImage`) } ], "partialMatchingImages": [ { object(`WebImage`) } ] }

字段
`url`	`string` 结果网页的网址。
`score`	`number` （已弃用）网页的整体相关性得分。
`pageTitle`	`string` 网页的标题，可能包含 HTML 标记。
`fullMatchingImages[]`	`object(WebImage)` 与网页上的图片完全匹配。可包括查询图片的调整大小后的副本。
`partialMatchingImages[]`	`object(WebImage)` 与网页上的图片部分匹配。这些图片的相似度足够高，有一些与查询图片相同的关键特征。例如，原始图片与剪裁图片可能会部分匹配。

WebLabel

为网络检测提供额外元数据的标签。

JSON 表示法
{ "label": string, "languageCode": string }

字段

label

string

用于附加元数据的标签。

languageCode

string

label 的 BCP-47 语言代码，例如“en-US”或“sr-Latn”。如需了解详情，请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。

ProductSearchResults

商品搜索请求的结果。

JSON 表示法
{ "indexTime": string, "results": [ { object(`Result`) } ], "productGroupedResults": [ { object(`GroupedResult`) } ] }

字段

indexTime

string (Timestamp format)

提供这些结果的索引的时间戳。在此时间之后所做的更改不会反映在当前结果中。

时间戳采用 RFC3339 世界协调时间（UTC，即“祖鲁时”）格式，精确到纳秒。示例："2014-10-02T15:01:23.045123456Z"。

results[]

object(Result)

结果列表，每个结果对应每个商品匹配项。

productGroupedResults[]

object(GroupedResult)

在查询图片中检测到的依商品分组的结果列表。每个条目均对应于查询图片中的一个边界多边形，并包含特定于该区域的匹配商品。在每种商品的所有结果联合中，可能存在重复的商品匹配项。

结果

商品相关信息。

JSON 表示法
{ "product": { object(`Product`) }, "score": number, "image": string }

字段

product

object(Product)

商品。

score

number

匹配项的置信度，范围从 0（零置信度）到 1（最高置信度）。

image

string

与查询最匹配的商品中的图片的资源名称。

GroupedResult

与查询图片中的单件商品类似的商品相关信息。

JSON 表示法
{ "boundingPoly": { object(`BoundingPoly`) }, "results": [ { object(`Result`) } ] }

字段

boundingPoly

object(BoundingPoly)

在查询图片中检测到的商品的边界多边形。

results[]

object(Result)

结果列表，每个结果对应每个商品匹配项。

ImageAnnotationContext

如果图片是通过文件（例如 PDF）生成的，则此消息将提供有关该图片来源的信息。

JSON 表示法
{ "uri": string, "pageNumber": number }

字段

uri

string

用于生成图片的文件的 URI。

pageNumber

number

如果文件是 PDF 或 TIFF，则此字段给出了用于生成图片的文件中的页码。