- HTTP 要求
- 要求主體
- 回應主體
- 授權範圍
- AnnotateImageRequest
- 圖片
- ImageSource
- AnnotateImageResponse
- FaceAnnotation
- 地標
- 類型
- 位置
- 可能性
- EntityAnnotation
- LocationInfo
- 資源
- LocalizedObjectAnnotation
- TextAnnotation
- 網頁
- TextProperty
- DetectedLanguage
- DetectedBreak
- BreakType
- 封鎖
- 段落
- 單字
- 符號
- BlockType
- SafeSearchAnnotation
- ImageProperties
- DominantColorsAnnotation
- ColorInfo
- CropHintsAnnotation
- CropHint
- WebDetection
- WebEntity
- WebImage
- WebPage
- WebLabel
- ProductSearchResults
- 結果
- GroupedResult
- ImageAnnotationContext
為一批圖片執行圖像偵測和註解。
HTTP 要求
POST https://vision.googleapis.com/v1p3beta1/images:annotate
這個網址使用 gRPC 轉碼語法。
要求主體
要求主體包含下列結構的資料:
JSON 表示法 | |
---|---|
{
"requests": [
{
object( |
欄位 | |
---|---|
requests[] |
此批次的個別圖片註解要求。 |
回應主體
如果成功,回應主體會含有以下結構的資料:
回應圖片批註要求。
JSON 表示法 | |
---|---|
{
"responses": [
{
object( |
欄位 | |
---|---|
responses[] |
批次中圖片註解要求的個別回應。 |
授權範圍
需要下列其中一種 OAuth 範圍:
https://www.googleapis.com/auth/cloud-platform
https://www.googleapis.com/auth/cloud-vision
詳情請參閱驗證總覽一文。
AnnotateImageRequest
要求在使用者提供的圖片上執行 Google Cloud Vision API 工作,並使用使用者要求的功能。
JSON 表示法 | |
---|---|
{ "image": { object( |
欄位 | |
---|---|
image |
要處理的圖片。 |
features[] |
要求的功能。 |
imageContext |
圖片可能會附帶的其他背景資訊。 |
圖片
用於執行 Google Cloud Vision API 工作之用途的用戶端映像檔。
JSON 表示法 | |
---|---|
{
"content": string,
"source": {
object( |
欄位 | |
---|---|
content |
圖片內容,以位元組串流表示。注意:與所有 Base64 編碼字串。 |
source |
Google Cloud Storage 圖片位置,或可公開存取的圖片網址。如果圖片同時提供 |
圖片來源
外部圖片來源 (Google Cloud Storage 或網頁網址圖片位置)。
JSON 表示法 | |
---|---|
{ "gcsImageUri": string, "imageUri": string } |
欄位 | |
---|---|
gcsImageUri |
改用 格式為 |
imageUri |
來源圖片的 URI。可以是下列任一項:
如果同時指定 |
AnnotateImageResponse
回應圖片註解要求。
JSON 表示法 | |
---|---|
{ "faceAnnotations": [ { object( |
欄位 | |
---|---|
faceAnnotations[] |
如果有這個值,表示臉部偵測已順利完成。 |
landmarkAnnotations[] |
如果有此屬性,表示地標偵測已順利完成。 |
logoAnnotations[] |
如果有這個值,表示已成功完成標誌偵測。 |
labelAnnotations[] |
如果有標籤,表示標籤偵測已順利完成。 |
localizedObjectAnnotations[] |
如果有,表示已成功完成本機物體偵測。系統會依信心分數遞減排序。 |
textAnnotations[] |
如果有這個值,表示文字 (OCR) 偵測已順利完成。 |
fullTextAnnotation |
如果有這個值,表示文字 (OCR) 偵測或文件 (OCR) 文字偵測已成功完成。這個註解會為 OCR 偵測到的文字提供結構階層。 |
safeSearchAnnotation |
如果有,表示安全搜尋註解已順利完成。 |
imagePropertiesAnnotation |
如果存在,表示已成功擷取圖片屬性。 |
cropHintsAnnotation |
如果有這個值,表示已成功完成裁剪提示。 |
webDetection |
如果有這個值,表示網頁偵測已順利完成。 |
productSearchResults |
如果有此值,代表產品搜尋已順利完成。 |
error |
如果已設定,則代表該作業的錯誤訊息。請注意,即使設定了 |
context |
如果有,則需要提供情境資訊,才能瞭解這張圖片的來源。 |
臉部註解
臉部註解物件包含臉部偵測結果。
JSON 表示法 | |
---|---|
{ "boundingPoly": { object( |
欄位 | |
---|---|
boundingPoly |
臉孔周圍的定界多邊形。外框的座標會以原始圖片的比例顯示,如 |
fdBoundingPoly |
(臉部偵測) 前置字串。 |
landmarks[] |
偵測到的臉部特徵。 |
rollAngle |
翻轉角度,表示錶面相對於圖片垂直方向,沿著垂直於錶面的軸線順/逆時針旋轉的角度。範圍 [-180,180]。 |
panAngle |
偏航角,表示相對於垂直於圖片的垂直平面,臉朝向左/右的角度。範圍 [-180,180]。 |
tiltAngle |
傾斜角度,表示臉部相對於圖片水平面向上/向下指向的角度。範圍 [-180,180]。 |
detectionConfidence |
偵測信心。範圍 [0, 1]。 |
landmarkingConfidence |
臉部特徵偵測信心等級。範圍 [0, 1]。 |
joyLikelihood |
樂樂的可能性。 |
sorrowLikelihood |
悲傷程度。 |
angerLikelihood |
憤怒的可能性。 |
surpriseLikelihood |
驚喜程度。 |
underExposedLikelihood |
曝光不足的可能性。 |
blurredLikelihood |
模糊機率。 |
headwearLikelihood |
頭飾可能性。 |
地標
臉部特徵 (例如臉部特徵)。
JSON 表示法 | |
---|---|
{ "type": enum( |
欄位 | |
---|---|
type |
臉部特徵類型。 |
position |
臉部特徵點位置。 |
類型
臉部特徵 (特徵) 類型。左側和右側的定義是從圖片觀看者的角度定義,不考量相片的鏡像投影。因此,LEFT_EYE
通常是指人物的右眼。
列舉 | |
---|---|
UNKNOWN_LANDMARK |
偵測到不明的臉部特徵。請勿填寫。 |
LEFT_EYE |
左眼。 |
RIGHT_EYE |
右眼。 |
LEFT_OF_LEFT_EYEBROW |
左眉毛左側。 |
RIGHT_OF_LEFT_EYEBROW |
左眉毛右側。 |
LEFT_OF_RIGHT_EYEBROW |
右眉毛左側。 |
RIGHT_OF_RIGHT_EYEBROW |
右眉毛右側。 |
MIDPOINT_BETWEEN_EYES |
眼睛之間的中點。 |
NOSE_TIP |
鼻尖。 |
UPPER_LIP |
上嘴唇。 |
LOWER_LIP |
下嘴唇。 |
MOUTH_LEFT |
嘴巴左側。 |
MOUTH_RIGHT |
嘴巴右側。 |
MOUTH_CENTER |
嘴巴居中。 |
NOSE_BOTTOM_RIGHT |
鼻子,右下方。 |
NOSE_BOTTOM_LEFT |
鼻子,左下方。 |
NOSE_BOTTOM_CENTER |
鼻子,正下方。 |
LEFT_EYE_TOP_BOUNDARY |
左眼上邊界。 |
LEFT_EYE_RIGHT_CORNER |
左眼右上角。 |
LEFT_EYE_BOTTOM_BOUNDARY |
左眼下緣邊界。 |
LEFT_EYE_LEFT_CORNER |
左眼左上角。 |
RIGHT_EYE_TOP_BOUNDARY |
右眼,上邊界。 |
RIGHT_EYE_RIGHT_CORNER |
右眼右上角。 |
RIGHT_EYE_BOTTOM_BOUNDARY |
右眼,下方邊界。 |
RIGHT_EYE_LEFT_CORNER |
右眼左上角。 |
LEFT_EYEBROW_UPPER_MIDPOINT |
左眉毛上方中點。 |
RIGHT_EYEBROW_UPPER_MIDPOINT |
右眉毛上方中間位置。 |
LEFT_EAR_TRAGION |
左耳耳前突。 |
RIGHT_EAR_TRAGION |
右耳耳硃。 |
LEFT_EYE_PUPIL |
左眼瞳孔。 |
RIGHT_EYE_PUPIL |
右眼瞳孔。 |
FOREHEAD_GLABELLA |
額頭的眉心。 |
CHIN_GNATHION |
下巴顳骨。 |
CHIN_LEFT_GONION |
下巴左側的髁。 |
CHIN_RIGHT_GONION |
下巴右側的髁。 |
位置
圖像中的 3D 位置,主要用於臉部偵測地標。有效的 Position 必須同時包含 x 和 y 座標。位置座標與原始圖片的比例相同。
JSON 表示法 | |
---|---|
{ "x": number, "y": number, "z": number } |
欄位 | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
z |
Z 座標 (或深度)。 |
可能性
以分桶方式表示可能性,目的是在模型升級時為客戶提供高度穩定的結果。
列舉 | |
---|---|
UNKNOWN |
可能性不明。 |
VERY_UNLIKELY |
圖片不太可能屬於指定的垂直類別。 |
UNLIKELY |
圖片不太可能屬於指定的垂直類別。 |
POSSIBLE |
圖片可能屬於指定的產業。 |
LIKELY |
圖片很可能屬於指定的垂直類別。 |
VERY_LIKELY |
圖片極有可能屬於指定的垂直類別。 |
實體註解
偵測到的實體功能集。
JSON 表示法 | |
---|---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object( |
欄位 | |
---|---|
mid |
不透明實體 ID。部分 ID 可能會在 Google Knowledge Graph Search API 中提供。 |
locale |
實體文字 |
description |
實體文字說明,以 |
score |
結果的整體分數。範圍 [0, 1]。 |
confidence |
已淘汰;請改用 |
topicality |
ICA (圖片內容註解) 標籤與圖片的相關性。舉例來說,如果圖片中偵測到「艾菲爾鐵塔」,那麼「塔」的相關性可能會高於偵測到遠方高樓的圖片,即使兩者偵測到塔的置信度相同。範圍 [0, 1]。 |
boundingPoly |
這個實體所屬的圖片區域。不適用於 |
locations[] |
所偵測實體的位置資訊。系統可以提供多個 |
properties[] |
部分實體可能會提供選用的使用者提供 |
地點資訊
偵測到的實體位置資訊。
JSON 表示法 | |
---|---|
{
"latLng": {
object( |
欄位 | |
---|---|
latLng |
經緯度座標。 |
屬性
Property
由使用者提供的名稱/值組合組成。
JSON 表示法 | |
---|---|
{ "name": string, "value": string, "uint64Value": string } |
欄位 | |
---|---|
name |
房源名稱。 |
value |
屬性值。 |
uint64Value |
數值屬性的值。 |
本地化物件註解
包含定界框的偵測物件集合。
JSON 表示法 | |
---|---|
{
"mid": string,
"languageCode": string,
"name": string,
"score": number,
"boundingPoly": {
object( |
欄位 | |
---|---|
mid |
應與 EntityAnnotation mid 對齊的物件 ID。 |
languageCode |
BCP-47 語言代碼,例如「en-US」或「sr-Latn」。詳情請參閱 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。 |
name |
物件名稱,以 |
score |
結果的分數。範圍 [0, 1]。 |
boundingPoly |
這個物件所屬的圖片區域。必須填入。 |
文字註解
TextAnnotation 包含 OCR 擷取的文字結構化表示法。OCR 擷取的文字結構階層如下:TextAnnotation -> 頁面 -> 區塊 -> 段落 -> 字 -> 符號。從頁面開始,每個結構元件可能都有各自的屬性。屬性會說明偵測到的語言、中斷點等。詳情請參閱下方的 TextAnnotation.TextProperty
訊息定義。
JSON 表示法 | |
---|---|
{
"pages": [
{
object( |
欄位 | |
---|---|
pages[] |
OCR 偵測到的頁面清單。 |
text |
系統在網頁上偵測到 UTF-8 文字。 |
頁面
透過光學字元辨識偵測到的頁面。
JSON 表示法 | |
---|---|
{ "property": { object( |
欄位 | |
---|---|
property |
系統在網頁上偵測到其他資訊。 |
width |
頁面寬度。對於 PDF 檔案,單位為點。圖片 (包括 TIFF) 的單位為像素。 |
height |
頁面高度。對於 PDF 檔案,單位為點。圖片 (包括 TIFF) 的單位為像素。 |
blocks[] |
列出這個頁面上的文字區塊、圖片等。 |
confidence |
網頁上 OCR 結果的置信度。範圍 [0, 1]。 |
TextProperty
偵測到結構元件的其他資訊。
JSON 表示法 | |
---|---|
{ "detectedLanguages": [ { object( |
欄位 | |
---|---|
detectedLanguages[] |
偵測到的語言清單,以及相應的信心等級。 |
detectedBreak |
偵測到文字片段的開頭或結尾。 |
DetectedLanguage
偵測到的結構元件語言。
JSON 表示法 | |
---|---|
{ "languageCode": string, "confidence": number } |
欄位 | |
---|---|
languageCode |
BCP-47 語言代碼,例如「en-US」或「sr-Latn」。詳情請參閱 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。 |
confidence |
偵測到的語言置信度。範圍 [0, 1]。 |
DetectedBreak
偵測到結構元件的開始或結束。
JSON 表示法 | |
---|---|
{
"type": enum( |
欄位 | |
---|---|
type |
偵測到的符號類型。 |
isPrefix |
如果 break 置於元素之前,則為「是」。 |
分隔類型
以列舉方式表示所找到的斷點類型。換行、空格等。
列舉 | |
---|---|
UNKNOWN |
不明的休止標籤類型。 |
SPACE |
一般空間。 |
SURE_SPACE |
確實有空間 (非常寬)。 |
EOL_SURE_SPACE |
換行符號。 |
HYPHEN |
文字中沒有結尾連字號,且不會與 SPACE 、LEADER_SPACE 或 LINE_BREAK 同時出現。 |
LINE_BREAK |
結束段落的換行符號。 |
封鎖
網頁上的邏輯元素。
JSON 表示法 | |
---|---|
{ "property": { object( |
欄位 | |
---|---|
property |
系統偵測到區塊的其他資訊。 |
boundingBox |
區塊的定界框。頂點的順序為左上、右上、右下、左下。偵測到邊界框旋轉時,系統會以「自然」方向讀取文字時定義的左上角為基準,顯示旋轉角度。例如:
頂點順序仍為 (0, 1, 2, 3)。 |
paragraphs[] |
這個區塊中的段落清單 (如果這個區塊的類型為文字)。 |
blockType |
這個區塊的偵測區塊類型 (文字、圖片等)。 |
confidence |
封鎖區塊的 OCR 結果信心等級。範圍 [0, 1]。 |
段落
文字的結構單元,以特定順序代表多個字詞。
JSON 表示法 | |
---|---|
{ "property": { object( |
欄位 | |
---|---|
property |
系統偵測到段落的其他資訊。 |
boundingBox |
段落的定界框。頂點的順序為左上、右上、右下、左下。偵測到邊界框旋轉時,系統會以「自然」方向讀取文字時定義的左上角為基準,顯示旋轉角度。舉例來說:* 當文字呈水平方向時,可能會像這樣: 0----1 | | 3----2 * 當文字以左上角為中心旋轉 180 度時,會變成: 2----3 | | 1----0,頂點順序仍為 (0, 1, 2, 3)。 |
words[] |
列出本段落中的字詞。 |
confidence |
段落的 OCR 結果信賴度。範圍 [0, 1]。 |
Word
字詞的表示法。
JSON 表示法 | |
---|---|
{ "property": { object( |
欄位 | |
---|---|
property |
系統偵測到該字詞的其他資訊。 |
boundingBox |
字詞的定界框。頂點的順序為左上、右上、右下、左下。偵測到邊界框旋轉時,系統會以「自然」方向讀取文字時定義的左上角為基準,顯示旋轉角度。舉例來說:* 當文字呈水平方向時,可能會像這樣: 0----1 | | 3----2 * 當文字以左上角為中心旋轉 180 度時,會變成: 2----3 | | 1----0,頂點順序仍為 (0, 1, 2, 3)。 |
symbols[] |
字詞中的符號清單。符號的順序會遵循自然閱讀順序。 |
confidence |
字詞的 OCR 結果置信度。範圍 [0, 1]。 |
符號
單一符號表示法。
JSON 表示法 | |
---|---|
{ "property": { object( |
欄位 | |
---|---|
property |
系統偵測到符號的其他資訊。 |
boundingBox |
符號的定界框。頂點的順序為左上、右上、右下、左下。偵測到邊界框旋轉時,系統會以「自然」方向讀取文字時定義的左上角為基準,顯示旋轉角度。舉例來說:* 當文字呈水平方向時,可能會像這樣: 0----1 | | 3----2 * 當文字以左上角為中心旋轉 180 度時,會變成: 2----3 | | 1----0,頂點順序仍為 (0, 1, 2, 3)。 |
text |
符號的實際 UTF-8 表示法。 |
confidence |
符號 OCR 結果的置信度。範圍 [0, 1]。 |
封鎖類型
OCR 辨識的區塊類型 (文字、圖片等)。
列舉 | |
---|---|
UNKNOWN |
不明的區塊類型。 |
TEXT |
一般文字區塊。 |
TABLE |
表格區塊。 |
PICTURE |
圖片區塊。 |
RULER |
水平/垂直線框。 |
BARCODE |
條碼區塊。 |
安全搜尋註解
與圖片相關的功能集合,透過電腦視覺方法計算出安全搜尋類別 (例如成人、惡搞、醫療、暴力)。
JSON 表示法 | |
---|---|
{ "adult": enum( |
欄位 | |
---|---|
adult |
代表圖片成人內容的可能性。成人內容可能包含裸露、色情圖片或卡通,或性活動等元素。 |
spoof |
造假可能性。圖片的標準版本是否可能經過修改,以便讓圖片看起來有趣或具有冒犯性。 |
medical |
這張圖片可能是醫學影像的可能性。 |
violence |
這張圖片含有暴力內容的可能性。 |
racy |
要求圖片含有煽情露骨內容的可能性。煽情內容包括 (但不限於) 衣著暴露或透明的服裝、刻意遮住裸露部位的裸露畫面、猥褻或煽情姿勢,或特寫身體敏感部位的畫面。 |
圖片屬性
儲存圖片屬性,例如主色。
JSON 表示法 | |
---|---|
{
"dominantColors": {
object( |
欄位 | |
---|---|
dominantColors |
如果存在,代表已順利完成主色調。 |
主色註解
主色組合和對應的分數。
JSON 表示法 | |
---|---|
{
"colors": [
{
object( |
欄位 | |
---|---|
colors[] |
RGB 顏色值及其分數和像素分數。 |
色彩資訊
色彩資訊包含 RGB 管道、分數,以及顏色在圖像中所占的圖像比例。
JSON 表示法 | |
---|---|
{
"color": {
object( |
欄位 | |
---|---|
color |
色彩的 RGB 元件。 |
score |
此顏色的圖片專屬分數。值介於 [0, 1] 之間。 |
pixelFraction |
顏色在圖片中所占的像素比例。值介於 [0, 1] 之間。 |
裁剪提示註解
一組裁剪提示,用於在提供圖片時產生新的裁剪圖片。
JSON 表示法 | |
---|---|
{
"cropHints": [
{
object( |
欄位 | |
---|---|
cropHints[] |
裁剪提示結果。 |
裁剪提示
單一裁剪提示,用於在提供圖片時產生新的裁剪區域。
JSON 表示法 | |
---|---|
{
"boundingPoly": {
object( |
欄位 | |
---|---|
boundingPoly |
裁剪區域的定界多邊形。外框的座標會以原始圖片的比例顯示,如 |
confidence |
此為顯著區域的信賴度。範圍 [0, 1]。 |
importanceFraction |
這個顯目區域相對於原始圖片的重要性。 |
網路偵測
網路上與圖片相關的資訊。
JSON 表示法 | |
---|---|
{ "webEntities": [ { object( |
欄位 | |
---|---|
webEntities[] |
從網際網路上的相似圖片中推斷實體。 |
fullMatchingImages[] |
與網際網路上的圖片完全相符。可包含經過調整大小的查詢圖片副本。 |
partialMatchingImages[] |
部分相符的網路圖片。這些圖片非常相似,因此具有一些共同的關鍵特徵。舉例來說,原始圖片可能會部分符合裁切圖片。 |
pagesWithMatchingImages[] |
含有相符圖片的網頁 (來自網路)。 |
visuallySimilarImages[] |
外觀相似的圖片結果。 |
bestGuessLabels[] |
服務對要求圖片主題的最佳推測結果。根據公開網路上的相似圖片推測而得。 |
WebEntity
從網際網路上的相似圖片推斷出的實體。
JSON 表示法 | |
---|---|
{ "entityId": string, "score": number, "description": string } |
欄位 | |
---|---|
entityId |
不透明實體 ID。 |
score |
實體的整體相關性分數。未經過正規化,且無法在不同圖片查詢中進行比較。 |
description |
實體的標準描述 (英文)。 |
WebImage
線上圖片的中繼資料。
JSON 表示法 | |
---|---|
{ "url": string, "score": number } |
欄位 | |
---|---|
url |
結果圖片網址。 |
score |
(已淘汰) 圖片的整體相關性分數。 |
WebPage
網頁的中繼資料。
JSON 表示法 | |
---|---|
{ "url": string, "score": number, "pageTitle": string, "fullMatchingImages": [ { object( |
欄位 | |
---|---|
url |
搜尋結果網頁的網址。 |
score |
(已淘汰) 網頁的整體相關性分數。 |
pageTitle |
網頁的標題,可包含 HTML 標記。 |
fullMatchingImages[] |
網頁上完全相符的圖片。可包含經過調整大小的查詢圖片副本。 |
partialMatchingImages[] |
網頁上部分相符的圖片。這些圖片非常相似,因此具有一些共同的關鍵特徵。舉例來說,原始圖片可能會部分符合裁切圖片。 |
WebLabel
標籤,可為網頁偵測提供額外中繼資料。
JSON 表示法 | |
---|---|
{ "label": string, "languageCode": string } |
欄位 | |
---|---|
label |
額外中繼資料的標籤。 |
languageCode |
|
產品搜尋結果
產品搜尋要求的結果。
JSON 表示法 | |
---|---|
{ "indexTime": string, "results": [ { object( |
欄位 | |
---|---|
indexTime |
提供這些結果的索引時間戳記。在這個時間點之後進行的圖片變更不會反映在目前的結果中。 RFC3339 世界標準時間「Zulu」格式的時間戳記,精確度達奈秒單位。範例: |
results[] |
結果清單,每項產品比對結果各一。 |
productGroupedResults[] |
根據查詢圖片中偵測到的產品分組的結果清單。每個項目都對應至查詢圖片中的一個邊界多邊形,並包含該區域的特定相符產品。所有個別產品結果的聯集可能會出現重複的產品比對結果。 |
結果
產品資訊。
JSON 表示法 | |
---|---|
{
"product": {
object( |
欄位 | |
---|---|
product |
產品。 |
score |
比對結果的信心程度,範圍從 0 (完全沒有信心) 到 1 (完全有信心)。 |
image |
與查詢最相符的產品圖片資源名稱。 |
GroupedResult
與查詢圖片中單一產品相似的產品資訊。
JSON 表示法 | |
---|---|
{ "boundingPoly": { object( |
欄位 | |
---|---|
boundingPoly |
在查詢圖片中偵測到的產品周圍邊界多邊形。 |
results[] |
結果清單,每項產品比對結果各一。 |
圖片註解內容
如果圖片是從檔案 (例如 PDF) 產生,這則訊息會提供該圖片來源的相關資訊。
JSON 表示法 | |
---|---|
{ "uri": string, "pageNumber": number } |
欄位 | |
---|---|
uri |
用於產生圖片的檔案 URI。 |
pageNumber |
如果檔案是 PDF 或 TIFF,這個欄位會提供用來產生圖片的檔案內頁碼。 |