AnnotateImageResponse

圖片註解要求的回應。

JSON 表示法
{
  "textAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object (TextAnnotation)
  },
  "error": {
    object (Status)
  },
  "context": {
    object (ImageAnnotationContext)
  }
}
欄位
textAnnotations[]

object (EntityAnnotation)

如果存在,表示文字 (OCR) 偵測已順利完成。

fullTextAnnotation

object (TextAnnotation)

如果顯示文字 (OCR) 偵測或文件 (OCR) 文字偵測已成功完成,這項註解提供 OCR 偵測到的文字結構階層。

error

object (Status)

如果已設定,則代表作業的錯誤訊息。請注意,即使已設定 error,填入的圖片註解也保證正確。

context

object (ImageAnnotationContext)

如有這類資訊,請提供背景資訊,瞭解圖片來源。

實體註解

偵測到的實體特徵集。

JSON 表示法
{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object (BoundingPoly)
  },
  "properties": [
    {
      object (Property)
    }
  ]
}
欄位
mid

string

不透明的實體 ID。部分 ID 可能會顯示在 Google Knowledge Graph Search API 中。

locale

string

實體文字 description 的語言代碼。

description

string

實體的文字說明,以locale語言表示。

score

number

結果的整體分數。範圍為 [0, 1]。

confidence
(deprecated)

number

已淘汰;請改用 score圖片中實體偵測的準確度。舉例來說,如果系統在圖片中偵測到「艾菲爾鐵塔」實體,這個欄位就會代表查詢圖片中存在鐵塔的信賴度。範圍為 [0, 1]。

topicality

number

ICA (圖片內容註解) 標籤與圖片的相關性。舉例來說,即使兩張圖片中都有高塔,但如果其中一張圖片偵測到「艾菲爾鐵塔」,「高塔」與這張圖片的關聯性可能就高於另一張圖片。範圍為 [0, 1]。

boundingPoly

object (BoundingPoly)

這個實體所屬的圖片區域。未針對 LABEL_DETECTION 功能製作。

properties[]

object (Property)

部分實體可能會有選用的使用者提供 Property (名稱/值) 欄位,例如實體的資格分數或字串。

BoundingPoly

偵測到的圖片註解定界多邊形。

JSON 表示法
{
  "vertices": [
    {
      object (Vertex)
    }
  ],
  "normalizedVertices": [
    {
      object (NormalizedVertex)
    }
  ]
}
欄位
vertices[]

object (Vertex)

定界多邊形頂點。

normalizedVertices[]

object (NormalizedVertex)

定界多邊形正規化頂點。

Vertex

頂點代表圖片中的 2D 點。注意:頂點座標的比例與原始圖片相同。

JSON 表示法
{
  "x": integer,
  "y": integer
}
欄位
x

integer

X 座標。

y

integer

Y 座標。

正規化 Vertex

頂點代表圖片中的 2D 點。注意:正規化後的頂點座標是相對於原始圖片,範圍介於 0 到 1 之間。

JSON 表示法
{
  "x": number,
  "y": number
}
欄位
x

number

X 座標。

y

number

Y 座標。

屬性

Property 包含使用者提供的名稱/值組合。

JSON 表示法
{
  "name": string,
  "value": string,
  "uint64Value": string
}
欄位
name

string

房源名稱。

value

string

屬性的值。

uint64Value

string

數值屬性的值。

文字註解

TextAnnotation 包含以結構化形式表示的 OCR 擷取文字。OCR 擷取文字結構的階層如下:

TextAnnotation-> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號

每個結構化元件 (從 Page 開始) 可能都有屬性,用於說明偵測到的語言、換行等。詳情請參閱下方的 TextAnnotation.TextProperty 訊息定義。

JSON 表示法
{
  "pages": [
    {
      object (Page)
    }
  ],
  "text": string
}
欄位
pages[]

object (Page)

OCR 偵測到的頁面清單。

text

string

系統在網頁上偵測到 UTF-8 文字。

頁面

OCR 偵測到的頁面。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "width": integer,
  "height": integer,
  "blocks": [
    {
      object (Block)
    }
  ],
  "confidence": number
}
欄位
property

object (TextProperty)

網頁上偵測到其他資訊。

width

integer

頁面寬度。如果是 PDF,單位為點。如果是圖片 (包括 TIFF),單位是像素。

height

integer

頁面高度。如果是 PDF,單位為點。如果是圖片 (包括 TIFF),單位是像素。

blocks[]

object (Block)

這個頁面上的文字區塊、圖片等清單。

confidence

number

網頁上 OCR 結果的信賴度。範圍為 [0, 1]。

TextProperty

在結構性元件上偵測到其他資訊。

JSON 表示法
{
  "detectedLanguages": [
    {
      object (DetectedLanguage)
    }
  ],
  "detectedBreak": {
    object (DetectedBreak)
  }
}
欄位
detectedLanguages[]

object (DetectedLanguage)

偵測到的語言清單和信賴度。

detectedBreak

object (DetectedBreak)

偵測到文字片段的開頭或結尾。

DetectedLanguage

偵測到結構元件的語言。

JSON 表示法
{
  "languageCode": string,
  "confidence": number
}
欄位
languageCode

string

BCP-47 語言代碼,例如「en-US」或「sr-Latn」。詳情請參閱 https://www.unicode.org/reports/tr35/#Unicode_locale_identifier

confidence

number

偵測到的語言的信賴度。範圍為 [0, 1]。

DetectedBreak

偵測到結構化元件的開頭或結尾。

JSON 表示法
{
  "type": enum (BreakType),
  "isPrefix": boolean
}
欄位
type

enum (BreakType)

偵測到的中斷類型。

isPrefix

boolean

如果換行符號會加在元素前面,則為 True。

分隔類型

以列舉方式表示找到的間斷類型。換行、空格等。

列舉
UNKNOWN 不明的休息標籤類型。
SPACE 一般空間。
SURE_SPACE 確定間距 (非常寬)。
EOL_SURE_SPACE 換行符號。
HYPHEN 文字中沒有行尾連字號,且不會與 SPACELEADER_SPACELINE_BREAK 同時出現。
LINE_BREAK 結束段落的換行符號。

封鎖

網頁上的邏輯元素。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "paragraphs": [
    {
      object (Paragraph)
    }
  ],
  "blockType": enum (BlockType),
  "confidence": number
}
欄位
property

object (TextProperty)

系統偵測到該區塊的其他資訊。

boundingBox

object (BoundingPoly)

區塊的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。例如:

  • 文字為水平時,可能看起來像這樣:
    0----1
    |    |
    3----2
  • 如果以左上角為中心旋轉 180 度,則會變成:
    2----3
    |    |
    1----0

頂點順序仍為 (0, 1, 2, 3)。

paragraphs[]

object (Paragraph)

這個區塊中的段落清單 (如果這個區塊是文字類型)。

blockType

enum (BlockType)

這個區塊的偵測區塊類型 (文字、圖片等)。

confidence

number

OCR 結果對區塊的信心程度。範圍為 [0, 1]。

段落

文字的結構單元,代表特定順序的字詞。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "words": [
    {
      object (Word)
    }
  ],
  "confidence": number
}
欄位
property

object (TextProperty)

系統偵測到段落的其他資訊。

boundingBox

object (BoundingPoly)

段落的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。

words[]

object (Word)

這個段落中的所有字詞清單。

confidence

number

段落 OCR 結果的信賴度。範圍為 [0, 1]。

Word

字詞表示法。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "symbols": [
    {
      object (Symbol)
    }
  ],
  "confidence": number
}
欄位
property

object (TextProperty)

系統偵測到該字詞的其他資訊。

boundingBox

object (BoundingPoly)

這個字的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。

symbols[]

object (Symbol)

字詞中的符號清單。符號順序會遵循自然閱讀順序。

confidence

number

這個字 OCR 結果的信賴度。範圍為 [0, 1]。

符號

單一符號表示法。

JSON 表示法
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "text": string,
  "confidence": number
}
欄位
property

object (TextProperty)

系統偵測到符號的其他資訊。

boundingBox

object (BoundingPoly)

符號的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。

text

string

符號的實際 UTF-8 表示法。

confidence

number

符號 OCR 結果的信賴度。範圍為 [0, 1]。

封鎖類型

OCR 識別的區塊類型 (文字、圖片等)。

列舉
UNKNOWN 不明的區塊類型。
TEXT 一般文字區塊。
TABLE 表格區塊。
PICTURE 圖片區塊。
RULER 水平/垂直線方塊。
BARCODE 條碼區塊。

圖片註解內容

如果圖片是從檔案 (例如 PDF) 產生,這則訊息會提供圖片來源的相關資訊。

JSON 表示法
{
  "uri": string,
  "pageNumber": integer
}
欄位
uri

string

用於產生圖片的檔案 URI。

pageNumber

integer

如果檔案是 PDF 或 TIFF,這個欄位會顯示用於產生圖片的檔案頁碼。