圖片註解要求的回應。
JSON 表示法 |
---|
{ "textAnnotations": [ { object ( |
欄位 | |
---|---|
textAnnotations[] |
如果存在,表示文字 (OCR) 偵測已順利完成。 |
fullTextAnnotation |
如果顯示文字 (OCR) 偵測或文件 (OCR) 文字偵測已成功完成,這項註解提供 OCR 偵測到的文字結構階層。 |
error |
如果已設定,則代表作業的錯誤訊息。請注意,即使已設定 |
context |
如有這類資訊,請提供背景資訊,瞭解圖片來源。 |
實體註解
偵測到的實體特徵集。
JSON 表示法 |
---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
欄位 | |
---|---|
mid |
不透明的實體 ID。部分 ID 可能會顯示在 Google Knowledge Graph Search API 中。 |
locale |
實體文字 |
description |
實體的文字說明,以 |
score |
結果的整體分數。範圍為 [0, 1]。 |
confidence |
已淘汰;請改用 |
topicality |
ICA (圖片內容註解) 標籤與圖片的相關性。舉例來說,即使兩張圖片中都有高塔,但如果其中一張圖片偵測到「艾菲爾鐵塔」,「高塔」與這張圖片的關聯性可能就高於另一張圖片。範圍為 [0, 1]。 |
boundingPoly |
這個實體所屬的圖片區域。未針對 |
properties[] |
部分實體可能會有選用的使用者提供 |
BoundingPoly
偵測到的圖片註解定界多邊形。
JSON 表示法 |
---|
{ "vertices": [ { object ( |
欄位 | |
---|---|
vertices[] |
定界多邊形頂點。 |
normalizedVertices[] |
定界多邊形正規化頂點。 |
Vertex
頂點代表圖片中的 2D 點。注意:頂點座標的比例與原始圖片相同。
JSON 表示法 |
---|
{ "x": integer, "y": integer } |
欄位 | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
正規化 Vertex
頂點代表圖片中的 2D 點。注意:正規化後的頂點座標是相對於原始圖片,範圍介於 0 到 1 之間。
JSON 表示法 |
---|
{ "x": number, "y": number } |
欄位 | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
屬性
Property
包含使用者提供的名稱/值組合。
JSON 表示法 |
---|
{ "name": string, "value": string, "uint64Value": string } |
欄位 | |
---|---|
name |
房源名稱。 |
value |
屬性的值。 |
uint64Value |
數值屬性的值。 |
文字註解
TextAnnotation
包含以結構化形式表示的 OCR 擷取文字。OCR 擷取文字結構的階層如下:
TextAnnotation
-> 頁面 -> 區塊 -> 段落 -> 字詞 -> 符號
TextAnnotation.TextProperty
訊息定義。
JSON 表示法 |
---|
{
"pages": [
{
object ( |
欄位 | |
---|---|
pages[] |
OCR 偵測到的頁面清單。 |
text |
系統在網頁上偵測到 UTF-8 文字。 |
頁面
OCR 偵測到的頁面。
JSON 表示法 |
---|
{ "property": { object ( |
欄位 | |
---|---|
property |
網頁上偵測到其他資訊。 |
width |
頁面寬度。如果是 PDF,單位為點。如果是圖片 (包括 TIFF),單位是像素。 |
height |
頁面高度。如果是 PDF,單位為點。如果是圖片 (包括 TIFF),單位是像素。 |
blocks[] |
這個頁面上的文字區塊、圖片等清單。 |
confidence |
網頁上 OCR 結果的信賴度。範圍為 [0, 1]。 |
TextProperty
在結構性元件上偵測到其他資訊。
JSON 表示法 |
---|
{ "detectedLanguages": [ { object ( |
欄位 | |
---|---|
detectedLanguages[] |
偵測到的語言清單和信賴度。 |
detectedBreak |
偵測到文字片段的開頭或結尾。 |
DetectedLanguage
偵測到結構元件的語言。
JSON 表示法 |
---|
{ "languageCode": string, "confidence": number } |
欄位 | |
---|---|
languageCode |
BCP-47 語言代碼,例如「en-US」或「sr-Latn」。詳情請參閱 https://www.unicode.org/reports/tr35/#Unicode_locale_identifier。 |
confidence |
偵測到的語言的信賴度。範圍為 [0, 1]。 |
DetectedBreak
偵測到結構化元件的開頭或結尾。
JSON 表示法 |
---|
{
"type": enum ( |
欄位 | |
---|---|
type |
偵測到的中斷類型。 |
isPrefix |
如果換行符號會加在元素前面,則為 True。 |
分隔類型
以列舉方式表示找到的間斷類型。換行、空格等。
列舉 | |
---|---|
UNKNOWN |
不明的休息標籤類型。 |
SPACE |
一般空間。 |
SURE_SPACE |
確定間距 (非常寬)。 |
EOL_SURE_SPACE |
換行符號。 |
HYPHEN |
文字中沒有行尾連字號,且不會與 SPACE 、LEADER_SPACE 或 LINE_BREAK 同時出現。 |
LINE_BREAK |
結束段落的換行符號。 |
封鎖
網頁上的邏輯元素。
JSON 表示法 |
---|
{ "property": { object ( |
欄位 | |
---|---|
property |
系統偵測到該區塊的其他資訊。 |
boundingBox |
區塊的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。例如:
頂點順序仍為 (0, 1, 2, 3)。 |
paragraphs[] |
這個區塊中的段落清單 (如果這個區塊是文字類型)。 |
blockType |
這個區塊的偵測區塊類型 (文字、圖片等)。 |
confidence |
OCR 結果對區塊的信心程度。範圍為 [0, 1]。 |
段落
文字的結構單元,代表特定順序的字詞。
JSON 表示法 |
---|
{ "property": { object ( |
欄位 | |
---|---|
property |
系統偵測到段落的其他資訊。 |
boundingBox |
段落的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。 |
words[] |
這個段落中的所有字詞清單。 |
confidence |
段落 OCR 結果的信賴度。範圍為 [0, 1]。 |
Word
字詞表示法。
JSON 表示法 |
---|
{ "property": { object ( |
欄位 | |
---|---|
property |
系統偵測到該字詞的其他資訊。 |
boundingBox |
這個字的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。 |
symbols[] |
字詞中的符號清單。符號順序會遵循自然閱讀順序。 |
confidence |
這個字 OCR 結果的信賴度。範圍為 [0, 1]。 |
符號
單一符號表示法。
JSON 表示法 |
---|
{ "property": { object ( |
欄位 | |
---|---|
property |
系統偵測到符號的其他資訊。 |
boundingBox |
符號的定界框。頂點順序為左上、右上、右下、左下。如果系統偵測到邊界框旋轉,就會以左上角為中心,以「自然」方向讀取文字時定義的角度表示旋轉。舉例來說: * 文字水平時可能如下所示: 0----1 | | 3----2 * 如果文字繞左上角旋轉 180 度,會變成: 2----3 | | 1----0 頂點順序仍為 (0、1、2、3)。 |
text |
符號的實際 UTF-8 表示法。 |
confidence |
符號 OCR 結果的信賴度。範圍為 [0, 1]。 |
封鎖類型
OCR 識別的區塊類型 (文字、圖片等)。
列舉 | |
---|---|
UNKNOWN |
不明的區塊類型。 |
TEXT |
一般文字區塊。 |
TABLE |
表格區塊。 |
PICTURE |
圖片區塊。 |
RULER |
水平/垂直線方塊。 |
BARCODE |
條碼區塊。 |
圖片註解內容
如果圖片是從檔案 (例如 PDF) 產生,這則訊息會提供圖片來源的相關資訊。
JSON 表示法 |
---|
{ "uri": string, "pageNumber": integer } |
欄位 | |
---|---|
uri |
用於產生圖片的檔案 URI。 |
pageNumber |
如果檔案是 PDF 或 TIFF,這個欄位會顯示用於產生圖片的檔案頁碼。 |