Document AI 會使用 Enterprise Knowledge Graph,正規化及充實實體擷取結果 (適用於支援的欄位)。舉例來說,地址 123 Main St Apt 1
和 123 Main street # 1
可以正規化為相同的標準化地址。
除了原始擷取的欄位外,Document AI 也會針對每個支援的欄位傳回 normalizedValue
,並將字面文字正規化。這項資料採用標準化格式,可減少後續處理作業。
大多數資料屬於下列其中一個類別:
- 金額
- 日期
- 時間戳記
- 地址
- 布林值
- 整數
- 浮點值
回應範例
您可以在 entities.normalizedValue
欄位中找到經過擴充的值,如下列截斷的範例所示:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
在範例中,原始的「Google Singapore」employer_name
已正規化為「Google Asia Pacific, Singapore」。
在 Google Cloud 控制台中,經過擴充和正規化的欄位會標示 G。例如:

支援的處理器
以下是支援實體擴充功能的處理器和欄位。
處理器 | 經過補充的欄位 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
銀行對帳單剖析器
|
|
||||||||||||
W-2 表單剖析器
|
|
||||||||||||
薪資單剖析器
|
|
||||||||||||
費用剖析器
|
|
||||||||||||
應付憑據剖析器
|
|