Document AI menggunakan Enterprise Knowledge Graph untuk menormalisasi dan memperkaya hasil ekstraksi entitas (untuk kolom yang didukung). Misalnya, alamat
123 Main St Apt 1
dan 123 Main street # 1
dapat dinormalisasi ke alamat standar yang sama.
Untuk setiap kolom yang didukung, Document AI juga menampilkan normalizedValue
selain kolom yang diekstrak mentah, yang menormalisasi teks literal.
Objek ini berisi data dalam format standar untuk mengurangi pasca-pemrosesan.
Sebagian besar data termasuk dalam salah satu kategori berikut:
- Uang
- Tanggal
- Stempel waktu
- Alamat
- Boolean
- Bilangan bulat
- Float
Contoh respons
Nilai yang diperkaya dapat ditemukan di kolom
entities.normalizedValue
seperti yang ditunjukkan dalam contoh yang dipangkas berikut:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
Dalam contoh, employer_name
"Google Singapore" asli telah dinormalisasi menjadi "Google Asia Pacific, Singapore".
Di konsol Google Cloud , kolom yang telah di-enrich dan dinormalisasi diberi anotasi G. Contoh:

Prosesor yang didukung
Berikut adalah prosesor dan kolom yang mendukung pengayaan entitas.
Prosesor | Kolom yang diperkaya | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Parser Laporan Mutasi Bank
|
|
||||||||||||
Parser W2
|
|
||||||||||||
Parser Slip Gaji
|
|
||||||||||||
Parser Pengeluaran
|
|
||||||||||||
Parser Invoice
|
|