Pengayaan
Document AI menggunakan Enterprise Knowledge Graph untuk menormalisasi dan
memperkaya hasil ekstraksi entitas (untuk kolom yang didukung). Misalnya, alamat
123 Main St Apt 1
dan 123 Main street # 1
dapat dinormalisasi ke alamat standar
yang sama.
Untuk setiap kolom yang didukung, Document AI juga menampilkan normalizedValue
selain kolom mentah yang diekstrak, yang menormalisasi teks literal.
File ini berisi data dalam format standar untuk mengurangi pascapemrosesan.
Sebagian besar data termasuk dalam salah satu kategori berikut:
- Money
- Tanggal
- Stempel waktu
- Alamat
- Boolean
- Bilangan bulat
- Float
Contoh respons
Nilai yang diperkaya dapat ditemukan di kolom
entities.normalizedValue
seperti yang ditunjukkan dalam contoh yang terpotong berikut:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
Dalam contoh, employer_name
asli "Google Singapore" telah
dinormalisasi menjadi "Google Asia Pacific, Singapore".
Di konsol Google Cloud, kolom yang diperkaya dan dinormalisasi dianotasi dengan G. Contoh:
Prosesor yang didukung
Berikut adalah pemroses dan kolom yang mendukung pengayaan entitas.
Prosesor | Kolom yang diperkaya | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Parser Laporan Mutasi Bank
|
|
||||||||||||
Parser W2
|
|
||||||||||||
Parser Slip Gaji
|
|
||||||||||||
Parser Pengeluaran
|
|
||||||||||||
Parser Invoice
|
|