Pengayaan

Document AI menggunakan Enterprise Knowledge Graph untuk menormalisasi dan memperkaya hasil ekstraksi entitas (untuk kolom yang didukung). Misalnya, alamat 123 Main St Apt 1 dan 123 Main street # 1 dapat dinormalisasi ke alamat standar yang sama.

Untuk setiap kolom yang didukung, Document AI juga menampilkan normalizedValue selain kolom mentah yang diekstrak, yang menormalisasi teks literal. File ini berisi data dalam format standar untuk mengurangi pascapemrosesan.

Sebagian besar data termasuk dalam salah satu kategori berikut:

  • Money
  • Tanggal
  • Stempel waktu
  • Alamat
  • Boolean
  • Bilangan bulat
  • Float

Contoh respons

Nilai yang diperkaya dapat ditemukan di kolom entities.normalizedValue seperti yang ditunjukkan dalam contoh yang terpotong berikut:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

Dalam contoh, employer_name asli "Google Singapore" telah dinormalisasi menjadi "Google Asia Pacific, Singapore".

Di konsol Google Cloud, kolom yang diperkaya dan dinormalisasi dianotasi dengan G. Contoh:

pengayaan
Contoh kolom yang dinormalisasi yang ditampilkan di aplikasi web.

Prosesor yang didukung

Berikut adalah pemroses dan kolom yang mendukung pengayaan entitas.

Prosesor Kolom yang diperkaya

Parser Laporan Mutasi Bank

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • bank_address
  • bank_name

Parser W2

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • EmployerNameAndAddress
  • EIN

Parser Slip Gaji

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • employer_address
  • employer_name

Parser Pengeluaran

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • supplier_address
  • supplier_name
  • supplier_phone

Parser Invoice

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • supplier_address
  • supplier_name
  • supplier_phone