Normalisasi

Untuk banyak kolom tertentu yang didukung, Document AI juga menampilkan entity.normalizedValue selain kolom mentah yang diekstrak yang diperoleh melalui textAnchor dari setiap entitas. Fungsi ini menormalisasi teks literal. Normalisasi sering kali membagi nilai teks menjadi sub-kolom.

File ini berisi data dalam format standar untuk mengurangi pemrosesan pasca-pemrosesan, dan memungkinkan konversi ke format apa pun yang dipilih. mentionText, yang mewakili apa yang secara harfiah ada di dokumen, tidak pernah diubah oleh normalisasi.

Kolom yang dinormalisasi termasuk dalam salah satu kategori berikut.

Nilai yang dinormalisasi di konsol

Di konsol Google Cloud, kolom yang dinormalisasi dianotasi dengan G. Contoh:

pengayaan
Contoh kolom yang dinormalisasi yang ditampilkan di aplikasi web.

Prosesor yang didukung

Berikut adalah pemroses dan kolom yang mendukung pengayaan dan normalisasi entity:

Prosesor Kolom yang dinormalisasi

Parser Laporan Mutasi Bank

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

Parser Paspor Amerika Serikat

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • Date Of Birth
  • Expiration Date
  • Issue Date

Parser Utilitas

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Terbatas
Detail prosesor lengkap Entri mendetail
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

Parser Pemeriksaan Dokumen Identitas

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Analisis Kualitas
Tahap rilis Pratinjau
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

Parser Slip Gaji

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

Parser surat izin mengemudi (SIM) Amerika Serikat

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • Date Of Birth
  • Expiration Date
  • Issue Date

Parser Pengeluaran

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Parser Invoice

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

Pemroses ekstraksi

Ekstraktor kustom mendukung normalisasi semua entitas dengan jenis data umum berikut Google Cloud: dateTime, currency, money, dan number.

Prosesor Jenis data yang dinormalisasi

Pengekstrak Kustom

Kategori Ekstrak
Jenis solusi Kustom
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail prosesor lengkap Entri mendetail
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER