Normalizzazione

Per molti campi supportati specifici, Document AI restituisce anche un entity.normalizedValue oltre al campo estratto non elaborato ottenuto tramite il textAnchor di ogni entità. Normalizza il testo letterale. Spesso la normalizzazione suddivide il valore del testo in sottocampi.

Questi dati sono in un formato standardizzato per ridurre il post-trattamento e attivare la conversione in qualsiasi formato selezionato. Il carattere mentionText, che rappresenta ciò che è letteralmente presente nel documento, non viene mai modificato dalla normalizzazione.

I campi normalizzati appartengono a una delle seguenti categorie.

Valori normalizzati nella console

Nella console Google Cloud, i campi normalizzati sono annotati con G. Ad esempio:

arricchimento
Campo normalizzato di esempio mostrato nell'applicazione web.

Processori supportati

Di seguito sono riportati i processori e i campi che supportano l'arricchimento e la normalizzazione delle entità:

Processori Campi normalizzati

Analizzatore estratto conto bancario

Category Preaddestrati
Tipo di soluzione Prestiti
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

Analizzatore sintattico di passaporti statunitensi

Category Preaddestrati
Tipo di soluzione Identità
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analizzatore sintattico delle utenze

Category Preaddestrati
Tipo di soluzione Approvvigionamento
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Limitata
Dettagli completi del processore Voce dettagliata
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

Parser di verifica dei documenti di identità

Category Preaddestrati
Tipo di soluzione Identità
Funzioni OCR, analisi della qualità
Fase di rilascio Anteprima
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

Analizzatore busta paga

Category Preaddestrati
Tipo di soluzione Prestiti
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

Analizzatore sintattico di patenti di guida statunitensi

Category Preaddestrati
Tipo di soluzione Identità
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analizzatore sintattico delle spese

Category Preaddestrati
Tipo di soluzione Approvvigionamento
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Analizzatore sintattico delle fatture

Category Preaddestrati
Tipo di soluzione Approvvigionamento
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

Processori di estrazione

L'estrattore personalizzato supporta la normalizzazione di tutte le entità con i seguenti tipi di dati comuni di Google Cloud: dateTime, currency, money enumber.

Processori Tipi di dati normalizzati

Estrattore personalizzato

Category Estrazione
Tipo di soluzione Personalizzato
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER