Normalization

Pour de nombreux champs spécifiques acceptés, Document AI renvoie également un entity.normalizedValue en plus du champ brut extrait obtenu via le textAnchor de chaque entité. Elle normalise le texte littéral. La normalisation divise souvent la valeur du texte en sous-champs.

Il contient les données dans un format standardisé pour réduire le post-traitement et permettre la conversion au format sélectionné. La valeur mentionText, qui représente le contenu littéral du document, n'est jamais modifiée par la normalisation.

Les champs normalisés appartiennent à l'une des catégories suivantes.

Valeurs normalisées dans la console

Dans la console Google Cloud , les champs normalisés sont annotés avec G. Exemple :

enrichissement
Exemple de champ normalisé affiché dans l'application Web.

Processeurs compatibles

Voici les processeurs et les champs compatibles avec l'enrichissement et la normalisation des entités :

Processeurs Champs normalisés

Analyseur de relevés bancaires

Catégorie Pré-entraînés
Type de solution Prêts
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

Analyseur de passeports américains

Catégorie Pré-entraînés
Type de solution Identité
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analyseur de fournisseurs d'énergie

Catégorie Pré-entraînés
Type de solution Approvisionnement
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Limité
Informations détaillées sur le processeur Entrée détaillée
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

Analyseur de vérification de documents d'identité

Catégorie Pré-entraînés
Type de solution Identité
Fonctions OCR, analyse de la qualité
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

Analyseur de bulletins de salaire

Catégorie Pré-entraînés
Type de solution Prêts
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

Analyseur de permis de conduire américains

Catégorie Pré-entraînés
Type de solution Identité
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analyseur de dépenses

Catégorie Pré-entraînés
Type de solution Approvisionnement
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Analyseur de factures

Catégorie Pré-entraînés
Type de solution Approvisionnement
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

Processeurs d'extraction

L'extracteur personnalisé permet de normaliser toutes les entités avec les types de données courants suivants : dateTime, currency, money et number. Google Cloud

Processeurs Types de données normalisés

Extracteur personnalisé

Catégorie Extraction
Type de solution Personnalisé
Fonctions OCR, extraction d'entités
Phase de version Disponibilité générale
État de l'accès Publique
Informations détaillées sur le processeur Entrée détaillée
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER