正規化

サポートされている多くの特定のフィールドの場合、Document AI は、各エンティティの textAnchor から取得した未加工の抽出フィールドに加えて、entity.normalizedValue も返します。リテラル テキストを正規化します。多くの場合、正規化によりテキスト値がサブフィールドに分割されます。

標準化された形式でデータが含まれるため、後処理を減らし、選択した形式への変換を可能にします。ドキュメントに実際に存在するものを表す mentionText は、正規化によって変更されることはありません。

正規化されたフィールドは、次のいずれかのカテゴリに属します。

コンソールの正規化された値

Google Cloud コンソールで、正規化されたフィールドには G というアノテーションが付けられます。次に例を示します。

拡充
ウェブ アプリケーションに表示される標準化されたフィールドの例。

サポートされるプロセッサ

エンティティの拡充と正規化をサポートするプロセッサとフィールドは次のとおりです。

プロセッサ 正規化されたフィールド

銀行明細書パーサー

カテゴリ トレーニング済み
ソリューション タイプ 融資
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

米国パスポート パーサー

カテゴリ トレーニング済み
ソリューション タイプ ID
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • Date Of Birth
  • Expiration Date
  • Issue Date

光熱費パーサー

カテゴリ トレーニング済み
ソリューション タイプ 調達
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 制限付き
プロセッサの詳細 詳細なエントリ
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

身分証明書パーサー

カテゴリ トレーニング済み
ソリューション タイプ ID
関数 OCR、品質分析
リリース ステージ プレビュー
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

支払い明細パーサー

カテゴリ トレーニング済み
ソリューション タイプ 融資
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

米国運転免許証パーサー

カテゴリ トレーニング済み
ソリューション タイプ ID
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • Date Of Birth
  • Expiration Date
  • Issue Date

経費パーサー

カテゴリ トレーニング済み
ソリューション タイプ 調達
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Invoice パーサー

カテゴリ トレーニング済み
ソリューション タイプ 調達
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

抽出プロセッサ

カスタム エクストラクタは、次の一般的なデータ型( Google ClouddateTimecurrencymoneynumber)を持つすべてのエンティティの正規化をサポートしています。

プロセッサ 正規化されたデータ型

カスタム エクストラクタ

カテゴリ 抽出
ソリューション タイプ カスタム
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
プロセッサの詳細 詳細なエントリ
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER