このページは Cloud Translation API によって翻訳されました。

拡充

Document AI は、Enterprise Knowledge Graph を使用して、エンティティ抽出結果（サポートされているフィールドの場合）を正規化および拡充します。たとえば、123 Main St Apt 1 と 123 Main street # 1 のアドレスは、同じ標準化されたアドレスに正規化できます。

サポートされている各フィールドについて、Document AI は抽出された未加工のフィールドに加えて normalizedValue も返し、リテラルテキストを正規化します。これには、後処理を減らすために標準化された形式のデータが含まれています。

ほとんどのデータは次のいずれかのカテゴリに属します。

金額
日付
タイムスタンプ
住所
ブール値
整数
浮動小数点数

レスポンスの例

次の切り捨てられたサンプルに示すように、拡充された値は entities.normalizedValue フィールドにあります。

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

この例では、元の employer_name「Google Singapore」が「Google Asia Pacific, Singapore」に正規化されています。

Google Cloud コンソールでは、拡充および正規化されたフィールドに G というアノテーションが付けられます。次に例を示します。

エンリッチメント — ウェブアプリケーションに表示される正規化されたフィールドのサンプル。

サポートされるプロセッサ

エンティティの拡充をサポートするプロセッサとフィールドは次のとおりです。

プロセッサ拡充されたフィールド

銀行明細書パーサー

カテゴリ	トレーニング済み
ソリューションタイプ	融資
関数	OCR、エンティティ抽出
リリースステージ	一般提供
アクセスステータス	公開
プロセッサの詳細	詳細なエントリ

bank_address
bank_name

W2 パーサー

カテゴリ	トレーニング済み
ソリューションタイプ	融資
関数	OCR、エンティティ抽出
リリースステージ	一般提供
アクセスステータス	公開
プロセッサの詳細	詳細なエントリ

EmployerNameAndAddress
EIN

支払い明細パーサー

カテゴリ	トレーニング済み
ソリューションタイプ	融資
関数	OCR、エンティティ抽出
リリースステージ	一般提供
アクセスステータス	公開
プロセッサの詳細	詳細なエントリ

employer_address
employer_name

経費パーサー

カテゴリ	トレーニング済み
ソリューションタイプ	調達
関数	OCR、エンティティ抽出
リリースステージ	一般提供
アクセスステータス	公開
プロセッサの詳細	詳細なエントリ

supplier_address
supplier_name
supplier_phone

Invoice パーサー

カテゴリ	トレーニング済み
ソリューションタイプ	調達
関数	OCR、エンティティ抽出
リリースステージ	一般提供
アクセスステータス	公開
プロセッサの詳細	詳細なエントリ

supplier_address
supplier_name
supplier_phone

設定

正規化