Form Parser でドキュメントを処理する

Form パーサーは、Key-Value ペア(KVP)、表、選択マーク(チェックボックスなど)、汎用フィールド、テキストを抽出して、ドキュメント処理を拡張し、自動化します。

フォーム パーサーは、次のようなユースケースで他のパーサーよりも適しています。

  • 構造化フォームの処理: name: __ など、入力するラベル付きの空白がある従来のフォームのように見える、明確に定義されたフォームから KVP を抽出できます。Form パーサーの事前トレーニング済みモデルは、名前、日付、住所などの一般的なフィールドで高い精度を提供します。
  • 柔軟なテーブル抽出が必要な場合: Form パーサーは、テーブルのように見える単純な(行または列にまたがるセルがない)テーブルから抽出します。トレーニングは必要ありません(また、不可能です)。トレーニング済みのテーブル抽出では、列(セル)の子フィールドを含む親フィールドでカスタム抽出ツールを使用できます。
  • 効率性が必要: 特に大量のさまざまな抽出タスクの場合は、抽出パーサーの構築とメンテナンスは避けてください。

データ抽出機能

Form パーサーの機能は次のとおりです。

  • KVP: ドキュメント内の 2 つのアイテム(ラベルまたはキーと、対応するデータ(値))のセットです。KVP を直接使用することも(キーが一致する場合)、カスタム ロジックを構築してさまざまなキーを解決し、一貫した構造化された情報にすることもできます。

  • 汎用エンティティ: ドキュメントから 11 種類のフィールドを解析します。これには次のものが含まれます。

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • テキストとレイアウト: 最新の OCR エンジンを使用して、テキストとレイアウト情報を抽出します。これには、デジタル PDF の埋め込みテキスト(v2.1 のみ)や画像のテキストが含まれます。

  • 表: 画像と PDF から表を検出して抽出します。

  • チェックボックス: 高品質の選択マーク検出機能。画像と PDF 出力からチェックボックスを KVP として抽出します。チェックボックスに最も近いテキストを使用して、チェックボックスがオンかオフかを示す valueType を付加します。

言語と地域

  • Form Parser 2.0 は 200 を超える言語をサポートしています。詳細
  • この機能は 8 つのリージョンでサポートされています。詳細

モデル バージョン

この機能に対応しているプロセッサのバージョンは次のとおりです。詳細については、プロセッサ バージョンの管理をご覧ください。

制限事項

  • TIFF の以前の JPEG 圧縮はサポートされていません。TIFF バージョン 6.0 仕様で定義されている JPEG カプセル化のタイプ。

  • チェックボックス モデルはラジオボタンの解析をサポートしていません。検出されたチェックボックスに、対応するキーがない場合があります。

  • モデルは、空のフォームなど、値が入力されていない KVP を正確に解析しません。

  • 一部の言語のドキュメントの KVP 解析では、ラテン系言語よりも品質が低下する場合があります。

Form Parser でドキュメントを処理する

このクイックスタートでは、Document AI の Form Parser 機能について説明します。このクイックスタートでは、Google Cloud コンソールを使用して Google Cloud プロジェクトと承認を設定し、Form Parser を作成して、Document AI に PDF フォームの処理をリクエストします。

学習内容:

  1. Google Cloud プロジェクトで Document AI を有効にします。

  2. Form パーサー プロセッサを作成します。このプロセッサで、さまざまな種類のドキュメント内のテキスト、Key-Value ペア、テーブル、汎用エンティティを識別し、抽出することができます。

  3. このプロセッサを使用して、サンプル ドキュメントにアノテーションを付けます。


このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、[ガイドを表示] をクリックしてください。

ガイドを表示


  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Enable the API

Form Parser プロセッサを作成する

Google Cloud コンソールを使用して Form Parser プロセッサを作成します。詳細については、プロセッサの作成と管理をご覧ください。

  1. Google Cloud コンソールのナビゲーション メニューで [Document AI] をクリックし、[プロセッサ ギャラリー] を選択します。

    プロセッサ ギャラリー

  2. [プロセッサ ギャラリー] で、[Form パーサー] を検索して [作成] を選択します。

    UI の Form パーサー オプション

  3. サイド ウィンドウで、[プロセッサ名] に「quickstart-form-processor」などを入力します。

  4. 最も近いリージョンを選択します。

  5. [作成] ボタンをクリックします。

新しいフォーム パーサー プロセッサの [プロセッサの詳細] ページが表示されます。

プロセッサをテストする

プロセッサを作成したら、作成したプロセッサに対してアノテーション リクエストを送信できます。

  1. サンプル ドキュメントをダウンロードします

    手書きの医療用登録フォームのサンプルを含む PDF ファイルです。このドキュメントは、一般公開されている Cloud Storage バケットに保存されています。

  2. [テスト ドキュメントをアップロード] ボタンをクリックし、ダウンロードしたドキュメントを選択します。

  3. [Form パーサー分析] ページが表示されます。OCR で検出されたテキスト、Key-Value ペア、テーブル、ドキュメントから抽出された汎用エンティティが表示されます。

    UI に表示される Form の Key-Value ペアの例 UI に表示される Form の汎用エンティティの例

クリーンアップ

不要な Google Cloud 料金が発生しないようにするには、Google Cloud コンソールを使用して、不要なプロセッサやプロジェクトを削除します。

次のステップ