Form Parser でドキュメントを処理する
Form パーサーは、Key-Value ペア(KVP)、表、選択マーク(チェックボックスなど)、汎用フィールド、テキストを抽出して、ドキュメント処理を拡張し、自動化します。
フォーム パーサーは、次のようなユースケースで他のパーサーよりも適しています。
- 構造化フォームの処理:
name: __
など、入力するラベル付きの空白がある従来のフォームのように見える、明確に定義されたフォームから KVP を抽出できます。Form パーサーの事前トレーニング済みモデルは、名前、日付、住所などの一般的なフィールドで高い精度を提供します。 - 柔軟なテーブル抽出が必要な場合: Form パーサーは、テーブルのように見える単純な(行または列にまたがるセルがない)テーブルから抽出します。トレーニングは必要ありません(また、不可能です)。トレーニング済みのテーブル抽出では、列(セル)の子フィールドを含む親フィールドでカスタム抽出ツールを使用できます。
- 効率性が必要: 特に大量のさまざまな抽出タスクの場合は、抽出パーサーの構築とメンテナンスは避けてください。
データ抽出機能
Form パーサーの機能は次のとおりです。
KVP: ドキュメント内の 2 つのアイテム(ラベルまたはキーと、対応するデータ(値))のセットです。KVP を直接使用することも(キーが一致する場合)、カスタム ロジックを構築してさまざまなキーを解決し、一貫した構造化された情報にすることもできます。
汎用エンティティ: ドキュメントから 11 種類のフィールドを解析します。これには次のものが含まれます。
email
phone
url
date_time
address
person
organization
quantity
price
id
page_number
テキストとレイアウト: 最新の OCR エンジンを使用して、テキストとレイアウト情報を抽出します。これには、デジタル PDF の埋め込みテキスト(v2.1 のみ)や画像のテキストが含まれます。
表: 画像と PDF から表を検出して抽出します。
チェックボックス: 高品質の選択マーク検出機能。画像と PDF 出力からチェックボックスを KVP として抽出します。チェックボックスに最も近いテキストを使用して、チェックボックスがオンかオフかを示す
valueType
を付加します。
言語と地域
モデル バージョン
この機能に対応しているプロセッサのバージョンは次のとおりです。詳細については、プロセッサ バージョンの管理をご覧ください。
制限事項
TIFF の以前の JPEG 圧縮はサポートされていません。TIFF バージョン 6.0 仕様で定義されている JPEG カプセル化のタイプ。
チェックボックス モデルはラジオボタンの解析をサポートしていません。検出されたチェックボックスに、対応するキーがない場合があります。
モデルは、空のフォームなど、値が入力されていない KVP を正確に解析しません。
一部の言語のドキュメントの KVP 解析では、ラテン系言語よりも品質が低下する場合があります。
Form Parser でドキュメントを処理する
このクイックスタートでは、Document AI の Form Parser 機能について説明します。このクイックスタートでは、Google Cloud コンソールを使用して Google Cloud プロジェクトと承認を設定し、Form Parser を作成して、Document AI に PDF フォームの処理をリクエストします。
学習内容:
Google Cloud プロジェクトで Document AI を有効にします。
Form パーサー プロセッサを作成します。このプロセッサで、さまざまな種類のドキュメント内のテキスト、Key-Value ペア、テーブル、汎用エンティティを識別し、抽出することができます。
このプロセッサを使用して、サンプル ドキュメントにアノテーションを付けます。
このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、[ガイドを表示] をクリックしてください。
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Document AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Document AI API.
Form Parser プロセッサを作成する
Google Cloud コンソールを使用して Form Parser プロセッサを作成します。詳細については、プロセッサの作成と管理をご覧ください。
Google Cloud コンソールのナビゲーション メニューで [Document AI] をクリックし、[プロセッサ ギャラリー] を選択します。
[プロセッサ ギャラリー] で、[Form パーサー] を
検索 して [作成] を選択します。サイド ウィンドウで、[プロセッサ名] に「
quickstart-form-processor
」などを入力します。最も近いリージョンを選択します。
[作成] ボタンをクリックします。
新しいフォーム パーサー プロセッサの [プロセッサの詳細] ページが表示されます。
プロセッサをテストする
プロセッサを作成したら、作成したプロセッサに対してアノテーション リクエストを送信できます。
-
手書きの医療用登録フォームのサンプルを含む PDF ファイルです。このドキュメントは、一般公開されている Cloud Storage バケットに保存されています。
[
テスト ドキュメントをアップロード ] ボタンをクリックし、ダウンロードしたドキュメントを選択します。[Form パーサー分析] ページが表示されます。OCR で検出されたテキスト、Key-Value ペア、テーブル、ドキュメントから抽出された汎用エンティティが表示されます。
クリーンアップ
不要な Google Cloud 料金が発生しないようにするには、Google Cloud コンソールを使用して、不要なプロセッサやプロジェクトを削除します。
次のステップ
- プロセッサ リストを確認します。