Document AI を活用した Invoice パーサー プラグインを使用して、Cloud Data Fusion で請求書を構造化データに変換できます。構造化データは BigQuery に保存されます。
始める前に
請求書を解析するには、バージョン 6.4.1 以降で実行されている Cloud Data Fusion インスタンスが必要です。詳細については、Cloud Data Fusion インスタンスのアップグレードをご覧ください。
プロセッサの作成
Google Cloud コンソールで、Document AI の [プロセッサ] ページに移動します。
プロセッサを作成します。プロセッサのタイプには、Invoice パーサーを選択します。
Invoice パーサー プラグインを構成する
Google Cloud コンソールで、Cloud Data Fusion の [インスタンス] ページに移動します。
目的のインスタンスがバージョン 6.4.1 以降にアップグレードされていることを確認します。以前のバージョンの場合は、インスタンスをアップグレードします。
[インスタンスの表示] をクリックします。 Cloud Data Fusion UI が開きます。
[Hub] をクリックします。
[GCP] をクリックし、[GCP Plugins] をデプロイします。
[DocAI] をクリックし、[Doc AI Plugin] をデプロイします。
Invoice パーサー クイックスタート > [Create] をクリックします。
Invoice パーサー プロセッサ ID、Cloud Storage バケットパス、BigQuery テーブルの詳細を入力して、パイプラインをカスタマイズします。
パイプラインをデプロイして実行する
解析された請求書は BigQuery の出力テーブルに保存されます。請求書のメタデータは Metadata
テーブルに保存され、解析ステータス、Cloud Storage パス、未加工の請求書のアップロード タイムスタンプが含まれます。出力テーブルとメタデータ テーブルのレコードは、invoice_uuid
キーを使用して結合できます。