Document AI を活用した Invoice パーサー プラグインを使用して、Cloud Data Fusion で請求書を構造化データに変換できます。構造化データは BigQuery に保存されます。
始める前に
請求書を解析するには、バージョン 6.4.1 以降で実行されている Cloud Data Fusion インスタンスが必要です。詳細については、Cloud Data Fusion インスタンスのアップグレードをご覧ください。
プロセッサの作成
Google Cloud Console で、Document AI プロセッサのページに移動します。
プロセッサを作成します。プロセッサのタイプには、Invoice パーサーを選択します。
Invoice パーサー プラグインを構成する
Google Cloud Console で、Cloud Data Fusion の [Instances] ページに移動します。
目的のインスタンスがバージョン 6.4.1 以降にアップグレードされていることを確認します。以前のバージョンの場合は、インスタンスをアップグレードします。
[インスタンスの表示] をクリックします。 Cloud Data Fusion UI が開きます。
[Hub] をクリックします。
[GCP] をクリックし、[GCP Plugins] をデプロイします。
[DocAI] をクリックし、[Doc AI Plugin] をデプロイします。
Invoice パーサー クイックスタート > [Create] をクリックします。
Invoice パーサー プロセッサ ID、Cloud Storage バケットパス、BigQuery テーブルの詳細を入力して、パイプラインをカスタマイズします。
パイプラインをデプロイして実行する
解析された請求書は BigQuery の出力テーブルに保存されます。請求書のメタデータは Metadata
テーブルに保存され、解析ステータス、Cloud Storage パス、未加工の請求書のアップロード タイムスタンプが含まれます。出力テーブルとメタデータ テーブルのレコードは、invoice_uuid
キーを使用して結合できます。