請求書を解析する

Document AI を活用した Invoice パーサー プラグインを使用して、Cloud Data Fusion で請求書を構造化データに変換できます。構造化データは BigQuery に保存されます。

始める前に

請求書を解析するには、バージョン 6.4.1 以降で実行されている Cloud Data Fusion インスタンスが必要です。詳細については、Cloud Data Fusion インスタンスのアップグレードをご覧ください。

プロセッサの作成

  1. Google Cloud Console で、Document AI プロセッサのページに移動します。

    [プロセッサ] に移動

  2. プロセッサを作成します。プロセッサのタイプには、Invoice パーサーを選択します。

    プロセッサ タイプには、Invoice を選択します

Invoice パーサー プラグインを構成する

  1. Google Cloud Console で、Cloud Data Fusion の [Instances] ページに移動します。

    [インスタンス] に移動

  2. 目的のインスタンスがバージョン 6.4.1 以降にアップグレードされていることを確認します。以前のバージョンの場合は、インスタンスをアップグレードします。

  3. [インスタンスの表示] をクリックします。 Cloud Data Fusion UI が開きます。

  4. [Hub] をクリックします。

  5. [GCP] をクリックし、[GCP Plugins] をデプロイします。

  6. [DocAI] をクリックし、[Doc AI Plugin] をデプロイします。

  7. Invoice パーサー クイックスタート > [Create] をクリックします。

  8. Invoice パーサー プロセッサ ID、Cloud Storage バケットパス、BigQuery テーブルの詳細を入力して、パイプラインをカスタマイズします。

  9. パイプラインをデプロイして実行する

    Invoice パーサー プラグインを使用したパイプラインの例

解析された請求書は BigQuery の出力テーブルに保存されます。請求書のメタデータは Metadata テーブルに保存され、解析ステータス、Cloud Storage パス、未加工の請求書のアップロード タイムスタンプが含まれます。出力テーブルとメタデータ テーブルのレコードは、invoice_uuid キーを使用して結合できます。