解析账单

您可以使用由 Document AI 提供技术支持的 Invoice Parser 插件,在 Cloud Data Fusion 中将账单转换为结构化数据。结构化数据存储在 BigQuery 中。

准备工作

要解析账单,您需要一个在 6.4.1 版或更高版本中运行的 Cloud Data Fusion 实例。如需了解详情,请参阅升级 Cloud Data Fusion 实例

创建处理器

  1. 在 Google Cloud 控制台中,前往 Document AI 处理器页面。

    转到“处理器”

  2. 创建处理器。选择账单解析器作为处理器类型。

    选择 Invoice Parser 作为处理器类型

配置账单解析器插件

  1. 在 Google Cloud 控制台中,转到 Cloud Data Fusion 实例页面。

    转到实例

  2. 确保所需实例已升级到 6.4.1 或更高版本。对于更低的版本,请升级实例

  3. 点击查看实例。 此时会打开 Cloud Data Fusion 界面。

  4. 点击 Hub

  5. 点击 GCP,然后部署 GCP 插件

  6. 点击 DocAI,然后部署 Doc AI 插件

  7. 点击 Invoice Parser 快速入门 > 创建

  8. 通过输入 Invoice Parser 处理器 ID、Cloud Storage 存储桶路径和 BigQuery 表详细信息来自定义流水线。

  9. 部署并运行流水线。

    使用 Invoice Parser 插件的流水线示例

解析后的账单存储在 BigQuery 的输出表中。 账单中的元数据存储在 Metadata 表中,并包括原始账单的解析状态、Cloud Storage 路径和上传时间戳。输出和元数据表中的记录可以使用 invoice_uuid 键进行联接。