Doc AI - 批处理任务

借助 Doc AI - 批处理任务,您可以向 Document AI 处理器发送单个批量(异步)请求来处理多个文档。然后,Document AI 会启动长时间运行的操作 (LRO) 并将处理后的结果存储在 Cloud Storage 存储桶中。Document AI 处理器是一个 Cloud Document AI 组件,用于执行不同的文档处理操作,例如文档分类、拆分、解析或分析。

Cloud Document AI 是一项 Google Cloud 服务,可让您使用先进的 Google AI(例如自然语言、计算机视觉、翻译和 AutoML)来解析非结构化或半结构化文档中的结构化信息。

准备工作

在配置 Doc AI - 批处理任务之前,请确保在您的 Google Cloud 项目中执行以下任务:

  1. 启用 Cloud Document AI API (documentai.googleapis.com)。

    启用 Cloud Document AI API

  2. 创建身份验证配置文件。Apigee Integration 会使用身份验证配置文件连接到身份验证端点以完成 Doc AI - 批处理任务。

配置 Doc AI - 批处理任务

  1. Apigee 界面中,选择您的 Apigee 组织
  2. 点击开发 > 集成
  3. 选择现有集成,或通过点击创建集成来创建新集成。

    要创建新的集成,请执行以下操作:

    1. 创建 Integrations对话框中输入名称和说明。
    2. 从支持的区域列表中选择集成的区域
    3. 点击创建

    这将在集成设计器中打开集成。

  4. 集成设计器导航栏中,点击 + 添加任务/触发器 > 任务以查看可用任务列表。
  5. 点击 Doc AI - Batch Process(Doc AI - 批处理)元素,并将其放置到集成设计器中。
  6. 点击设计器上的 Doc AI - Batch Process(Doc AI - 批处理)元素以查看 Doc AI - Batch Process(Doc AI - 批处理)任务配置窗格。
  7. 前往身份验证,然后选择您要使用的现有身份验证配置文件。

    可选。如果您在配置此任务之前未创建身份验证配置文件,请点击 + New authentication profile(+ 新建身份验证配置文件),然后按照创建新的身份验证配置文件中所述的步骤操作。

  8. 前往 Task Input(任务输入),然后使用以下任务输入参数表配置显示的输入字段。

    系统会自动保存对输入字段的更改。

任务输入参数

下表介绍了 Doc AI - 批处理任务的输入参数:

属性 数据类型 说明
区域 字符串 处理器的 Cloud Document AI 位置。例如:us - 美国。
ProjectsId 字符串 您的 Google Cloud 项目 ID。
ProcessorsId字符串 自定义处理器的 ID。
请求 JSON 请参阅请求 JSON 结构

任务输出

Doc AI - 批处理任务会返回长时间运行的操作 (LRO) 的名称,类似于以下示例输出:

{
    "name": "projects/[PROJECT_ID]/locations/[LOCATION]/operations/[OPERATION_ID]"
}

错误处理策略

任务的错误处理策略指定当任务因暂时性错误而失败时要执行的操作。如需了解如何使用错误处理策略,以及了解不同类型的错误处理策略,请参阅错误处理策略

后续步骤

  1. 添加边缘和边缘条件
  2. 测试并发布您的集成。
  3. 配置触发器
  4. 添加数据映射任务
  5. 查看 Google Cloud 服务的所有任务