查看 Application Integration 支持的连接器

Doc AI - 批处理任务

借助 Doc AI - 批处理任务,您可以向 Document AI 处理器发送单个批量(异步)请求来处理多个文档。然后,Document AI 会启动长时间运行的操作 (LRO) 并将处理后的结果存储在 Cloud Storage 存储桶中。Document AI 处理器是一个 Cloud Document AI 组件,用于执行不同的文档处理操作,例如文档分类、拆分、解析或分析。

Cloud Document AI 是一项 Google Cloud 服务,可让您使用先进的 Google AI(例如自然语言、计算机视觉、翻译和 AutoML)来解析非结构化或半结构化文档中的结构化信息。

准备工作

在配置 Doc AI - 批处理任务之前,请确保在您的 Google Cloud 项目中执行以下任务:

  1. 启用 Cloud Document AI API (documentai.googleapis.com)。

    启用 Cloud Document AI API

  2. 创建身份验证配置文件。应用集成会使用身份验证配置文件连接到身份验证端点以完成 Doc AI - 批处理任务。

配置 Doc AI - 批处理任务

  1. 在 Google Cloud 控制台中,前往 Application Integration 页面。

    转到 Application Integration

  2. 在导航菜单中,点击集成

    系统随即会显示集成页面,其中列出了 Google Cloud 项目中可用的所有集成。

  3. 选择现有集成,或点击创建集成以创建新的集成。

    要创建新的集成,请执行以下操作:

    1. 创建集成窗格中输入名称和说明。
    2. 选择集成的区域。
    3. 选择用于集成的服务账号。您随时可以在集成工具栏的 集成摘要窗格中更改或更新集成的服务账号详细信息。
    4. 点击创建

    系统随即会在集成编辑器中打开该集成。

  4. 集成编辑器导航栏中,点击任务以查看可用任务和连接器的列表。
  5. 点击 Doc AI - Batch Process(Doc AI - 批处理)元素,并将其放置到集成编辑器中。
  6. 点击设计器上的 Doc AI - Batch Process(Doc AI - 批处理)元素以查看 Doc AI - Batch Process(Doc AI - 批处理)任务配置窗格。
  7. 前往身份验证,然后选择您要使用的现有身份验证配置文件。

    可选。如果您在配置此任务之前未创建身份验证配置文件,请点击 + New authentication profile(+ 新建身份验证配置文件),然后按照创建新的身份验证配置文件中所述的步骤操作。

  8. 前往 Task Input(任务输入),然后使用以下任务输入参数表配置显示的输入字段。

    系统会自动保存对输入字段的更改。

任务输入参数

下表介绍了 Doc AI - 批处理任务的输入参数:

属性 数据类型 说明
区域 字符串 处理器的 Cloud Document AI 位置。例如:us - 美国。
ProjectsId 字符串 您的 Google Cloud 项目 ID。
ProcessorsId字符串 自定义处理器的 ID。
请求 JSON 请参阅请求 JSON 结构

任务输出

Doc AI - 批处理任务会返回长时间运行的操作 (LRO) 的名称,类似于以下示例输出:

{
    "name": "projects/[PROJECT_ID]/locations/[LOCATION]/operations/[OPERATION_ID]"
}

错误处理策略

任务的错误处理策略指定当任务因暂时性错误而失败时要执行的操作。如需了解如何使用错误处理策略,以及了解不同类型的错误处理策略,请参阅错误处理策略

配额和限制

如需了解配额和限制,请参阅配额和限制

后续步骤