此页面由 Cloud Translation API 翻译。

提取概览

Document AI 提供多种产品，可用于从文档中提取信息，以满足不同的使用场景：

表单解析器
自定义提取器，提供三种不同的模型类型：
- 基础模型
- 基于自定义模型
- 基于自定义模板
布局解析器

Form Parser

Form Parser 可提取键值对 (KVP)、表格、选择标记（复选框）和通用字段，以增强和自动化提取功能。它可以开箱即用地提取最多 11 个通用实体和复选框。您未指定要使用表单解析器提取的字段（架构）。该模型可检测并返回文档中每页的相关实体。

自定义提取器

自定义提取器可提取您在架构中定义的实体，并提供三种建模选项：基础模型、基于自定义模型的模型和基于自定义模板的模型。鉴于基础模型在几乎没有训练数据的情况下也能取得令人满意的结果，我们建议您首先考虑使用基础模型，然后根据需要尝试其他选项。基础模型基于数据集中的最多 5 个带标签的文档进行零样本到少样本预测，并基于数据集中的 10 个以上带标签的文档进行微调预测。

训练方法		文档示例	文档布局变体	自由格式文本或段落	达到可投入生产的质量所需的训练文档数量，具体取决于变异性
微调和基础模型（生成式 AI）。		合同、服务条款、账单、银行对账单、提货单、工资单。	从高到低（首选）。	高。	中：0-50 份以上文档。
自定义模型。	模型。	布局因年份或供应商而异的类似表单（例如 W9）。	低到中。	低。	高：10-100+ 个文档。
自定义模型。	模板。	具有固定布局的税务表单（例如表单 941 和 709）。	无。	低。	低（3 个文档）。

由于基础模型通常需要的训练文档较少，因此建议将其作为所有可变布局的首选方案。

布局解析器

布局解析器可将各种格式的文档转换为结构化表示形式，使段落、表格、列表等内容以及标题、页眉和页脚等结构化元素可供访问，并创建内容感知数据块，以便在各种生成式 AI 和发现应用中检索信息。

表单解析器