处理器输出示例

本页面详细介绍了 Document AI 提供的处理器生成的输出。

本页中的文件是各种结构的示例文档,以及 Document AI API 以 Document 格式提供的原始输出。

发出处理请求时,您可以使用 FieldMask 限制响应中返回的字段。

将文本数字化

处理器 输出示例

Enterprise Document OCR(光学字符识别)

类别 数字化
解决方案类型 常规
函数 光学字符识别、质量分析
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-ocr-v1.0-2020-09-23
pretrained-ocr-v1.1-2022-09-12
pretrained-ocr-v1.2-2022-11-10
pretrained-ocr-v2.0-2023-06-02
pretrained-ocr-v2.1-2024-08-07
pretrained-ocr-v2.1.1-2025-01-31

提取文档

处理器 输出示例

Form Parser

类别 提取
解决方案类型 常规
函数 光学字符识别 (OCR)、表单解析、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-form-parser-v1.0-2020-09-23
pretrained-form-parser-v2.0-2022-11-10
pretrained-form-parser-v2.1-2023-06-26

布局解析器

类别 提取
解决方案类型 常规
函数 布局解析、文档分块
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-layout-parser-v1.0-2024-06-03

自定义提取器

类别 提取
解决方案类型 自定义
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-foundation-model-v1.0-2023-08-22
pretrained-foundation-model-v1.1-2024-03-12
pretrained-foundation-model-v1.2-2024-05-10
pretrained-foundation-model-v1.3-2024-08-31
pretrained-foundation-model-v1.4-2025-02-05

对文档进行分类

处理器 输出示例

自定义分类器

类别 分类
解决方案类型 自定义
函数 光学字符识别、分类
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件

自定义拆分器

类别 分类
解决方案类型 自定义
函数 光学字符识别、分类、拆分
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件

探索预训练处理器

处理器 输出示例

Expense Parser

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-expense-v1.1-2021-04-09
pretrained-expense-v1.2-2022-02-18
pretrained-expense-v1.3-2022-07-15
pretrained-expense-v1.3.2-2024-09-11
pretrained-expense-v1.4-2022-11-18
pretrained-expense-v1.4.2-2024-09-12

Utility Parser

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 受限
完整的处理器详细信息 详细条目
示例输入文件
pretrained-utility-v1.1-2021-04-09
pretrained-utility-v1.2-2022-12-15

W2 解析器

类别 预先训练
解决方案类型 放款
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-w2-v1.0-2020-10-01
pretrained-w2-v1.1-2022-01-27
pretrained-w2-v1.2-2022-01-28
pretrained-w2-v2.0-2022-03-30
pretrained-w2-v2.1-2022-06-08

美国护照解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-us-passport-v1.0-2021-06-14

美国驾照解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-us-driver-license-v1.0-2021-06-14

账单解析器

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-invoice-v1.1-2021-04-09
pretrained-invoice-v1.2-2022-02-18
pretrained-invoice-v1.3-2022-07-15
pretrained-invoice-v1.4-2022-10-21
pretrained-invoice-v1.5-2023-09-15
pretrained-invoice-v2.0-2023-12-06

身份证件证明解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别、质量分析
发布阶段 预览
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-id-proofing-v1.0-2022-10-03
pretrained-id-proofing-v1.1-2023-05-18
pretrained-id-proofing-v1.2-2023-10-04

银行对账单解析器

类别 预先训练
解决方案类型 放款
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-bankstatement-v1.0-2021-08-08
pretrained-bankstatement-v1.1-2021-08-13
pretrained-bankstatement-v2.0-2021-12-10
pretrained-bankstatement-v3.0-2022-05-16
pretrained-bankstatement-v4.0-2023-07-31
pretrained-bankstatement-v5.0-2023-12-06