处理器输出示例

本页面详细介绍了 Document AI 提供的处理器生成的输出。

本页中的文件是各种结构的示例文档,以及 Document AI API 以 Document 格式提供的原始输出。

发出处理请求时,您可以使用 FieldMask 限制响应中返回的字段。

将文本数字化

处理器 输出示例

Enterprise Document OCR(光学字符识别)

类别 数字化
解决方案类型 常规
函数 光学字符识别、质量分析
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-ocr-v1.0-2020-09-23
输出 Document JSON
pretrained-ocr-v1.1-2022-09-12
输出 Document JSON
pretrained-ocr-v1.2-2022-11-10
输出 Document JSON
pretrained-ocr-v2.0-2023-06-02
输出 Document JSON
复选框提取 - Document JSON
字体检测 - Document JSON
数学 OCR - Document JSON
pretrained-ocr-v2.1-2024-08-07
输出 Document JSON
高级输出 Document JSON
pretrained-ocr-v2.1.1-2025-01-31
输出 Document JSON
高级输出 Document JSON

提取文档

处理器 输出示例

自定义提取器

类别 提取
解决方案类型 自定义
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-foundation-model-v1.0-2023-08-22
输出 Document JSON
pretrained-foundation-model-v1.1-2024-03-12
输出 Document JSON
pretrained-foundation-model-v1.2-2024-05-10
输出 Document JSON
pretrained-foundation-model-v1.3-2024-08-31
输出 Document JSON

Form Parser

类别 提取
解决方案类型 常规
函数 光学字符识别 (OCR)、表单解析、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-form-parser-v1.0-2020-09-23
输出 Document JSON
pretrained-form-parser-v2.0-2022-11-10
输出 Document JSON
pretrained-form-parser-v2.1-2023-06-26
输出 Document JSON

布局解析器

类别 提取
解决方案类型 常规
函数 布局解析、文档分块
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-layout-parser-v1.0-2024-06-03
输出 Document JSON

对文档进行分类

处理器 输出示例

自定义分类器

类别 分类
解决方案类型 自定义
函数 光学字符识别、分类
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
输出 Document JSON

自定义拆分器

类别 分类
解决方案类型 自定义
函数 光学字符识别、分类、拆分
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
输出 Document JSON

探索预训练处理器

处理器 输出示例

银行对账单解析器

类别 预先训练
解决方案类型 放款
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-bankstatement-v1.0-2021-08-08
输出 Document JSON
pretrained-bankstatement-v1.1-2021-08-13
输出 Document JSON
pretrained-bankstatement-v2.0-2021-12-10
输出 Document JSON
pretrained-bankstatement-v3.0-2022-05-16
输出 Document JSON
pretrained-bankstatement-v4.0-2023-07-31
输出 Document JSON
pretrained-bankstatement-v5.0-2023-12-06
输出 Document JSON

W2 解析器

类别 预先训练
解决方案类型 放款
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-w2-v1.0-2020-10-01
输出 Document JSON
pretrained-w2-v1.1-2022-01-27
输出 Document JSON
pretrained-w2-v1.2-2022-01-28
输出 Document JSON
pretrained-w2-v2.0-2022-03-30
输出 Document JSON
pretrained-w2-v2.1-2022-06-08
输出 Document JSON

美国护照解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-us-passport-v1.0-2021-06-14
输出 Document JSON

Utility Parser

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 受限
完整的处理器详细信息 详细条目
示例输入文件
pretrained-utility-v1.1-2021-04-09
输出 Document JSON
pretrained-utility-v1.2-2022-12-15
输出 Document JSON

身份证件证明解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别、质量分析
发布阶段 预览
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-id-proofing-v1.0-2022-10-03
输出 Document JSON
pretrained-id-proofing-v1.1-2023-05-18
输出 Document JSON
pretrained-id-proofing-v1.2-2023-10-04
输出 Document JSON

美国驾照解析器

类别 预先训练
解决方案类型 身份
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-us-driver-license-v1.0-2021-06-14
输出 Document JSON

Expense Parser

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-expense-v1.1-2021-04-09
输出 Document JSON
pretrained-expense-v1.2-2022-02-18
输出 Document JSON
pretrained-expense-v1.3-2022-07-15
输出 Document JSON
pretrained-expense-v1.3.2-2024-09-11
输出 Document JSON
pretrained-expense-v1.4-2022-11-18
输出 Document JSON
pretrained-expense-v1.4.2-2024-09-12
输出 Document JSON

账单解析器

类别 预先训练
解决方案类型 采购
函数 光学字符识别 (OCR)、实体提取
发布阶段 正式版
访问状态 公开
完整的处理器详细信息 详细条目
示例输入文件
pretrained-invoice-v1.1-2021-04-09
输出 Document JSON
pretrained-invoice-v1.2-2022-02-18
输出 Document JSON
pretrained-invoice-v1.3-2022-07-15
输出 Document JSON
pretrained-invoice-v1.4-2022-10-21
输出 Document JSON
pretrained-invoice-v1.5-2023-09-15
输出 Document JSON
pretrained-invoice-v2.0-2023-12-06
输出 Document JSON