预训练模型概览

Document AI 提供多种产品,可针对不同的使用场景处理文档以提取信息。

预训练解析器

如需了解详情,请参阅探索预训练处理器

银行对账单解析器

银行对账单解析器会提取键值对 (KVP)。它最多可以提取 17 个通用实体。例如:账号、客户姓名、银行名称以及存款和取款等表格项。您未指定要提取的字段(架构)。银行对账单解析器支持丰富规范化

W2 解析器

W2 解析器会以 KVP 的形式从 IRS 表单 W2 中提取数据。它最多可以提取 12 个通用实体,包括员工姓名、社会保障号、雇主和工资。您未指定要提取的字段(架构)。W2 解析器支持丰富

美国护照解析器

美国护照解析器会提取 KVP。它最多可以提取七个通用实体。这些信息包括名字、姓氏、证件 ID 和出生日期。您未指定要提取的字段(架构)。美国护照解析器支持规范化

实用程序解析器

实用程序解析器会提取 KVP。它最多可从公共事业缴费单中提取 75 个通用实体。这些信息包括供应商名称、先前的付款金额,以及金额、说明、商品代码和数量等订单项。您未使用实用程序解析器指定要提取的字段(架构)。

身份证件校对解析器

身份证件校验解析器使用多个信号预测身份证件的有效性。

  • fraud_signals_is_identity_document 检测:预测图片中是否包含已识别出的身份证件。
  • fraud_signals_suspicious_words 检测:预测 ID 中是否存在不常见的字词。
  • fraud_signals_image_manipulation 检测:预测图片是否使用图片编辑工具进行过修改或篡改。
  • fraud_signals_online_duplicate 检测:预测图片是否可以在网上找到(仅限美国)。

付款单解析器

付款单解析器会提取 KVP。它最多可从工资条中提取 26 个通用实体。这些信息包括员工姓名、奖金、佣金、加班费和发薪日期。 您未指定要提取的字段(架构)。工资条解析器支持丰富标准化

美国驾照解析器

美国驾照解析器会提取 KVP。它最多可从驾照中提取八个通用实体。例如:名字、姓氏、证件 ID 和到期日期。您未指定要提取的字段(架构)。美国驾照解析器支持标准化

费用解析器

费用解析器会提取 KVP。它最多可从支出报告中提取 17 个通用实体。例如:消费日期、供应商名称、总金额和货币。您未指定要提取的字段(架构)。支出解析器支持丰富标准化

账单解析器

账单解析器会提取 KVP。它最多可从账单中提取 46 个通用实体。这些信息包括账单编号、供应商名称、账单金额、税费金额、账单日期和截止日期。您未指定要提取的字段(架构)。账单解析器支持丰富规范化

总结器

摘要器可为短文档和长文档提供摘要和项目符号摘要。借助摘要生成器,您还可以将摘要的输出长度指定为“详尽”“中等”或“简短”。