预训练模型概览

Document AI 提供多种产品,可处理文档以获取信息,适用于不同的使用场景。

预训练的解析器

如需了解详情,请参阅探索预训练的处理器

银行对账单解析器

银行对账单解析器提取键值对 (KVP)。它可以提取最多 17 个通用实体。例如:账号、客户名称、银行名称,以及存款和取款等表格项目。您未指定要提取的字段(架构)。银行对账单解析器支持丰富化规范化

W2 解析器

W2 解析器从 IRS 表单 W2 中提取 KVP。该模型最多可以提取 12 种通用实体,包括员工姓名、社会保障号、雇主和工资。您未指定要提取的字段(架构)。W2 解析器支持丰富化

美国护照解析器

美国护照解析器提取 KVP。它可以提取最多七个通用实体。这些信息包括名字、姓氏、证件 ID 和出生日期。您未指定要提取的字段(架构)。美国护照解析器支持规范化

实用程序解析器

实用程序解析器提取 KVP。它可以从水电费账单中提取最多 75 个通用实体。这些信息包括供应商名称、先前的付款金额以及金额、说明、产品代码和数量等订单项。您无需使用实用程序解析器指定要提取的字段(架构)。

身份证明文件校对解析器

身份证明文件验证解析器使用多个信号预测身份证明文件的有效性。

  • fraud_signals_is_identity_document 检测:预测图片是否包含可识别的身份证明文件。
  • fraud_signals_suspicious_words 检测:预测是否存在 ID 上不常见的字词。
  • fraud_signals_image_manipulation 检测:预测图片是否被图片编辑工具更改或篡改。
  • fraud_signals_online_duplicate 检测:预测图片是否可以在线找到(仅限美国)。

付款单解析器

付款单解析器提取 KVP。它可以从工资单中提取最多 26 个通用实体。这些信息包括员工姓名、奖金、佣金、加班费和付款日期。 您未指定要提取的字段(架构)。工资单解析器支持丰富化归一化

美国驾照解析器

美国驾照解析器提取 KVP。它可以从驾驶执照中提取最多 8 个通用实体。例如:名字、姓氏、证件 ID 和失效日期。您未指定要提取的字段(架构)。美国驾照解析器支持规范化

费用解析器

费用解析器提取 KVP。它可以从费用报告中提取最多 17 个通用实体。例如:支出日期、供应商名称、总金额和币种。 您未指定要提取的字段(架构)。费用解析器支持丰富化归一化

账单解析器

账单解析器提取 KVP。它可以从发票中提取最多 46 种通用实体。这些信息包括账单编号、供应商名称、账单金额、税费金额、账单日期和截止日期。您未指定要提取的字段(架构)。账单解析器支持丰富化规范化

Summarizer

摘要器可为短文档和长文档提供摘要和要点摘要。您还可以使用总结工具指定总结的输出长度,包括“全面”“中等”或“简短”。