预训练模型概览
Document AI 提供多种产品,可针对不同的使用场景处理文档以提取信息。
预训练解析器
如需了解详情,请参阅探索预训练处理器。
银行对账单解析器
银行对账单解析器会提取键值对 (KVP)。它最多可以提取 17 个通用实体。例如:账号、客户姓名、银行名称以及存款和取款等表格项。您未指定要提取的字段(架构)。银行对账单解析器支持丰富和规范化。
W2 解析器
W2 解析器会以 KVP 的形式从 IRS 表单 W2 中提取数据。它最多可以提取 12 个通用实体,包括员工姓名、社会保障号、雇主和工资。您未指定要提取的字段(架构)。W2 解析器支持丰富。
美国护照解析器
美国护照解析器会提取 KVP。它最多可以提取七个通用实体。这些信息包括名字、姓氏、证件 ID 和出生日期。您未指定要提取的字段(架构)。美国护照解析器支持规范化。
实用程序解析器
实用程序解析器会提取 KVP。它最多可从公共事业缴费单中提取 75 个通用实体。这些信息包括供应商名称、先前的付款金额,以及金额、说明、商品代码和数量等订单项。您未使用实用程序解析器指定要提取的字段(架构)。
身份证件校对解析器
身份证件校验解析器使用多个信号预测身份证件的有效性。
fraud_signals_is_identity_document
检测:预测图片中是否包含已识别出的身份证件。fraud_signals_suspicious_words
检测:预测 ID 中是否存在不常见的字词。fraud_signals_image_manipulation
检测:预测图片是否使用图片编辑工具进行过修改或篡改。fraud_signals_online_duplicate
检测:预测图片是否可以在网上找到(仅限美国)。
付款单解析器
付款单解析器会提取 KVP。它最多可从工资条中提取 26 个通用实体。这些信息包括员工姓名、奖金、佣金、加班费和发薪日期。 您未指定要提取的字段(架构)。工资条解析器支持丰富和标准化。
美国驾照解析器
美国驾照解析器会提取 KVP。它最多可从驾照中提取八个通用实体。例如:名字、姓氏、证件 ID 和到期日期。您未指定要提取的字段(架构)。美国驾照解析器支持标准化。
费用解析器
费用解析器会提取 KVP。它最多可从支出报告中提取 17 个通用实体。例如:消费日期、供应商名称、总金额和货币。您未指定要提取的字段(架构)。支出解析器支持丰富和标准化。
账单解析器
账单解析器会提取 KVP。它最多可从账单中提取 46 个通用实体。这些信息包括账单编号、供应商名称、账单金额、税费金额、账单日期和截止日期。您未指定要提取的字段(架构)。账单解析器支持丰富和规范化。
总结器
摘要器可为短文档和长文档提供摘要和项目符号摘要。借助摘要生成器,您还可以将摘要的输出长度指定为“详尽”“中等”或“简短”。