规范化
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
对于许多特定的受支持字段,除了通过每个实体的 textAnchor
获得的原始提取字段外,Document AI 还会返回 entity.normalizedValue
。它会规范化字面文本。归一化通常会将文本值分解为子字段。
此文件包含采用标准化格式的数据,可减少后期处理,并能够转换为所选的任何格式。mentionText
(表示文档上的实际内容)永远不会因规范化而发生变化。
标准化字段属于以下类别之一。
控制台中的标准化值
在 Google Cloud 控制台中,归一化字段带有 G 注释。例如:
Web 应用中显示的归一化字段示例。
支持的处理器
以下是支持实体丰富和规范化的处理器和字段:
自定义提取器支持对具有以下 Google Cloud常见数据类型的所有实体进行归一化:dateTime
、currency
、money
和 number
。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-09-27。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-09-27。"],[],[]]