Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
En muchos campos específicos admitidos, Document AI también devuelve un
entity.normalizedValue
además del campo extraído sin procesar obtenido a través del textAnchor de cada
entidad. Normaliza el texto literal. La normalización suele dividir el valor de texto en subcampos.
Contiene los datos en un formato estandarizado para reducir el posprocesamiento y permitir la conversión al formato que se seleccione. El mentionText, que representa lo que aparece literalmente en el documento, nunca se modifica con la normalización.
Los campos normalizados pertenecen a una de las siguientes categorías.
Valores normalizados en la consola
En la Google Cloud consola, los campos normalizados se anotan con G. Por ejemplo:
Campo normalizado de ejemplo que se muestra en la aplicación web.
Procesadores admitidos
Estos son los procesadores y los campos que admiten la normalización y el enriquecimiento de entidades:
El extractor personalizado admite la normalización de todas las entidades con los siguientes Google Cloud
tipos de datos comunes: dateTime, currency, money y number.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-10 (UTC)."],[[["\u003cp\u003eDocument AI provides \u003ccode\u003eentity.normalizedValue\u003c/code\u003e for supported fields, standardizing extracted data for easier post-processing and format conversion.\u003c/p\u003e\n"],["\u003cp\u003eNormalization breaks down text values into sub-fields while preserving the original \u003ccode\u003ementionText\u003c/code\u003e found on the document.\u003c/p\u003e\n"],["\u003cp\u003eSeveral pretrained processors, including Bank Statement, US Passport, Utility, Identity Document Proofing, Pay Slip, US Driver License, Expense, and Invoice Parsers, support entity normalization.\u003c/p\u003e\n"],["\u003cp\u003eCustom Extractor supports normalization for common data types such as \u003ccode\u003edateTime\u003c/code\u003e, \u003ccode\u003ecurrency\u003c/code\u003e, \u003ccode\u003emoney\u003c/code\u003e, and \u003ccode\u003enumber\u003c/code\u003e.\u003c/p\u003e\n"],["\u003cp\u003eNormalized fields are labeled with a \u003cstrong\u003eG\u003c/strong\u003e in the Google Cloud console for easy identification.\u003c/p\u003e\n"]]],[],null,[]]