Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Para muchos campos específicos admitidos, Document AI también devuelve un entity.normalizedValue además del campo sin procesar extraído a través del textAnchor de cada entidad. Normaliza el texto literal. La normalización suele dividir el valor de texto en subcampos.
Contienen los datos en un formato estandarizado para reducir el procesamiento posterior y permitir la conversión a cualquier formato seleccionado. La mentionText, que representa lo que literalmente se encuentra en el documento, nunca se modifica con la normalización.
Los campos normalizados pertenecen a una de las siguientes categorías.
Valores normalizados en la consola
En la consola de Google Cloud , los campos normalizados se anotan con G. Por ejemplo:
Campo de muestra normalizado que se muestra en la aplicación web.
Procesadores compatibles
Estos son los procesadores y los campos que admiten la normalización y el enriquecimiento de entidades:
El extractor personalizado admite la normalización de todas las entidades con los siguientes tipos de datos comunes de Google Cloud: dateTime, currency, money y number.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eDocument AI provides \u003ccode\u003eentity.normalizedValue\u003c/code\u003e for supported fields, standardizing extracted data for easier post-processing and format conversion.\u003c/p\u003e\n"],["\u003cp\u003eNormalization breaks down text values into sub-fields while preserving the original \u003ccode\u003ementionText\u003c/code\u003e found on the document.\u003c/p\u003e\n"],["\u003cp\u003eSeveral pretrained processors, including Bank Statement, US Passport, Utility, Identity Document Proofing, Pay Slip, US Driver License, Expense, and Invoice Parsers, support entity normalization.\u003c/p\u003e\n"],["\u003cp\u003eCustom Extractor supports normalization for common data types such as \u003ccode\u003edateTime\u003c/code\u003e, \u003ccode\u003ecurrency\u003c/code\u003e, \u003ccode\u003emoney\u003c/code\u003e, and \u003ccode\u003enumber\u003c/code\u003e.\u003c/p\u003e\n"],["\u003cp\u003eNormalized fields are labeled with a \u003cstrong\u003eG\u003c/strong\u003e in the Google Cloud console for easy identification.\u003c/p\u003e\n"]]],[],null,["# Normalization\n=============\n\nFor many specific supported fields, Document AI also returns an\n[`entity.normalizedValue`](/document-ai/docs/reference/rest/v1/Document#normalizedvalue)\nin addition to the raw extracted field obtained through the `textAnchor` of each\nentity. It normalize the literal text. Normalization often breaks the text value\nup into sub-fields.\n\nThis contain the data in a standardized format to reduce post processing, and\nenable conversion to whatever format is selected. The `mentionText`, representing\nwhat is literally on the document, is never changed by normalization.\n\nNormalized fields belong to one of the following categories.\n\nNormalized values in the console\n--------------------------------\n\nIn the Google Cloud console, the normalized fields are annotated with **G**. For example:\nSample normalized field shown in the web application.\n\nSupported processors\n--------------------\n\nHere are the processors and fields that support entity enrichment and normalization: \n\n### Extraction processors\n\nCustom extractor supports normalization of all entities with the following Google Cloud\ncommon data types: [`dateTime`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-DateTime), `currency`, [`money`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-Money),\nand `number`."]]