Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Para muitos campos específicos compatíveis, a Document AI também retorna um
entity.normalizedValue
além do campo extraído bruto obtido pelo textAnchor de cada
entidade. Ele normaliza o texto literal. A normalização geralmente divide o valor do texto em subcampos.
Isso contém os dados em um formato padronizado para reduzir o pós-processamento e permitir a conversão para qualquer formato selecionado. O mentionText, que representa o que está literalmente no documento, nunca é alterado pela normalização.
Os campos normalizados pertencem a uma das seguintes categorias:
Valores normalizados no console
No console do Google Cloud , os campos normalizados são anotados com G. Exemplo:
Campo normalizado de amostra mostrado no aplicativo da Web.
Processadores compatíveis
Confira os processadores e campos que oferecem suporte ao enriquecimento e à normalização de entidades:
O extrator personalizado oferece suporte à normalização de todas as entidades com os seguintes tipos de dados comuns Google Cloud: dateTime, currency, money e number.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[[["\u003cp\u003eDocument AI provides \u003ccode\u003eentity.normalizedValue\u003c/code\u003e for supported fields, standardizing extracted data for easier post-processing and format conversion.\u003c/p\u003e\n"],["\u003cp\u003eNormalization breaks down text values into sub-fields while preserving the original \u003ccode\u003ementionText\u003c/code\u003e found on the document.\u003c/p\u003e\n"],["\u003cp\u003eSeveral pretrained processors, including Bank Statement, US Passport, Utility, Identity Document Proofing, Pay Slip, US Driver License, Expense, and Invoice Parsers, support entity normalization.\u003c/p\u003e\n"],["\u003cp\u003eCustom Extractor supports normalization for common data types such as \u003ccode\u003edateTime\u003c/code\u003e, \u003ccode\u003ecurrency\u003c/code\u003e, \u003ccode\u003emoney\u003c/code\u003e, and \u003ccode\u003enumber\u003c/code\u003e.\u003c/p\u003e\n"],["\u003cp\u003eNormalized fields are labeled with a \u003cstrong\u003eG\u003c/strong\u003e in the Google Cloud console for easy identification.\u003c/p\u003e\n"]]],[],null,["# Normalization\n=============\n\nFor many specific supported fields, Document AI also returns an\n[`entity.normalizedValue`](/document-ai/docs/reference/rest/v1/Document#normalizedvalue)\nin addition to the raw extracted field obtained through the `textAnchor` of each\nentity. It normalize the literal text. Normalization often breaks the text value\nup into sub-fields.\n\nThis contain the data in a standardized format to reduce post processing, and\nenable conversion to whatever format is selected. The `mentionText`, representing\nwhat is literally on the document, is never changed by normalization.\n\nNormalized fields belong to one of the following categories.\n\nNormalized values in the console\n--------------------------------\n\nIn the Google Cloud console, the normalized fields are annotated with **G**. For example:\nSample normalized field shown in the web application.\n\nSupported processors\n--------------------\n\nHere are the processors and fields that support entity enrichment and normalization: \n\n### Extraction processors\n\nCustom extractor supports normalization of all entities with the following Google Cloud\ncommon data types: [`dateTime`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-DateTime), `currency`, [`money`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-Money),\nand `number`."]]