Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Für viele unterstützte Felder gibt Document AI zusätzlich zum Rohfeld, das über die textAnchor jeder Entität abgerufen wird, auch ein entity.normalizedValue zurück. Der Literaltext wird normalisiert. Bei der Normalisierung wird der Textwert häufig in Unterfelder aufgeteilt.
Sie enthalten die Daten in einem standardisierten Format, um die Nachbearbeitung zu reduzieren und die Konvertierung in das ausgewählte Format zu ermöglichen. Der mentionText, der das darstellt, was buchstäblich im Dokument steht, wird durch die Normalisierung nie geändert.
Normalisierte Felder gehören zu einer der folgenden Kategorien.
Normalisierte Werte in der Console
In der Google Cloud Console sind die normalisierten Felder mit G gekennzeichnet. Beispiel:
Beispiel für ein normalisiertes Feld in der Webanwendung.
Unterstützte Prozessoren
Hier finden Sie die Prozessoren und Felder, die die Anreicherung und Normalisierung von Einheiten unterstützen:
Der benutzerdefinierte Extraktor unterstützt die Normalisierung aller Einheiten mit den folgenden Google Cloud
gängigen Datentypen: dateTime, currency, money und number.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eDocument AI provides \u003ccode\u003eentity.normalizedValue\u003c/code\u003e for supported fields, standardizing extracted data for easier post-processing and format conversion.\u003c/p\u003e\n"],["\u003cp\u003eNormalization breaks down text values into sub-fields while preserving the original \u003ccode\u003ementionText\u003c/code\u003e found on the document.\u003c/p\u003e\n"],["\u003cp\u003eSeveral pretrained processors, including Bank Statement, US Passport, Utility, Identity Document Proofing, Pay Slip, US Driver License, Expense, and Invoice Parsers, support entity normalization.\u003c/p\u003e\n"],["\u003cp\u003eCustom Extractor supports normalization for common data types such as \u003ccode\u003edateTime\u003c/code\u003e, \u003ccode\u003ecurrency\u003c/code\u003e, \u003ccode\u003emoney\u003c/code\u003e, and \u003ccode\u003enumber\u003c/code\u003e.\u003c/p\u003e\n"],["\u003cp\u003eNormalized fields are labeled with a \u003cstrong\u003eG\u003c/strong\u003e in the Google Cloud console for easy identification.\u003c/p\u003e\n"]]],[],null,["# Normalization\n=============\n\nFor many specific supported fields, Document AI also returns an\n[`entity.normalizedValue`](/document-ai/docs/reference/rest/v1/Document#normalizedvalue)\nin addition to the raw extracted field obtained through the `textAnchor` of each\nentity. It normalize the literal text. Normalization often breaks the text value\nup into sub-fields.\n\nThis contain the data in a standardized format to reduce post processing, and\nenable conversion to whatever format is selected. The `mentionText`, representing\nwhat is literally on the document, is never changed by normalization.\n\nNormalized fields belong to one of the following categories.\n\nNormalized values in the console\n--------------------------------\n\nIn the Google Cloud console, the normalized fields are annotated with **G**. For example:\nSample normalized field shown in the web application.\n\nSupported processors\n--------------------\n\nHere are the processors and fields that support entity enrichment and normalization: \n\n### Extraction processors\n\nCustom extractor supports normalization of all entities with the following Google Cloud\ncommon data types: [`dateTime`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-DateTime), `currency`, [`money`](/ruby/docs/reference/google-cloud-document_ai-v1/latest/Google-Type-Money),\nand `number`."]]