Document AI verwendet Enterprise Knowledge Graph, um die Ergebnisse der Entitätsextraktion (für unterstützte Felder) zu normalisieren und anzureichern. Beispielsweise könnten die Adressen 123 Main St Apt 1
und 123 Main street # 1
auf dieselbe standardisierte Adresse normalisiert werden.
Für jedes unterstützte Feld gibt Document AI zusätzlich zum extrahierten Rohfeld auch ein normalizedValue
zurück, um den Literaltext zu normalisieren.
Sie enthält die Daten in einem standardisierten Format, um die Nachbearbeitung zu reduzieren.
Die meisten Daten gehören zu einer der folgenden Kategorien:
- Money
- Datum
- Zeitstempel
- Adresse
- Boolesch
- Ganzzahl
- Float
Beispielantwort
Die angereicherten Werte finden Sie im Feld entities.normalizedValue
, wie im folgenden gekürzten Beispiel zu sehen ist:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
Im Beispiel wurde das Original employer_name
„Google Singapore“ in „Google Asia Pacific, Singapore“ normalisiert.
In der Google Cloud Console sind die angereicherten und normalisierten Felder mit G gekennzeichnet. Beispiel:

Unterstützte Prozessoren
Hier finden Sie die Prozessoren und Felder, die die Anreicherung von Entitäten unterstützen.
Prozessoren | Angereicherte Felder | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Kontoauszugsparser
|
|
||||||||||||
W2-Parser
|
|
||||||||||||
Lohnabrechnungsparser
|
|
||||||||||||
Kostenparser
|
|
||||||||||||
Rechnungsparser
|
|