Arricchimento
Document AI utilizza Enterprise Knowledge Graph per normalizzare e
arricchire i risultati dell'estrazione delle entità (per i campi supportati). Ad esempio, gli indirizzi123 Main St Apt 1
e 123 Main street # 1
potrebbero essere normalizzati allo stesso
indirizzo standardizzato.
Per ogni campo supportato, Document AI restituisce anche un normalizedValue
oltre al campo estratto non elaborato, normalizzando il testo letterale.
Contiene i dati in un formato standardizzato per ridurre il post-trattamento.
La maggior parte dei dati appartiene a una delle seguenti categorie:
- Denaro
- Data
- Timestamp
- Indirizzo
- Booleano
- Numero intero
- Numero in virgola mobile
Risposta di esempio
I valori arricchiti sono disponibili nel
entities.normalizedValue
campo, come mostrato nel seguente esempio troncato:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
Nel campione, il valore employer_name
originale "Google Singapore" è stato uniformato a "Google Asia Pacific, Singapore".
Nella console Google Cloud, i campi arricchiti e normalizzati sono annotati con G. Ad esempio:
Processori supportati
Di seguito sono riportati i processori e i campi che supportano l'arricchimento delle entità.
Processori | Campi con informazioni aggiuntive | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analizzatore estratto conto bancario
|
|
||||||||||||
Analizzatore W2
|
|
||||||||||||
Analizzatore busta paga
|
|
||||||||||||
Analizzatore sintattico delle spese
|
|
||||||||||||
Analizzatore sintattico delle fatture
|
|