A Document AI usa o gráfico de conhecimento empresarial para normalizar e
enriquecer os resultados da extração de entidades (para campos suportados). Por exemplo, as moradas
123 Main St Apt 1
e 123 Main street # 1
podem ser normalizadas para a mesma morada padronizada.
Para cada campo suportado, a IA Documentos também devolve um normalizedValue
além do campo extraído não processado, normalizando o texto literal.
Este contém os dados num formato padronizado para reduzir o pós-processamento.
A maioria dos dados pertence a uma das seguintes categorias:
- Dinheiro
- Data
- Indicação de tempo
- Endereço
- Booleano
- Número inteiro
- Flutuante
Exemplo de resposta
Pode encontrar os valores enriquecidos no campo
entities.normalizedValue
, conforme mostrado no seguinte exemplo abreviado:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
No exemplo, o original employer_name
"Google Singapore" foi normalizado para "Google Asia Pacific, Singapore".
Na Google Cloud consola, os campos enriquecidos e normalizados são anotados com G. Por exemplo:

Processadores suportados
Seguem-se os processadores e os campos que suportam o enriquecimento de entidades.
Processadores | Campos enriquecidos | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analisador de extratos de conta
|
|
||||||||||||
Analisador W2
|
|
||||||||||||
Analisador de recibos de pagamento
|
|
||||||||||||
Analisador de despesas
|
|
||||||||||||
Analisador de faturas
|
|