Aprimoramento
A Document AI usa o Enterprise Knowledge Graph para normalizar e
aprimorar os resultados da extração de entidades (para campos compatíveis). Por exemplo, os endereços
123 Main St Apt 1
e 123 Main street # 1
podem ser normalizados para o mesmo
endereço padronizado.
Para cada campo compatível, a Document AI também retorna um normalizedValue
, além do campo extraído bruto, normalizando o texto literal.
Ele contém os dados em um formato padronizado para reduzir o pós-processamento.
A maioria dos dados pertence a uma das seguintes categorias:
- Dinheiro
- Data
- Carimbo de data/hora
- Endereço
- Booleano
- Número inteiro
- Ponto flutuante
Exemplo de resposta
Os valores enriquecidos podem ser encontrados no campo entities.normalizedValue
, conforme mostrado no exemplo truncado a seguir:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
No exemplo, o employer_name
original "Google Singapore" foi
normalizado para "Google Asia Pacific, Singapore".
No console do Google Cloud, os campos enriquecidos e normalizados são anotados com G. Exemplo:
Processadores compatíveis
Confira os processadores e campos que oferecem suporte ao enriquecimento de entidades.
Processadores | Campos enriquecidos | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analisador de extrato bancário
|
|
||||||||||||
Analisador W2
|
|
||||||||||||
Analisador de holerite
|
|
||||||||||||
Analisador de despesas
|
|
||||||||||||
Analisador de faturas
|
|