Enriquecimiento
Document AI usa Enterprise Knowledge Graph para normalizar y enriquecer los resultados de la extracción de entidades (para los campos compatibles). Por ejemplo, las direcciones 123 Main St Apt 1
y 123 Main street # 1
podrían normalizarse a la misma dirección estandarizada.
Para cada campo compatible, Document AI también muestra un normalizedValue
, además del campo extraído sin procesar, que normaliza el texto literal.
Contiene los datos en un formato estandarizado para reducir el procesamiento posterior.
La mayoría de los datos pertenecen a una de las siguientes categorías:
- Dinero
- Fecha
- Marca de tiempo
- Dirección
- Booleano
- Número entero
- Número de punto flotante
Respuesta de muestra
Los valores enriquecidos se pueden encontrar en el campo entities.normalizedValue
, como se muestra en la siguiente muestra truncada:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
En la muestra, el employer_name
original "Google Singapore" se normalizó a "Google Asia Pacific, Singapore".
En la consola de Google Cloud, los campos enriquecidos y normalizados se anotan con G. Por ejemplo:
Procesadores compatibles
Estos son los procesadores y campos que admiten el enriquecimiento de entidades.
Procesadores | Campos enriquecidos | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analizador de estados de cuenta
|
|
||||||||||||
Analizador W2
|
|
||||||||||||
Analizador de comprobantes de pago
|
|
||||||||||||
Analizador de gastos
|
|
||||||||||||
Analizador de facturas
|
|