Enriquecimiento

Document AI usa Enterprise Knowledge Graph para normalizar y enriquecer los resultados de la extracción de entidades (para los campos compatibles). Por ejemplo, las direcciones 123 Main St Apt 1 y 123 Main street # 1 podrían normalizarse a la misma dirección estandarizada.

Para cada campo compatible, Document AI también muestra un normalizedValue, además del campo extraído sin procesar, que normaliza el texto literal. Contiene los datos en un formato estandarizado para reducir el procesamiento posterior.

La mayoría de los datos pertenecen a una de las siguientes categorías:

  • Dinero
  • Fecha
  • Marca de tiempo
  • Dirección
  • Booleano
  • Número entero
  • Número de punto flotante

Respuesta de muestra

Los valores enriquecidos se pueden encontrar en el campo entities.normalizedValue, como se muestra en la siguiente muestra truncada:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

En la muestra, el employer_name original "Google Singapore" se normalizó a "Google Asia Pacific, Singapore".

En la consola de Google Cloud, los campos enriquecidos y normalizados se anotan con G. Por ejemplo:

enriquecimiento
Campo normalizado de muestra que se muestra en la aplicación web.

Procesadores compatibles

Estos son los procesadores y campos que admiten el enriquecimiento de entidades.

Procesadores Campos enriquecidos

Analizador de estados de cuenta

Categoría Previamente entrenados
Tipo de solución Préstamos
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Detalles completos del procesador Entrada detallada
  • bank_address
  • bank_name

Analizador W2

Categoría Previamente entrenados
Tipo de solución Préstamos
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Detalles completos del procesador Entrada detallada
  • EmployerNameAndAddress
  • EIN

Analizador de comprobantes de pago

Categoría Previamente entrenados
Tipo de solución Préstamos
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Detalles completos del procesador Entrada detallada
  • employer_address
  • employer_name

Analizador de gastos

Categoría Previamente entrenados
Tipo de solución Adquisición
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Detalles completos del procesador Entrada detallada
  • supplier_address
  • supplier_name
  • supplier_phone

Analizador de facturas

Categoría Previamente entrenados
Tipo de solución Adquisición
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Detalles completos del procesador Entrada detallada
  • supplier_address
  • supplier_name
  • supplier_phone