Enriquecimiento

Document AI usa Enterprise Knowledge Graph para normalizar y enriquecer los resultados de la extracción de entidades (en los campos admitidos). Por ejemplo, las direcciones 123 Main St Apt 1 y 123 Main street # 1 se podrían normalizar a la misma dirección estandarizada.

En cada campo admitido, Document AI también devuelve un normalizedValue además del campo extraído sin procesar, normalizando el texto literal. Contiene los datos en un formato estandarizado para reducir el posprocesamiento.

La mayoría de los datos pertenecen a una de las siguientes categorías:

  • Dinero
  • Fecha
  • Marca de tiempo
  • Dirección
  • Booleano
  • Entero
  • Flotante

Respuesta de ejemplo

Los valores enriquecidos se encuentran en el campo entities.normalizedValue, como se muestra en el siguiente ejemplo abreviado:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

En el ejemplo, el employer_name original "Google Singapore" se ha normalizado a "Google Asia Pacific, Singapore".

En la Google Cloud consola, los campos enriquecidos y normalizados se anotan con G. Por ejemplo:

enriquecimiento
Campo normalizado de ejemplo que se muestra en la aplicación web.

Procesadores admitidos

Estos son los procesadores y los campos que admiten el enriquecimiento de entidades.

Procesadores Campos enriquecidos

Analizador de extractos bancarios

Categoría Preentrenado
Tipo de solución Préstamos
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Detalles completos del procesador Entrada detallada
  • bank_address
  • bank_name

Analizador de formularios W‐2

Categoría Preentrenado
Tipo de solución Préstamos
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Detalles completos del procesador Entrada detallada
  • EmployerNameAndAddress
  • EIN

Analizador de nóminas

Categoría Preentrenado
Tipo de solución Préstamos
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Detalles completos del procesador Entrada detallada
  • employer_address
  • employer_name

Analizador de gastos

Categoría Preentrenado
Tipo de solución Aprovisionamiento
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Detalles completos del procesador Entrada detallada
  • supplier_address
  • supplier_name
  • supplier_phone

Análisis de facturas

Categoría Preentrenado
Tipo de solución Aprovisionamiento
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Detalles completos del procesador Entrada detallada
  • supplier_address
  • supplier_name
  • supplier_phone