Aprimoramento

A Document AI usa o Enterprise Knowledge Graph para normalizar e aprimorar os resultados da extração de entidades (para campos compatíveis). Por exemplo, os endereços 123 Main St Apt 1 e 123 Main street # 1 podem ser normalizados para o mesmo endereço padronizado.

Para cada campo compatível, a Document AI também retorna um normalizedValue, além do campo extraído bruto, normalizando o texto literal. Ele contém os dados em um formato padronizado para reduzir o pós-processamento.

A maioria dos dados pertence a uma das seguintes categorias:

  • Dinheiro
  • Data
  • Carimbo de data/hora
  • Endereço
  • Booleano
  • Número inteiro
  • Ponto flutuante

Exemplo de resposta

Os valores enriquecidos podem ser encontrados no campo entities.normalizedValue, conforme mostrado no exemplo truncado a seguir:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

No exemplo, o employer_name original "Google Singapore" foi normalizado para "Google Asia Pacific, Singapore".

No console do Google Cloud, os campos enriquecidos e normalizados são anotados com G. Exemplo:

enriquecimento
Exemplo de campo normalizado mostrado no aplicativo da Web.

Processadores compatíveis

Confira os processadores e campos que oferecem suporte ao enriquecimento de entidades.

Processadores Campos enriquecidos

Analisador de extrato bancário

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, Extração de entidades
Etapa de lançamento Disponibilidade geral
Status de acesso Pública
Detalhes completos do processador Entrada detalhada
  • bank_address
  • bank_name

Analisador W2

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, Extração de entidades
Etapa de lançamento Disponibilidade geral
Status de acesso Pública
Detalhes completos do processador Entrada detalhada
  • EmployerNameAndAddress
  • EIN

Analisador de holerite

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, Extração de entidades
Etapa de lançamento Disponibilidade geral
Status de acesso Pública
Detalhes completos do processador Entrada detalhada
  • employer_address
  • employer_name

Analisador de despesas

Categoria Pré-treinado
Tipo de solução Aquisição
Funções OCR, Extração de entidades
Etapa de lançamento Disponibilidade geral
Status de acesso Pública
Detalhes completos do processador Entrada detalhada
  • supplier_address
  • supplier_name
  • supplier_phone

Analisador de faturas

Categoria Pré-treinado
Tipo de solução Aquisição
Funções OCR, Extração de entidades
Etapa de lançamento Disponibilidade geral
Status de acesso Pública
Detalhes completos do processador Entrada detalhada
  • supplier_address
  • supplier_name
  • supplier_phone