Enriquecimento

A Document AI usa o gráfico de conhecimento empresarial para normalizar e enriquecer os resultados da extração de entidades (para campos suportados). Por exemplo, as moradas 123 Main St Apt 1 e 123 Main street # 1 podem ser normalizadas para a mesma morada padronizada.

Para cada campo suportado, a IA Documentos também devolve um normalizedValue além do campo extraído não processado, normalizando o texto literal. Este contém os dados num formato padronizado para reduzir o pós-processamento.

A maioria dos dados pertence a uma das seguintes categorias:

  • Dinheiro
  • Data
  • Indicação de tempo
  • Endereço
  • Booleano
  • Número inteiro
  • Flutuante

Exemplo de resposta

Pode encontrar os valores enriquecidos no campo entities.normalizedValue , conforme mostrado no seguinte exemplo abreviado:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

No exemplo, o original employer_name "Google Singapore" foi normalizado para "Google Asia Pacific, Singapore".

Na Google Cloud consola, os campos enriquecidos e normalizados são anotados com G. Por exemplo:

enriquecimento
Exemplo de campo normalizado apresentado na aplicação Web.

Processadores suportados

Seguem-se os processadores e os campos que suportam o enriquecimento de entidades.

Processadores Campos enriquecidos

Analisador de extratos de conta

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • bank_address
  • bank_name

Analisador W2

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • EmployerNameAndAddress
  • EIN

Analisador de recibos de pagamento

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • employer_address
  • employer_name

Analisador de despesas

Categoria Pré-treinado
Tipo de solução Aprovisionamento
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • supplier_address
  • supplier_name
  • supplier_phone

Analisador de faturas

Categoria Pré-treinado
Tipo de solução Aprovisionamento
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • supplier_address
  • supplier_name
  • supplier_phone