Arricchimento

Document AI utilizza Enterprise Knowledge Graph per normalizzare e arricchire i risultati dell'estrazione delle entità (per i campi supportati). Ad esempio, gli indirizzi123 Main St Apt 1 e 123 Main street # 1 potrebbero essere normalizzati allo stesso indirizzo standardizzato.

Per ogni campo supportato, Document AI restituisce anche un normalizedValue oltre al campo estratto non elaborato, normalizzando il testo letterale. Contiene i dati in un formato standardizzato per ridurre il post-trattamento.

La maggior parte dei dati appartiene a una delle seguenti categorie:

  • Denaro
  • Data
  • Timestamp
  • Indirizzo
  • Booleano
  • Numero intero
  • Numero in virgola mobile

Risposta di esempio

I valori arricchiti sono disponibili nel entities.normalizedValue campo, come mostrato nel seguente esempio troncato:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

Nel campione, il valore employer_name originale "Google Singapore" è stato uniformato a "Google Asia Pacific, Singapore".

Nella console Google Cloud, i campi arricchiti e normalizzati sono annotati con G. Ad esempio:

arricchimento
Campo normalizzato di esempio mostrato nell'applicazione web.

Processori supportati

Di seguito sono riportati i processori e i campi che supportano l'arricchimento delle entità.

Processori Campi con informazioni aggiuntive

Analizzatore estratto conto bancario

Category Preaddestrati
Tipo di soluzione Prestiti
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • bank_address
  • bank_name

Analizzatore W2

Category Preaddestrati
Tipo di soluzione Prestiti
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • EmployerNameAndAddress
  • EIN

Analizzatore busta paga

Category Preaddestrati
Tipo di soluzione Prestiti
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • employer_address
  • employer_name

Analizzatore sintattico delle spese

Category Preaddestrati
Tipo di soluzione Approvvigionamento
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • supplier_address
  • supplier_name
  • supplier_phone

Analizzatore sintattico delle fatture

Category Preaddestrati
Tipo di soluzione Approvvigionamento
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Dettagli completi del processore Voce dettagliata
  • supplier_address
  • supplier_name
  • supplier_phone