Anreichern

Document AI verwendet Enterprise Knowledge Graph, um die Ergebnisse der Entitätsextraktion (für unterstützte Felder) zu normalisieren und anzureichern. Beispielsweise könnten die Adressen 123 Main St Apt 1 und 123 Main street # 1 auf dieselbe standardisierte Adresse normalisiert werden.

Für jedes unterstützte Feld gibt Document AI zusätzlich zum extrahierten Rohfeld auch ein normalizedValue zurück, um den Literaltext zu normalisieren. Sie enthält die Daten in einem standardisierten Format, um die Nachbearbeitung zu reduzieren.

Die meisten Daten gehören zu einer der folgenden Kategorien:

  • Money
  • Datum
  • Zeitstempel
  • Adresse
  • Boolesch
  • Ganzzahl
  • Float

Beispielantwort

Die angereicherten Werte finden Sie im Feld entities.normalizedValue, wie im folgenden gekürzten Beispiel zu sehen ist:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

Im Beispiel wurde das Original employer_name „Google Singapore“ in „Google Asia Pacific, Singapore“ normalisiert.

In der Google Cloud Console sind die angereicherten und normalisierten Felder mit G gekennzeichnet. Beispiel:

Anreicherung
Beispiel für ein normalisiertes Feld in der Webanwendung.

Unterstützte Prozessoren

Hier finden Sie die Prozessoren und Felder, die die Anreicherung von Entitäten unterstützen.

Prozessoren Angereicherte Felder

Kontoauszugsparser

Kategorie Vortrainiert
Lösungstyp Kreditvergabe
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
Vollständige Prozessorinformationen Detaillierter Eintrag
  • bank_address
  • bank_name

W2-Parser

Kategorie Vortrainiert
Lösungstyp Kreditvergabe
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
Vollständige Prozessorinformationen Detaillierter Eintrag
  • EmployerNameAndAddress
  • EIN

Lohnabrechnungsparser

Kategorie Vortrainiert
Lösungstyp Kreditvergabe
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
Vollständige Prozessorinformationen Detaillierter Eintrag
  • employer_address
  • employer_name

Kostenparser

Kategorie Vortrainiert
Lösungstyp Beschaffung
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
Vollständige Prozessorinformationen Detaillierter Eintrag
  • supplier_address
  • supplier_name
  • supplier_phone

Rechnungsparser

Kategorie Vortrainiert
Lösungstyp Beschaffung
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
Vollständige Prozessorinformationen Detaillierter Eintrag
  • supplier_address
  • supplier_name
  • supplier_phone