Dokumente mit Formularparser verarbeiten

Der Formularparser extrahiert Schlüssel/Wert-Paare, Tabellen, Auswahlmarkierungen (z. B. Kästchen), generische Felder und Text, um die Dokumentverarbeitung zu ergänzen und zu automatisieren.

Der Formular-Parser kann gegenüber den anderen Parsern in Betracht gezogen werden, wenn der Anwendungsfall Folgendes umfasst:

  • Umgang mit strukturierten Formularen: Er eignet sich hervorragend zum Extrahieren von KVPs aus gut definierten Formularen, die wie herkömmliche Formulare mit beschrifteten Lücken zum Ausfüllen aussehen, z. B. name: __. Das vortrainierte Modell des Formular-Parsers bietet eine hohe Genauigkeit bei gängigen Feldern wie Namen, Datumsangaben und Adressen.
  • Flexible Tabellenextraktion erforderlich: Der Formularparser extrahiert aus einfachen Tabellen (keine Zellen, die Zeilen oder Spalten überspannen), die wie Tabellen aussehen. Es ist keine Schulung erforderlich (und auch nicht möglich). Bei der extrahierten Tabelle kann der benutzerdefinierte Extractor mit einem übergeordneten Feld verwendet werden, das untergeordnete Spalten-(Zellen-)Felder enthält.
  • Effizienz: Sie müssen keine Extraktionsparser erstellen und verwalten, insbesondere bei umfangreichen und vielfältigen Extraktionsaufgaben.

Funktionen zur Datenextraktion

Zu den Funktionen des Formularparsers gehören:

  • Schlüssel/Wert-Paar: Ein Satz aus zwei Elementen in einem Dokument – ein Label oder Schlüssel und die zugehörigen Daten (ein Wert). Sie können KVPs direkt verwenden (wenn die Schlüssel einheitlich sind) oder benutzerdefinierte Logik erstellen, um verschiedene Schlüssel in einheitliche strukturierte Informationen aufzulösen.

  • Generischer Entitätentyp:Sie können 11 verschiedene Felder aus Dokumenten direkt analysieren. Dazu gehören:

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • Text und Layout:Mit unserer neuesten OCR-Engine können Sie Text und Layoutinformationen extrahieren. Dazu gehören eingebetteter Text aus digitalen PDFs (nur Version 2.1) oder Text aus Bildern.

  • Tabellen:Erkennt und extrahiert Tabellen aus Bildern und PDFs.

  • Kästchen:Ein hochwertiger Detector für Auswahlmarkierungen, der Kästchen aus Bildern und PDF-Ausgaben als KVP extrahiert. Dabei wird der Text verwendet, der sich am nächsten am Kästchen befindet. Mit einem valueType wird angegeben, ob das Kästchen angeklickt ist oder nicht.

Sprachen und Regionen

Modellversionen

Die folgenden Prozessorversionen sind mit dieser Funktion kompatibel. Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Beschränkungen

  • Vorherige JPEG-Komprimierungen für TIFF werden nicht unterstützt. Art der JPEG-Kapselung, definiert durch die TIFF-Version 6.0-Spezifikation.

  • Das Kästchenmodell unterstützt das Parsen von Optionsschaltflächen nicht. Einige erkannte Kästchen haben möglicherweise keine entsprechenden Schlüssel.

  • Das Modell kann einen KVP mit einem nicht ausgefüllten Wert, z. B. ein leeres Formular, nicht zuverlässig parsen.

  • Das KVP-Parsen von Dokumenten in bestimmten Sprachen ist möglicherweise weniger genau als bei lateinischen Sprachen.

Dokumente mit Formularparser verarbeiten

In dieser Kurzanleitung wird das Feature „Form Parser“ in Document AI vorgestellt. In dieser Kurzanleitung richten Sie mit der Google Cloud Console Ihr Google Cloud-Projekt und Ihre Autorisierung ein, erstellen einen Formularparser und senden dann eine Anfrage an Document AI, um ein PDF-Formular zu verarbeiten.

Sie erfahren, wie Sie:

  1. Aktivieren Sie Document AI in einem Google Cloud Projekt.

  2. einen Formularparser-Prozessor erstellen, der Text, Schlüssel/Wert-Paare, Tabellen und generische Entitäten aus vielen Dokumenttypen identifizieren und extrahieren kann

  3. den Prozessor verwenden, um ein Beispieldokument zu annotieren


Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud Console aufzurufen.

Anleitung


  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Enable the API

Formularparser-Prozessor erstellen

Verwenden Sie die Google Cloud Console, um einen Formularparser-Prozessor zu erstellen. Weitere Informationen finden Sie unter Prozessoren erstellen und verwalten.

  1. Klicken Sie im Navigationsmenü der Google Cloud Console auf Document AI und wählen Sie Prozessorgalerie aus.

    Prozessorgalerie

  2. Suchen Sie in der Prozessorgalerie nach Formularparser und wählen Sie Erstellen aus.

    Option „Formularparser“ in der Benutzeroberfläche

  3. Geben Sie im Seitenfenster einen Prozessornamen ein, z. B. quickstart-form-processor.

  4. Wählen Sie die Region aus, die Ihnen am nächsten ist.

  5. Klicken Sie auf Erstellen.

Sie werden zur Seite Prozessordetails für Ihren neuen Formularparser weitergeleitet.

Testprozessor

Nachdem Sie den Prozessor erstellt haben, können Sie Annotationsanfragen an ihn senden.

  1. Laden Sie das Beispieldokument herunter.

    Es ist eine PDF-Datei mit einem Beispiel einer handgeschriebenen medizinischen Datenaufnahme. Dieses Dokument wird in einem öffentlich zugänglichen Cloud Storage-Bucket gespeichert.

  2. Klicken Sie auf die Schaltfläche Testdokument hochladen und wählen Sie das Dokument aus, das Sie gerade heruntergeladen haben.

  3. Sie sollten sich jetzt auf der Seite Analyse des Formularparsers befinden. Sie können sich den aus dem Dokument erkannten Text sowie die Schlüssel/Wert-Paare, Tabellen und allgemeinen Entitäten ansehen.

    Schlüssel/Wert-Paare im Beispielformular in der Benutzeroberfläche Generische Entitäten im Beispielformular in der Benutzeroberfläche

Bereinigen

Löschen Sie den Prozessor und das Projekt mit der Google Cloud Console, wenn Sie diese nicht mehr benötigen, um unnötige Google Cloud Kosten zu vermeiden.

Nächste Schritte