Rechnungen parsen

Mit dem Rechnungsparser-Plug-in, das auf Document AI basiert, können Sie in Cloud Data Fusion Rechnungen in strukturierte Daten umwandeln. Die strukturierten Daten werden in BigQuery gespeichert.

Hinweise

Zum Parsen von Rechnungen benötigen Sie eine Cloud Data Fusion-Instanz, die in Version 6.4.1 oder höher ausgeführt wird. Weitere Informationen finden Sie unter Upgrade von Cloud Data Fusion-Instanzen ausführen.

Prozessor erstellen

  1. Rufen Sie in der Google Cloud Console die Document AI-Seite Prozessoren auf.

    Zu "Prozessoren"

  2. Erstellen Sie einen Prozessor. Wählen Sie Invoice Parser als Prozessortyp aus.

    Invoice Parser als Prozessortyp auswählen

Plug-in "Invoice Parser" konfigurieren

  1. Rufen Sie in der Google Cloud Console die Cloud Data Fusion-Seite Instanzen auf.

    Zur Seite „VM-Instanzen“

  2. Prüfen Sie, ob die gewünschte Instanz auf Version 6.4.1 oder höher aktualisiert wurde. Bei früheren Versionen führen Sie ein Upgrade der Instanz durch.

  3. Klicken Sie auf Instanz ansehen. Die Benutzeroberfläche von Cloud Data Fusion wird geöffnet.

  4. Klicken Sie auf Hub.

  5. Klicken Sie auf GCP und stellen Sie dann GCP-Plug-ins bereit.

  6. Klicken Sie auf DocAI und stellen Sie dann die Doc AI-Plug-ins bereit.

  7. Klicken Sie auf Kurzanleitung "Invoice Parser" > Erstellen.

  8. Passen Sie die Pipeline an, indem Sie die Prozessor-ID von Invoice Parser, den Cloud Storage-Bucket-Pfad und die BigQuery-Tabellendetails eingeben.

  9. Stellen Sie die Pipeline bereit und führen Sie sie aus.

    Beispielpipeline mit Plug-in "Invoice Parser"

Geparste Rechnungen werden in der Ausgabetabelle in BigQuery gespeichert. Metadaten aus den Rechnungen werden in der Tabelle Metadata gespeichert und umfassen den Parsing-Status, den Cloud Storage-Pfad und den Upload-Zeitstempel der Rohrechnung. Einträge in den Ausgabe- und Metadatentabellen können mit dem Schlüssel invoice_uuid verknüpft werden.