Mit dem Rechnungsparser-Plug-in, das auf Document AI basiert, können Sie in Cloud Data Fusion Rechnungen in strukturierte Daten umwandeln. Die strukturierten Daten werden in BigQuery gespeichert.
Hinweise
Zum Parsen von Rechnungen benötigen Sie eine Cloud Data Fusion-Instanz, die in Version 6.4.1 oder höher ausgeführt wird. Weitere Informationen finden Sie unter Upgrade von Cloud Data Fusion-Instanzen ausführen.
Prozessor erstellen
Rufen Sie in der Google Cloud Console die Document AI-Seite Prozessoren auf.
Erstellen Sie einen Prozessor. Wählen Sie Invoice Parser als Prozessortyp aus.
Plug-in "Invoice Parser" konfigurieren
Rufen Sie in der Google Cloud Console die Cloud Data Fusion-Seite Instanzen auf.
Prüfen Sie, ob die gewünschte Instanz auf Version 6.4.1 oder höher aktualisiert wurde. Bei früheren Versionen führen Sie ein Upgrade der Instanz durch.
Klicken Sie auf Instanz ansehen. Die Benutzeroberfläche von Cloud Data Fusion wird geöffnet.
Klicken Sie auf Hub.
Klicken Sie auf GCP und stellen Sie dann GCP-Plug-ins bereit.
Klicken Sie auf DocAI und stellen Sie dann die Doc AI-Plug-ins bereit.
Klicken Sie auf Kurzanleitung "Invoice Parser" > Erstellen.
Passen Sie die Pipeline an, indem Sie die Prozessor-ID von Invoice Parser, den Cloud Storage-Bucket-Pfad und die BigQuery-Tabellendetails eingeben.
Stellen Sie die Pipeline bereit und führen Sie sie aus.
Geparste Rechnungen werden in der Ausgabetabelle in BigQuery gespeichert.
Metadaten aus den Rechnungen werden in der Tabelle Metadata
gespeichert und umfassen den Parsing-Status, den Cloud Storage-Pfad und den Upload-Zeitstempel der Rohrechnung. Einträge in den Ausgabe- und Metadatentabellen können mit dem Schlüssel invoice_uuid
verknüpft werden.