Pour convertir des factures en données structurées dans Cloud Data Fusion, vous pouvez utiliser le plug-in Analyseur de factures fourni par Document AI. Les données structurées sont stockées dans BigQuery.
Avant de commencer
Pour analyser les factures, vous avez besoin d'une instance Cloud Data Fusion s'exécutant dans la version 6.4.1 ou ultérieure. Pour en savoir plus, consultez Mettre à niveau des instances Cloud Data Fusion.
Créer un outil de traitement
Dans la console Google Cloud, accédez à la page Processeurs Document AI.
Créer un outil de traitement Sélectionnez Analyseur de factures comme type d'outil de traitement.
Configurer le plug-in d'analyse des factures
Dans la console Google Cloud, accédez à la page Instances de Cloud Data Fusion.
Assurez-vous que l'instance souhaitée a été mise à niveau vers la version 6.4.1 ou ultérieure. Pour les versions antérieures, mettez à niveau l'instance.
Cliquez sur Afficher l'instance. L'interface utilisateur de Cloud Data Fusion s'ouvre.
Cliquez sur Hub.
Cliquez sur GCP, puis déployez les plug-ins GCP.
Cliquez sur DocAI, puis déployez les plug-ins Doc AI.
Cliquez sur Démarrage de l'analyseur de factures > Créer.
Personnalisez votre pipeline en saisissant l'ID de l'outil de traitement de l'analyseur de factures, le chemin d'accès au bucket Cloud Storage et les détails de la table BigQuery.
Déployez et exécutez le pipeline.
Les factures analysées sont stockées dans la table de sortie de BigQuery.
Les métadonnées des factures sont stockées dans la table Metadata
et incluent l'état de l'analyse, le chemin d'accès Cloud Storage et l'horodatage d'importation de la facture brute. Les enregistrements des tables de sortie et de métadonnées peuvent être associés à la clé invoice_uuid
.