Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
L'outil d'analyse des formulaires extrait des paires clé-valeur, des tableaux, des marques de sélection (comme des cases à cocher), des champs génériques et du texte pour améliorer et automatiser le traitement des documents.
Vous pouvez envisager d'utiliser le Form Parser plutôt que les autres analyseurs lorsque le cas d'utilisation implique :
Traitement des formulaires structurés : il excelle dans l'extraction de paires clé/valeur à partir de formulaires bien définis qui ressemblent à des formulaires conventionnels avec des champs vides à remplir, comme name: __. Le modèle pré-entraîné de l'analyseur de formulaires offre une grande précision pour les champs courants tels que les noms, les dates et les adresses.
L'extraction flexible de tableaux est nécessaire : l'analyseur de formulaires extrait les données des tableaux simples (sans cellules qui s'étendent sur plusieurs lignes ou colonnes) qui ressemblent à des tableaux. Aucune formation n'est nécessaire (ni possible). Pour l'extraction de tables entraînées, l'extracteur personnalisé peut être utilisé avec un champ parent contenant des champs enfants de colonne (cellule).
Besoin d'efficacité : évitez de créer et de gérer des analyseurs d'extraction, en particulier pour les tâches d'extraction à volume élevé et variées.
Fonctionnalités d'extraction de données
Voici les fonctionnalités de l'analyseur de formulaires :
Paire clé/valeur : il s'agit d'ensembles de deux éléments dans un document (une étiquette ou une clé et les données correspondantes (une valeur)). Vous pouvez utiliser directement les paires clé/valeur (si les clés sont cohérentes) ou créer une logique personnalisée pour résoudre les clés variées en informations structurées cohérentes.
Entités génériques : analysez 11 champs différents à partir de documents prêts à l'emploi. Exemples :
email
phone
url
date_time
address
person
organization
quantity
price
id
page_number
Texte et mise en page : utilisez notre dernier moteur de reconnaissance optique des caractères pour extraire le texte et les informations de mise en page. Cela inclut le texte intégré à des PDF numériques (version 2.1 uniquement) ou le texte d'images.
Tableaux : détectez et extrayez les tableaux des images et des PDF.
Cases à cocher : détecteur de marques de sélection de haute qualité, qui extrait les cases à cocher des images et des sorties PDF sous forme de paires clé/valeur, en utilisant le texte le plus proche de la case à cocher, avec un valueType indiquant si elle est cochée ou non.
Langues et régions
Form Parser 2.0 est compatible avec plus de 200 langues. En savoir plus
Nous proposons une assistance pour les fonctionnalités dans huit régions. En savoir plus
Les compressions JPEG antérieures pour TIFF ne sont pas acceptées. Type d'encapsulation JPEG défini par la spécification TIFF version 6.0.
Le modèle de cases à cocher n'est pas compatible avec l'analyse des boutons radio. Il est possible que certaines cases à cocher détectées n'aient pas de clés correspondantes.
Le modèle n'analyse pas de manière fiable une paire clé/valeur avec une valeur non renseignée, comme un formulaire vide.
L'analyse des paires clé/valeur dans les documents rédigés dans certaines langues peut être de qualité inférieure à celle des langues latines.
Traiter des documents avec l'analyseur de formulaires
Ce guide de démarrage rapide vous présente l'analyseur de formulaires dans Document AI. Dans ce guide de démarrage rapide, vous allez utiliser la console Google Cloud pour configurer votre projet Google Cloud et les autorisations, créer un analyseur de formulaires, puis envoyer une requête à Document AI pour traiter un formulaire PDF.
Découvrez comment :
activer Document AI dans un projet Google Cloud ;
créer un outil d'analyse des formulaires, capable d'identifier et d'extraire le texte, des paires clé/valeur, des tables et des entités génériques de différents types de documents ;
utiliser l'outil de traitement pour annoter un exemple de document.
Pour obtenir des instructions détaillées sur cette tâche directement dans la console Google Cloud , cliquez sur Visite guidée :
Sign in to your Google Cloud account. If you're new to
Google Cloud,
create an account to evaluate how our products perform in
real-world scenarios. New customers also get $300 in free credits to
run, test, and deploy workloads.
In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Créez un outil d'analyse des formulaires à l'aide de la console Google Cloud . Pour en savoir plus, consultez la section Créer et gérer des outils de traitement.
Dans le menu de navigation de la console Google Cloud , cliquez sur Document AI, puis sélectionnez Galerie d'outils de traitement.
Il s'agit d'un fichier PDF contenant un exemple de formulaire d'enregistrement médical manuscrit. Ce document est stocké dans un bucket Cloud Storage publiquement accessible.
Cliquez sur le bouton Importer un document de test, puis sélectionnez le document que vous venez de télécharger.
La page Analyse des formulaires s'affiche. Vous pouvez afficher les paires clé-valeur, les tables, les entités génériques et le texte extraits du document et détectés par reconnaissance optique des caractères.
Effectuer un nettoyage
Pour éviter des frais Google Cloud inutiles, utilisezGoogle Cloud console pour supprimer votre outil de traitement et votre projet si vous n'en avez plus besoin.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eForm Parser is a pre-trained tool that extracts key-value pairs, tables, selection marks, generic entities, and text from documents, suitable for structured forms and flexible table extraction.\u003c/p\u003e\n"],["\u003cp\u003eIt can parse and return data for 11 different generic entities, such as email, phone, address, person, organization, price and date_time, and can also extract data from checkboxes, and tables.\u003c/p\u003e\n"],["\u003cp\u003eForm Parser supports over 200 languages and offers feature support in eight regions, but it cannot be up-trained, and it cannot process radio buttons, nor extract data from blank or empty values.\u003c/p\u003e\n"],["\u003cp\u003eYou can create a Form Parser processor through the Google Cloud console, and then test it using the test document option with a sample PDF file to see the resulting extractions.\u003c/p\u003e\n"],["\u003cp\u003eThe Form Parser tool is designed to be efficient, eliminating the need to build and maintain custom extraction parsers for various high volume form document processing.\u003c/p\u003e\n"]]],[],null,["# Form Parser\n\nProcess documents with Form Parser\n==================================\n\nForm Parser extracts key-value pairs (KVPs), tables, selection marks (like checkboxes),\ngeneric fields, and text to augment and automate document processing.\n| **Note:** Form Parser is pre-trained and cannot be up-trained.\n\nForm Parser can be considered over the other parsers when the use case involves:\n\n- Dealing with structured forms: It excels at extracting KVPs from well-defined forms that look like conventional forms with labeled blanks to fill in, such as `name: __`. Form Parser's pre-trained model offers high accuracy for common fields like names, dates, and addresses.\n- Flexible table extraction is needed: Form Parser extracts from simple (no cells that span rows or columns) tables that look like tables. No training is needed (nor possible). For trained table extraction, the custom extractor can be used with a parent field containing column (cell) child fields.\n- Need efficiency: Avoid building and maintaining extraction parsers, especially for high-volume and varied forms of extraction tasks.\n\nData-extraction features\n------------------------\n\nForm Parser features encompass:\n\n- **KVP:** These are sets of two items within a document---a label or key and its\n corresponding data (a value). You can directly use KVPs (if the keys are consistent)\n or build custom logic to resolve varied keys into consistent structured information.\n\n- **Generic entities:** Parse 11 different fields from documents out of the box. These include:\n\n - `email`\n - `phone`\n - `url`\n - `date_time`\n - `address`\n - `person`\n - `organization`\n - `quantity`\n - `price`\n - `id`\n - `page_number`\n- **Text and layout:** Use our latest OCR engine to extract text and layout\n information. This includes embedded text from digital PDFs (v2.1 only) or text from images.\n\n- **Tables:** Detect and extract tables from images and PDFs.\n\n- **Checkboxes:** A high-quality selection mark detector, which extracts checkboxes\n from images and PDF output as KVP, using the text nearest the checkbox, with a `valueType`\n indicating whether it is filled or unfilled.\n\nLanguages and regions\n---------------------\n\n- Form Parser 2.0 supports over 200 languages. [Learn more](/document-ai/docs/processors-list#expandable-1).\n- We provide feature support in eight regions. [Learn more](/document-ai/docs/regions).\n\nModel versions\n--------------\n\nThe following processor versions are compatible with this feature. For more\ninformation, see [Managing processor versions](/document-ai/docs/manage-processor-versions).\n\nLimitations\n-----------\n\n- Prior JPEG compressions for TIFF are unsupported. Type of JPEG encapsulation defined by the TIFF [version 6.0 specification](https://gitlab.com/libtiff/libtiff/-/commit/f0a54a4fa0cfa377f493d57ee2af393005d5bbe5).\n\n- The checkbox model doesn't support parsing radio buttons. Some detected checkboxes might not have corresponding keys.\n\n- The model doesn't reliably parse a KVP with an unfilled value, such as a blank form.\n\n- The KVP parsing on documents in certain languages may have lower quality than Latin languages.\n\n\u003cbr /\u003e\n\nProcess documents with Form Parser\n----------------------------------\n\nThis quickstart introduces you to the Form Parser feature in Document AI. In this quickstart,\nyou use the Google Cloud console to set up your Google Cloud project and\nauthorization, create a Form Parser, and then make a request for\nDocument AI to process a PDF form.\n\nLearn how to:\n\n1. Enable Document AI in a Google Cloud project.\n\n2. Create a Form Parser processor, which can identify\n and extract text, key-value pairs, tables, and generic entities from many types of documents.\n\n3. Use the processor to annotate a sample document.\n\n*** ** * ** ***\n\nTo follow step-by-step guidance for this task directly in the\nGoogle Cloud console, click **Guide me**:\n\n[Guide me](https://console.cloud.google.com/ai/document-ai?tutorial=document-ai--documentai_form_parser_console)\n\n*** ** * ** ***\n\n- Sign in to your Google Cloud account. If you're new to Google Cloud, [create an account](https://console.cloud.google.com/freetrial) to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.\n- In the Google Cloud console, on the project selector page,\n select or create a Google Cloud project.\n\n | **Note**: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.\n\n [Go to project selector](https://console.cloud.google.com/projectselector2/home/dashboard)\n-\n [Verify that billing is enabled for your Google Cloud project](/billing/docs/how-to/verify-billing-enabled#confirm_billing_is_enabled_on_a_project).\n\n-\n\n\n Enable the Document AI API.\n\n\n [Enable the API](https://console.cloud.google.com/flows/enableapi?apiid=documentai.googleapis.com)\n\n- In the Google Cloud console, on the project selector page,\n select or create a Google Cloud project.\n\n | **Note**: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.\n\n [Go to project selector](https://console.cloud.google.com/projectselector2/home/dashboard)\n-\n [Verify that billing is enabled for your Google Cloud project](/billing/docs/how-to/verify-billing-enabled#confirm_billing_is_enabled_on_a_project).\n\n-\n\n\n Enable the Document AI API.\n\n\n [Enable the API](https://console.cloud.google.com/flows/enableapi?apiid=documentai.googleapis.com)\n\nCreate a Form Parser processor\n------------------------------\n\nUse the Google Cloud console to create a Form Parser processor. See [creating and managing processors](/document-ai/docs/create-processor) for more information.\n\n1. In the Google Cloud console navigation menu, click **Document AI** and\n select **Processor Gallery**.\n\n [Processor\n Gallery](https://console.cloud.google.com/ai/document-ai/processor-library)\n2. In the **Processor Gallery** ,\n search for\n **Form Parser** and select **Create**.\n\n\n3. In the side window, enter a **Processor name** , such as `quickstart-form-processor`.\n\n4. Select the region closest to you.\n\n5. Click the **Create** button.\n\nYou're taken to the **Processor Details** page of your new form parser processor.\n\nTest processor\n--------------\n\nAfter creating your processor, you can send annotation requests to it.\n\n1. [Download the sample document](https://storage.googleapis.com/cloud-samples-data/documentai/GeneralProcessors/FormParser/intake-form.pdf).\n\n It's a PDF file containing a sample handwritten medical intake form. This document is stored in a publicly accessible Cloud Storage bucket.\n2. Click the\n **Upload Test Document** button and select the document you just downloaded.\n\n3. You should now be on the **Form Parser analysis** page. You can view the OCR detected text, key-value pairs, tables, and generic entities extracted from the document.\n\n\nClean up\n--------\n\nTo avoid unnecessary Google Cloud charges, use the\n[Google Cloud console](https://console.cloud.google.com/) to delete your processor and [project](https://console.cloud.google.com/cloud-resource-manager) if you don't need\nthem.\n\nWhat's next\n-----------\n\n- Review the [Processors list](/document-ai/docs/processors-list)."]]