L'outil d'analyse des formulaires extrait les paires clé/valeur, les tableaux, les marques de sélection (cases à cocher) et les champs génériques pour augmenter et automatiser l'extraction. Il peut extraire jusqu'à 11 entités génériques et cases à cocher prêtes à l'emploi. Vous ne spécifiez pas les champs (schéma) que vous souhaitez extraire avec l'analyseur de formulaires. Le modèle détecte et renvoie les entités d'intérêt de chaque page des documents.
Extracteur personnalisé
L'extracteur personnalisé extrait les entités que vous définissez dans le schéma et propose trois options de modélisation : modèle de fondation, modèle personnalisé basé et modèle personnalisé basé sur un modèle. Étant donné les résultats prometteurs des modèles de fondation avec peu ou pas de données d'entraînement, nous vous recommandons de commencer par le modèle de fondation comme première option et d'essayer d'autres options si nécessaire.
Les modèles de fondation effectuent des prédictions "zéro-shot" à "few-shot", basées sur un maximum de cinq documents étiquetés dans l'ensemble de données, et des prédictions affinées avec plus de 10 documents étiquetés dans l'ensemble de données.
Méthode d'entraînement
Exemples de documents
Variation de la mise en page des documents
Texte ou paragraphes au format libre
Nombre de documents d'entraînement pour une qualité de production, en fonction de la variabilité
Ajuster et modèle de fondation (IA générative).
Contrat, conditions d'utilisation, facture, relevé bancaire, connaissement, bulletins de paie.
Ordre décroissant (recommandé).
Élevée.
Moyenne : de 0 à 50 documents
Modèle personnalisé.
Modèle.
Formulaires similaires avec une mise en page différente selon les années ou les fournisseurs (par exemple, le formulaire W9).
Faible à moyen
Faible
Élevé : entre 10 et plus de 100 documents.
Modèle.
Formulaires fiscaux avec une mise en page fixe (formulaires 941 et 709, par exemple).
Aucun
Faible
Faible (3 documents).
Étant donné que les modèles de fondation nécessitent généralement moins de documents d'entraînement, ils sont recommandés comme première option pour toutes les mises en page de variables.
Analyseur de mise en page
Layout Parser transforme des documents de différents formats en représentations structurées, ce qui rend le contenu (paragraphes, tableaux, listes, éléments structurels tels que les titres, les en-têtes et les pieds de page) accessible. Il crée également des segments contextuels qui facilitent la récupération d'informations dans une gamme d'applications d'IA générative et de découverte.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eDocument AI offers tools like Form Parser, Custom extractor, and Layout Parser for extracting information from documents based on various use cases.\u003c/p\u003e\n"],["\u003cp\u003eForm Parser automatically extracts key-value pairs, tables, selection marks, and up to 11 generic entities without needing a predefined schema.\u003c/p\u003e\n"],["\u003cp\u003eThe Custom extractor allows users to define their extraction schema and offers three modeling options: foundation model, custom model-based, and custom template-based.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models in Custom extractors are recommended as the first option due to their ability to perform with minimal training data.\u003c/p\u003e\n"],["\u003cp\u003eLayout Parser transforms documents into structured data, identifying elements such as paragraphs, tables, lists, headings, and headers/footers, for use in information retrieval and generative AI applications.\u003c/p\u003e\n"]]],[],null,["# Extraction overview\n===================\n\nDocument AI offers multiple products to extract information from documents\nfor different use cases:\n\n- [Form Parser](#form-parser)\n- Custom extractor, which offers three different modeling types:\n\n - Foundation model\n - Custom model based\n - Custom template based\n- [Layout Parser](#layout-parser)\n\nForm Parser\n-----------\n\nForm Parser extracts key-value pairs (KVP), tables, selection marks (checkboxes),\nand generic fields to augment and automate extraction. It can extract up to 11\ngeneric entities and checkboxes out of the box. You don't specify the fields (schema),\nyou want to extract with the Form Parser. The model detects and returns entities\nof interest from each page of documents.\n\nCustom extractor\n----------------\n\nThe custom extractor extracts entities you define in schema and offers three modeling options:\nfoundation model, custom model based, and custom template based. Given promising\nresults from foundation models with little to no training data, we recommend starting\nwith the foundation model as the first option and try out other options as needed.\nThe foundation models do zero- to few-shot prediction, based on up to 5 labeled\ndocuments in the dataset, and fine-tuned prediction with more than 10 labeled documents in the dataset.\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nLayout Parser\n-------------\n\n| **Note:** Layout Parser is in Public preview\n\nLayout Parser transforms documents in various formats into structured\nrepresentations, making content like paragraphs, tables, lists, and structural\nelements like headings, page headers, and footers accessible, and creating\ncontext-aware chunks that facilitate information retrieval in a range of\ngenerative AI and discovery apps."]]