Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Ce document est un guide présentant les concepts fondamentaux de l'utilisation de Document AI.
Nous vous conseillons d'en prendre connaissance avant de passer à d'autres documents ou aux guides de démarrage rapide.
Automatiser les workflows de traitement des documents
Les entreprises du monde entier s'appuient fortement sur les documents pour stocker et transmettre des informations.
Ces informations doivent souvent être numérisées pour être utiles. Toutefois, cela se fait généralement par le biais de processus manuels qui prennent beaucoup de temps.
Exemple :
Numérisation de livres pour les liseuses
Traitement des formulaires médicaux dans les cabinets médicaux.
Analyse des reçus et des factures pour valider les notes de frais.
Authentifier l'identité à l'aide de pièces d'identité.
Extraire des informations sur les revenus à partir de formulaires fiscaux pour approuver des prêts.
Comprendre les contrats pour les conditions clés des accords commerciaux.
Chacun de ces workflows implique d'obtenir le texte brut des documents, puis d'extraire le texte spécifique qui correspond aux données nécessaires (les champs ou les entités).
Toutefois, chaque type de document possède une structure et une mise en page différentes, et le modèle de champs varie en fonction du cas d'utilisation spécifique.
Composants de Document AI
Document AI est une plate-forme de traitement et de compréhension de documents qui convertit les données non structurées des documents en données structurées (champs spécifiques adaptés à une base de données) afin d'en faciliter la compréhension, l'analyse et l'utilisation.
Document AI s'appuie sur des produits Vertex AI avec l'IA générative pour vous aider à créer des applications de traitement de documents évolutives, de bout en bout et basées dans le cloud, sans expertise spécialisée en machine learning.
Document AI vous permet d'effectuer les opérations suivantes :
Numérisez des documents à l'aide de l'OCR pour obtenir du texte, une mise en page et divers modules complémentaires tels que la détection de la qualité des images (pour la lisibilité) et le redressement (entièrement automatique).
Extrayez le texte et les informations de mise en page des fichiers de documents, et normalisez les entités.
Identifier les paires clé-valeur dans les formulaires structurés et les tableaux standards. Par exemple, Name: Jill Smith est une paire clé/valeur.
Classifiez les types de documents pour piloter les processus en aval tels que l'extraction et le stockage.
Séparez et classez les documents par type. Par exemple, un fichier PDF contenant plusieurs documents réels.
Préparez les ensembles de données à utiliser pour l'affinage et les évaluations de modèles à l'aide des fonctionnalités d'étiquetage automatique, de gestion des schémas et de gestion des ensembles de données, telles que l'examen des documents et des prédictions.
Intégrez-le à des produits comme Cloud Storage, BigQuery et Vertex AI Search pour vous aider à stocker, rechercher, organiser, gérer et analyser des documents et des métadonnées.
Ce schéma illustre toutes les étapes clés du traitement des documents prises en charge par Document AI et la façon dont elles peuvent être interconnectées.
Processeur
Un processeur Document AI se trouve entre le fichier de document et un modèle de machine learning qui effectue des actions de traitement et de compréhension des documents.
Ils peuvent être utilisés pour classer, fractionner, analyser ou parser un document.
Chaque projet Google Cloud doit créer ses propres instances de processeur.
Les sous-traitants appartiennent à l'une des catégories suivantes :
Numériser : OCR.
Extraire : extracteur personnalisé, analyseur de formulaires, analyseur de mise en page et analyseurs préentraînés.
Classer : classificateur et séparateur personnalisés.
Entraînez un processeur avec des données d'entraînement et de test à partir de zéro, ou surentraînez une nouvelle version (préentraînée) du processeur sur une version existante.
Pour obtenir des instructions détaillées, consultez Processeur Train.
Envoyez vos documents pour qu'ils soient traités.
Document AI traite les documents et renvoie un ou plusieurs objets Document, qui contiennent les informations structurées extraites.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eDocument AI is a platform that transforms unstructured data from documents into structured data, making it easier to understand, analyze, and use.\u003c/p\u003e\n"],["\u003cp\u003eDocument AI enables the automation of document processing workflows, such as digitizing documents, extracting text and entities, classifying document types, and preparing datasets for model training.\u003c/p\u003e\n"],["\u003cp\u003eDocument AI uses processors that fall into the categories of digitize, extract, or classify to perform specific document processing and understanding actions.\u003c/p\u003e\n"],["\u003cp\u003eTo use Document AI, you must choose a suitable processor, create the processor, optionally train it, and then send documents to the processor for processing.\u003c/p\u003e\n"],["\u003cp\u003eDocument AI can integrate with products like Cloud Storage, BigQuery, and Vertex AI Search for storing, searching, and analyzing documents.\u003c/p\u003e\n"]]],[],null,["This document is a guide to the fundamental concepts of using Document AI.\nYou should read this page before proceeding to any other documentation or quickstarts.\n\nAutomate document processing workflows\n\nBusinesses all over the world rely heavily on documents to store and convey information.\nThis information often needs to be digitized for it to become useful. However,\nthis is usually accomplished through time-intensive, manual processes.\n\nFor example:\n\n- Digitizing books for e-readers.\n- Processing medical intake forms at doctor's offices.\n- Parsing receipts and invoices for expense report validation.\n- Authenticating identity based on ID cards.\n- Extracting income information from tax forms for approving loans.\n- Understanding contracts for key business agreement terms.\n\nEach of these workflows involve getting the raw text from documents, then\nextracting specific text from that which corresponds to the data needed (the fields or entities).\nHowever, each document type has a different structure and layout, and the pattern of fields\nvary depending on the specific use case.\n\nDocument AI components\n\nDocument AI is a [document processing and understanding](https://en.wikipedia.org/wiki/Document_processing)\nplatform that takes unstructured data from documents and transforms it into\nstructured data (specific fields, suitable for a database), making it easier to understand, analyze, and consume.\n\nDocument AI is built on top of products within Vertex AI with generative AI to help you\ncreate scalable, end-to-end, cloud-based document processing applications without specialized machine learning expertise.\n\nUsing Document AI, you can:\n\n- **Digitize documents** using OCR to get text, layout, and various add ons such as image quality detection (for readability) and deskewing (fully automatic).\n- **Extract** text and layout information, from document files and normalize entities.\n- **Identify key-value pairs (kvp)** in structured forms and regular tables. For example: `Name: Jill Smith` is a kvp.\n- **Classify** document types to drive downstream processes such as extraction and storage.\n- **Split** and classify documents by type. For example, a PDF file with multiple real documents.\n- **Prepare datasets** to be used in fine-tuning and model evaluations using auto-labeling, schema management, and dataset management features such as document and prediction review.\n- **Integrate it with products** like Cloud Storage, BigQuery, and Vertex AI Search to help you store, search, organize, govern, and analyze documents and metadata.\n\nThis diagram illustrates all of the key document processing steps that are\nsupported by Document AI and how they can connect to each other.\n\nProcessor\n\nA Document AI processor lies between the document file and a machine\nlearning model that performs document processing and understanding actions.\nThey can be used to classify, split, parse, or analyze a document.\n\nEach Google Cloud project needs to create its own processor instances.\n\nProcessors fit into one of the following categories:\n\n- **Digitize**: OCR.\n- **Extract**: Custom extractor, Form Parser, layout parser, and pretrained parsers.\n- **Classify**: Custom classifier and custom splitter.\n\nRefer to the [Full processor and detail list](/document-ai/docs/processors-list) for information about all\navailable processor types for Document AI.\n\nWhich processor should I use?\n\nTo decide what processor type to use for a specific application, here are some general guidelines:\n| **Note:** All processors can extract text and layout information.\n\n| **Category** | **Use case** | **Processor type** |\n|--------------|------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| Digitize | Extract text and layout information from documents. | [Enterprise Document OCR](/document-ai/docs/processors-list#processor_doc-ocr) |\n| Digitize | Analyze the scanned image quality (readability) of a document. | [Enterprise Document OCR](/document-ai/docs/processors-list#processor_doc-ocr) with [image-quality analysis](/document-ai/docs/processors-list#processor_doc-quality-processor) enabled |\n| Digitize | Extract entities from a custom document that does not meet the [custom processor criteria](/document-ai/quotas). | |\n| Extract | Extract tables or kvp from a structured form in a document. | [Form Parser](/document-ai/docs/processors-list#processor_form-parser) |\n| Extract | Extract elements like text, tables, and lists in a document and return context aware chunks. | [Layout Parser](/document-ai/docs/layout-parse-chunk) |\n| Extract | Extract entities from a custom document that meets the [custom processor criteria](/document-ai/quotas). | [Create a custom extractor](/document-ai/docs/workbench/build-custom-processor) |\n| Extract | Extract entities from a specialized document type. | A [pretrained processor](/document-ai/docs/processors-list#specialized_processors) ([Up-train](/document-ai/docs/uptrain-pretrained-processor) to improve quality.) |\n| Classify | Classify documents. | [Create a Custom Classifier](/document-ai/docs/workbench/build-custom-classification-processor) |\n| Classify | Split documents. | [Create a Custom Splitter](/document-ai/docs/workbench/build-custom-splitter-processor) |\n\nThis diagram helps determine which processor works best for each use case.\n\nUse Document AI processors\n\nHere are the major steps to use Document AI to start processing documents:\n\n1. **Choose a processor** that is suitable for your use case.\n\n - For complete information on each processor, see the [Full processor and detail list](/document-ai/docs/processors-list).\n2. **Create a processor** using the Google Cloud console or the Document AI API.\n\n - Document AI creates a **prediction endpoint** where you can send your documents.\n\n - For detailed instructions, see [Creating a processor](/document-ai/docs/create-processor).\n\n3. **Train a processor** with train and test data from scratch, or uptrain a new (pretrained) processor version on top of an existing one.\n\n - For detailed instructions, see [Train processor](/document-ai/docs/workbench/train-processor).\n4. **Send your documents** for processing.\n\n - Document AI processes the documents and returns one or more [`Document`](/document-ai/docs/reference/rest/v1/Document) objects, which contain the extracted, structured information.\n\n - For detailed instructions, see [Sending a processing request](/document-ai/docs/send-request) and [Handle the processing response](/document-ai/docs/handle-response)."]]