Présentation de Document AI

Ce document présente les concepts fondamentaux de l'utilisation de Document AI. Nous vous conseillons d'en prendre connaissance avant de passer à d'autres documents ou aux guides de démarrage rapide.

Automatiser les workflows de traitement des documents

Les entreprises du monde entier s'appuient fortement sur les documents pour stocker et transmettre des informations. Ces informations doivent souvent être numérisées pour être utiles. Toutefois, cela se fait généralement par le biais de processus manuels longs.

Exemple :

  • numériser des livres pour les liseuses ;
  • Traitement des formulaires d'admission médicale dans les cabinets médicaux
  • Analyse des reçus et des factures pour valider les rapports de dépenses
  • Authentification de l'identité à l'aide de cartes d'identité
  • Extraire des informations sur les revenus à partir de formulaires fiscaux pour approuver des prêts
  • Comprendre les contrats pour les conditions clés des accords commerciaux

Chacun de ces workflows implique d'obtenir le texte brut à partir de documents, puis d'extraire le texte spécifique de celui qui correspond aux données nécessaires (les champs ou les entités). Toutefois, chaque type de document a une structure et une mise en page différentes, et le schéma des champs varie selon le cas d'utilisation spécifique.

Composants Document AI

Document AI est une plate-forme de traitement et de compréhension des documents qui convertit les données non structurées des documents en données structurées (champs spécifiques, adaptés à une base de données) afin d'en faciliter la compréhension, l'analyse et l'utilisation.

Document AI est basé sur les produits de Vertex AI avec l'IA générative pour vous aider à créer des applications de traitement de documents cloud, évolutives et de bout en bout, sans expertise spécialisée en machine learning.

Grâce à Document AI, vous pouvez:

  • Numérisez des documents à l'aide de la reconnaissance optique des caractères pour obtenir le texte, la mise en page et divers modules complémentaires, tels que la détection de la qualité de l'image (pour la lisibilité) et le redressement (entièrement automatique).
  • Extrayez du texte et des informations de mise en page à partir de fichiers de documents, et normalisez les entités.
  • Identifiez les paires clé-valeur dans les formulaires structurés et les tableaux standards. Par exemple, Name: Jill Smith est un kvp.
  • Classez les types de documents pour optimiser les processus en aval, tels que l'extraction et le stockage.
  • Divisez et classez les documents par type. (par exemple, un fichier PDF contenant plusieurs documents réels).
  • Préparez des ensembles de données à utiliser pour affiner et évaluer les modèles à l'aide de fonctionnalités d'étiquetage automatique, de gestion de schémas et de gestion d'ensembles de données telles que l'examen des documents et des prédictions.
  • Intégrez-le à des produits tels que Cloud Storage, BigQuery et la recherche Vertex AI pour stocker, rechercher, organiser, gérer et analyser des documents et des métadonnées.

Ce diagramme illustre toutes les étapes clés de traitement des documents prises en charge par Document AI et la façon dont elles peuvent se connecter les unes aux autres.

docai-overview-1

Processeur

Un processeur Document AI se trouve entre le fichier de document et un modèle de machine learning qui effectue des actions de traitement et de compréhension des documents. Ils peuvent être utilisés pour classer, diviser, analyser ou analyser un document.

Chaque projet Google Cloud doit créer ses propres instances de processeur.

Les processeurs se répartissent en trois catégories:

  • Numériser: OCR.
  • Extraction: extracteur personnalisé, analyseur de formulaires, analyseur de mise en page et analyseurs pré-entraînés.
  • Classer: classificateur et séparateur personnalisés.

Consultez la liste complète des processeurs et des détails pour en savoir plus sur tous les types de processeurs disponibles pour Document AI.

Quel processeur dois-je utiliser ?

Pour choisir le type de processeur à utiliser pour une application spécifique, voici quelques consignes générales:

Catégorie Cas d'utilisation Type de processeur
Numériser Extrayez du texte et des informations de mise en page à partir de documents. Enterprise Document OCR
Analyser la qualité de l'image scannée (lisibilité) d'un document Enterprise Document OCR avec l' analyse de la qualité des images activée
Extrayez des entités à partir d'un document personnalisé qui ne répond pas aux critères de processeur personnalisé.
Extraction Extrayez des tableaux ou des paires clé-valeur à partir d'un formulaire structuré dans un document. Analyseur de formulaires
Extraction d'éléments tels que du texte, des tableaux et des listes dans un document, et retour de segments contextuels. Analyseur de mise en page
Extrayez des entités à partir d'un document personnalisé qui répond aux critères de processeur personnalisé. Créer un extracteur personnalisé
Extrayez des entités à partir d'un type de document spécialisé. Un processeur pré-entraîné (surentraîner pour améliorer la qualité)
Classification Classer des documents. Créer un classificateur personnalisé
Diviser des documents Créer un séparateur personnalisé

Ce diagramme vous aide à déterminer le processeur le plus adapté à chaque cas d'utilisation.

docai-overview-2

Utiliser des processeurs Document AI

Voici les principales étapes à suivre pour utiliser Document AI afin de commencer à traiter des documents:

  1. Choisissez un processeur adapté à votre cas d'utilisation.

  2. Créez un outil de traitement à l'aide de la console Google Cloud ou de l'API Document AI.

    • Document AI crée un point de terminaison de prédiction vers lequel vous pouvez envoyer vos documents.

    • Pour obtenir des instructions détaillées, consultez Créer un processeur.

  3. Entraînez un processeur à partir de zéro avec des données d'entraînement et de test, ou sur entraînez une nouvelle version (pré-entraînée) de processeur à partir d'une version existante.

  4. Envoyez vos documents pour traitement.