Présentation de l'extraction

Document AI propose plusieurs produits pour extraire des informations à partir de documents pour différents cas d'utilisation :

Analyseur de formulaires

L'outil d'analyse des formulaires extrait les paires clé/valeur, les tableaux, les marques de sélection (cases à cocher) et les champs génériques pour augmenter et automatiser l'extraction. Il peut extraire jusqu'à 11 entités génériques et cases à cocher prêtes à l'emploi. Vous ne spécifiez pas les champs (schéma) que vous souhaitez extraire avec l'analyseur de formulaires. Le modèle détecte et renvoie les entités d'intérêt de chaque page des documents.

Extracteur personnalisé

L'extracteur personnalisé extrait les entités que vous définissez dans le schéma et propose trois options de modélisation : modèle de fondation, modèle personnalisé basé et modèle personnalisé basé sur un modèle. Étant donné les résultats prometteurs des modèles de fondation avec peu ou pas de données d'entraînement, nous vous recommandons de commencer par le modèle de fondation comme première option et d'essayer d'autres options si nécessaire. Les modèles de fondation effectuent des prédictions "zéro-shot" à "few-shot", basées sur un maximum de cinq documents étiquetés dans l'ensemble de données, et des prédictions affinées avec plus de 10 documents étiquetés dans l'ensemble de données.

Méthode d'entraînement Exemples de documents Variation de la mise en page des documents Texte ou paragraphes au format libre Nombre de documents d'entraînement pour une qualité de production, en fonction de la variabilité
Ajuster et modèle de fondation (IA générative). Contrat, conditions d'utilisation, facture, relevé bancaire, connaissement, bulletins de paie. Ordre décroissant (recommandé). Élevée. Moyenne : de 0 à 50 documents
Modèle personnalisé. Modèle. Formulaires similaires avec une mise en page différente selon les années ou les fournisseurs (par exemple, le formulaire W9). Faible à moyen Faible Élevé : entre 10 et plus de 100 documents.
Modèle. Formulaires fiscaux avec une mise en page fixe (formulaires 941 et 709, par exemple). Aucun Faible Faible (3 documents).

Étant donné que les modèles de fondation nécessitent généralement moins de documents d'entraînement, ils sont recommandés comme première option pour toutes les mises en page de variables.

Analyseur de mise en page

Layout Parser transforme des documents de différents formats en représentations structurées, ce qui rend le contenu (paragraphes, tableaux, listes, éléments structurels tels que les titres, les en-têtes et les pieds de page) accessible. Il crée également des segments contextuels qui facilitent la récupération d'informations dans une gamme d'applications d'IA générative et de découverte.