Limites

Ce document liste les limites système qui s'appliquent à Document AI. Contrairement aux quotas, les limites système ne peuvent pas être modifiées.

Limites de contenu

Les limites de contenu suivantes s'appliquent à tous les processeurs Document AI.

Limite de contenu Valeur
Résolution d'image maximale :
(la limite ne s'applique pas aux fichiers PDF)
40 mégapixels (par page si l'image contient plusieurs pages)
Taille maximale des fichiers pour les requêtes de traitement en ligne 20 Mo
Taille maximale des fichiers pour les requêtes de traitement par lot 1 Go
Fichiers par requête de traitement par lot 5 000 fichiers
Pages human-in-the-loop par document 10 pages

Limites du processeur

Les limites sont définies dans la liste actuelle.

Processeurs d'extraction

Processeur Limites
Extracteur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 200
Analyseur de formulaires
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 100
Analyseur de mise en page
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 500

Processeurs de classification

Processeur Limites
Classificateur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 200
Séparateur personnalisé
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 1000

Numériser les processeurs

Processeur Limites
Enterprise Document OCR (reconnaissance optique des caractères dans les documents)
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 500

Processeurs pré-entraînés

Processeur Limites
Analyseur de relevés bancaires
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 30
Analyseur de formulaires W2
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 15
Analyseur de passeports américains
Nombre maximal de pages (requêtes en ligne/synchrones): 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 2
Analyseur de fournisseurs d'énergie
Nombre maximal de pages (requêtes en ligne/synchrones): 10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 200
Analyseur de vérification de documents d'identité
Nombre maximal de pages (requêtes en ligne/synchrones): 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 2
Analyseur de bulletins de salaire
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 50
Analyseur de permis de conduire américains
Nombre maximal de pages (requêtes en ligne/synchrones): 2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 2
Analyseur de dépenses
Nombre maximal de pages (requêtes en ligne/synchrones): 10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 10
Analyseur de factures
Nombre maximal de pages (requêtes en ligne/synchrones): 15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones): 200

Limites de Document AI

Document AI présente les limites actuelles.

Critères Version stable en juillet 2023
Ensemble de données
  • 30 000 documents au maximum
  • 250 000 pages maximum au total
Importation de documents
  • 5 000 documents maximum par importation
  • 200 pages maximum par document
Limites pour entraîner un extracteur de documents personnalisé Entraînement basé sur un modèle (DG)
  • Nombre maximal d'éléments dans l'ensemble de données d'entraînement: 25 000 documents ; 100 000 pages
  • Ensemble de données d'entraînement minimal: chaque étiquette doit être présente sur au moins un document pour 10 documents
  • Nombre maximal d'éléments dans l'ensemble de données de test: 2 000 documents ; 8 000 pages
  • Ensemble de données de test minimal: chaque étiquette sur au moins 10 documents
  • 200 pages maximum par document

Formation basée sur des modèles (GA)
  • Nombre maximal d'éléments dans l'ensemble de données d'entraînement: 300 documents, 300 pages
  • Ensemble de données d'entraînement minimal: chaque étiquette sur au moins trois documents
  • Nombre maximal d'éléments dans l'ensemble de données de test: 2 000 documents ; 8 000 pages
  • Ensemble de données de test minimal: chaque étiquette sur au moins trois documents
  • 20 pages maximum par document
Limites concernant l'entraînement d'un classificateur de documents personnalisé (CDC) ou d'un séparateur de documents personnalisé (CDS)
  • Nombre maximal d'éléments dans l'ensemble de données d'entraînement: 30 000 documents ; 100 000 pages
  • Ensemble de données d'entraînement minimal: chaque étiquette sur au moins 10 documents
  • Nombre maximal d'éléments dans l'ensemble de données de test: 2 000 documents ; 8 000 pages
  • Ensemble de données de test minimal: chaque étiquette sur au moins deux documents
  • 200 pages maximum par document
Étiquetage
  • Pour commencer, assurez-vous que les libellés des documents respectent les seuils minimaux d'entraînement et d'évaluation définis.
  • Pour commencer à évaluer les performances du modèle pour les documents présentant des variations de mise en page, libellez au moins 100 documents. Plus précisément, assurez-vous que chaque étiquette figure sur 50 documents d'entraînement et 50 documents d'évaluation.
  • Nombre maximal d'étiquettes (champs) autorisé : 150
  • Limites de taille des libellés (caractères): les éléments longs ne sont pas bien acceptés, mais aucune limite explicite n'est appliquée. Divisez les documents en morceaux de 800 ou 1 000 jetons, avec 100 à 200 jetons de chevauchement entre les morceaux. (Les éléments plus longs que la zone de chevauchement peuvent rencontrer des problèmes de qualité.)
  • Nombre d'occurrences de libellés dans un document: illimité
Couverture géographique
  • Régions généralement compatibles: États-Unis, UE (multirégion)
  • Régions où l'accès est limité: Allemagne, Australie, Canada, Inde, Royaume-Uni et Singapour