Limits

In diesem Dokument sind die Systemlimits für Document AI aufgeführt. Im Gegensatz zu Kontingenten können Systemlimits nicht geändert werden.

Limits für Inhalte

Die folgenden Inhaltslimits gelten für alle Document AI-Prozessoren.

Limit für Inhalte Wert
Maximale Bildauflösung
(Begrenzung gilt nicht für PDF-Dateien)
40 Megapixel (pro Seite, wenn das Bild mehrere Seiten enthält)
Maximale Dateigröße für Anfragen zur Onlineverarbeitung 20 MB
Maximale Dateigröße für Anfragen zur Batchverarbeitung 1 GB
Dateien pro Batchverarbeitungsanfrage 5.000 Dateien
Human-in-the-Loop-Seiten pro Dokument 10 Seiten

Prozessorlimits

Limits sind in der aktuellen Liste definiert.

Extraktions-Prozessoren

Prozessor Limits
Benutzerdefinierter Extrahierer
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Formularparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 100
Layout-Parser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500

Klassifizierungs-Prozessoren

Prozessor Limits
Benutzerdefinierter Klassifikator
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Benutzerdefinierter Splitter
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 1000

Prozessoren digitalisieren

Prozessor Limits
Enterprise Document OCR (Optische Zeichenerkennung)
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500

Vortrainierte Prozessoren

Prozessor Limits
Kontoauszugsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 30
W2-Parser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 15
Parser für US-amerikanische Reisepässe
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Dienstprogrammparser
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Parser für den Identitätsnachweis
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Lohnabrechnungsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 50
Parser für US-Führerschein
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
Kostenparser
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 10
Rechnungsparser
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200

Einschränkungen für Document AI

Für Document AI gelten die aktuellen Einschränkungen.

Kriterium Stabile Version – Juli 2023
Dataset
  • Maximal 30.000 Dokumente insgesamt
  • Maximal 250.000 Seiten insgesamt
Dokumentimport
  • Maximal 5.000 Dokumente pro Import
  • Maximal 200 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentextraktors Modellbasiertes Training (allgemein verfügbar)
  • Maximale Größe des Trainings-Datasets: 25.000 Dokumente; 100.000 Seiten
  • Mindestanzahl von Trainingsdaten: Jedes Label muss auf mindestens einem Label pro 10 Dokumenten vorhanden sein
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl von Dokumenten im Test-Dataset: jedes Label auf mindestens 10 Dokumenten
  • Maximal 200 Seiten pro Dokument

Vorlagenbasierte Schulung (GA)
  • Maximale Werte für Trainingsdatensätze: 300 Dokumente, 300 Seiten
  • Mindestanzahl von Dokumenten im Trainings-Dataset: jedes Label auf mindestens 3 Dokumenten
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl für Test-Datasets: jedes Label auf mindestens drei Dokumenten
  • Maximal 20 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentklassifikators (CDC) oder eines benutzerdefinierten Dokument-Splitters (CDS)
  • Maximale Anzahl von Dokumenten und Seiten im Trainingsdatensatz: 30.000 Dokumente; 100.000 Seiten
  • Mindestanzahl von Trainingsdokumenten: jedes Label auf mindestens 10 Dokumenten
  • Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
  • Mindestanzahl für Test-Datasets: jedes Label auf mindestens zwei Dokumenten
  • Maximal 200 Seiten pro Dokument
Labeling
  • Achten Sie zuerst darauf, dass die Dokumentlabels die definierten Mindestgrenzwerte für Training und Bewertung erfüllen.
  • Wenn Sie die Modellleistung für Dokumente mit Layoutvarianten bewerten möchten, müssen Sie mindestens 100 Dokumente mit Labels versehen. Achten Sie darauf, dass jedes Label in 50 Dokumenten im Training und in 50 Dokumenten in der Bewertung vorhanden ist.
  • Maximal zulässige Labels (Felder): 150
  • Labelgrößenbeschränkungen (Zeichen): Lange Elemente werden nicht gut unterstützt, es gibt jedoch keine explizite Beschränkung. Teilen Sie Dokumente in Blöcke mit 800 oder 1.000 Token auf, wobei sich die Blöcke um 100 bis 200 Token überschneiden. Bei Elementen, die länger als der überlappende Bereich sind, kann es zu Qualitätsproblemen kommen.
  • Labelvorkommen in einem Dokument: Keine Beschränkung
Geografische Abdeckung
  • Allgemein unterstützte Regionen: USA, EU (multiregional)
  • Regionen mit eingeschränkter Verfügbarkeit: Deutschland, Singapur, Vereinigtes Königreich, Kanada, Indien, Australien