Maximale Werte für Trainingsdatensätze: 300 Dokumente, 300 Seiten
Mindestanzahl von Dokumenten im Trainings-Dataset: jedes Label auf mindestens 3 Dokumenten
Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanzahl für Test-Datasets: jedes Label auf mindestens drei Dokumenten
Maximal 20 Seiten pro Dokument
Einschränkungen beim Trainieren eines benutzerdefinierten Dokumentklassifikators (CDC) oder eines benutzerdefinierten Dokument-Splitters (CDS)
Maximale Anzahl von Dokumenten und Seiten im Trainingsdatensatz: 30.000 Dokumente; 100.000 Seiten
Mindestanzahl von Trainingsdokumenten: jedes Label auf mindestens 10 Dokumenten
Maximale Größe des Test-Datasets: 2.000 Dokumente; 8.000 Seiten
Mindestanzahl für Test-Datasets: jedes Label auf mindestens zwei Dokumenten
Maximal 200 Seiten pro Dokument
Labeling
Achten Sie zuerst darauf, dass die Dokumentlabels die definierten Mindestgrenzwerte für Training und Bewertung erfüllen.
Wenn Sie die Modellleistung für Dokumente mit Layoutvarianten bewerten möchten, müssen Sie mindestens 100 Dokumente mit Labels versehen. Achten Sie darauf, dass jedes Label in 50 Dokumenten im Training und in 50 Dokumenten in der Bewertung vorhanden ist.
Maximal zulässige Labels (Felder): 150
Labelgrößenbeschränkungen (Zeichen): Lange Elemente werden nicht gut unterstützt, es gibt jedoch keine explizite Beschränkung. Teilen Sie Dokumente in Blöcke mit 800 oder 1.000 Token auf, wobei sich die Blöcke um 100 bis 200 Token überschneiden. Bei Elementen, die länger als der überlappende Bereich sind, kann es zu Qualitätsproblemen kommen.
Labelvorkommen in einem Dokument: Keine Beschränkung
Geografische Abdeckung
Allgemein unterstützte Regionen: USA, EU (multiregional)
Regionen mit eingeschränkter Verfügbarkeit: Deutschland, Singapur, Vereinigtes Königreich, Kanada, Indien, Australien
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-02-14 (UTC)."],[],[]]