Maksimum set data pelatihan: 300 dokumen, 300 halaman
Set data pelatihan minimum: setiap label pada minimal 3 dokumen
Batas maksimum set data pengujian: 2.000 dokumen; 8.000 halaman
Set data pengujian minimum: setiap label pada minimal 3 dokumen
Maksimum 20 halaman per dokumen
Batasan untuk melatih Pengklasifikasi Dokumen Kustom (CDC) atau Pemisah Dokumen Kustom (CDS)
Maksimum set data pelatihan: 30.000 dokumen; 100.000 halaman
Set data pelatihan minimum: setiap label pada minimal 10 dokumen
Batas maksimum set data pengujian: 2.000 dokumen; 8.000 halaman
Set data pengujian minimum: setiap label pada minimal 2 dokumen
Maksimum 200 halaman per dokumen
Pelabelan
Untuk memulai, pastikan label dokumen memenuhi nilai minimum pelatihan dan evaluasi yang ditentukan.
Untuk mulai mengevaluasi performa model untuk dokumen dengan variasi tata letak, beri label pada setidaknya 100 dokumen. Secara khusus, pastikan setiap label ada di 50 dokumen dalam pelatihan dan 50 dalam evaluasi.
Maksimum label (kolom) yang diizinkan: 150
Batas ukuran label (karakter): Item panjang tidak didukung dengan baik, tetapi tidak ada batas eksplisit. Pisahkan dokumen menjadi potongan 800 atau 1.000 token, dengan 100 hingga 200 token yang tumpang-tindih di antara potongan. (Item yang lebih panjang dari area tumpang-tindih mungkin mengalami masalah kualitas.)
Kejadian label dalam dokumen: Tidak ada batas
Cakupan geografis
Region yang umumnya didukung: AS, Uni Eropa (multi-region)
Wilayah dengan aksesibilitas terbatas: Jerman, Singapura, Inggris Raya, Kanada, India, Australia
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-01-24 UTC."],[],[]]