Halaman ini diterjemahkan oleh Cloud Translation API.

Ringkasan pengekstrak kustom

Ekstraktor kustom mengekstrak entity dari dokumen dengan jenis tertentu. Misalnya, model ini dapat mengekstrak item dalam menu atau nama dan informasi kontak dari resume.

Ringkasan

Tujuan ekstraktor kustom adalah memungkinkan pengguna Document AI membuat solusi ekstraksi entitas kustom untuk jenis dokumen baru yang tidak memiliki prosesor terlatih. Ekstraktor kustom mencakup kombinasi model deep learning yang memahami tata letak (untuk AI generatif dan model kustom) dan model berbasis template.

Metode pelatihan mana yang harus saya gunakan?

Ekstraktor kustom mendukung berbagai kasus penggunaan dengan tiga mode berbeda.

Metode pelatihan		Contoh dokumen	Variasi tata letak dokumen	Teks atau paragraf bentuk bebas	Jumlah dokumen pelatihan untuk kualitas siap produksi, bergantung pada variabilitas
Model dasar dan penyesuaian (AI generatif).		Kontrak, persyaratan layanan, invoice, laporan mutasi bank, surat muatan kapal, slip gaji.	Tinggi ke Rendah (lebih disukai).	Tinggi.	Sedang: 0-50+ dokumen.
Model kustom.	Model.	Formulir serupa dengan variasi tata letak di berbagai tahun atau vendor (misalnya, W9).	Rendah hingga sedang.	Rendah.	Tinggi: 10-100+ dokumen.
Model kustom.	Template.	Formulir pajak dengan tata letak tetap (misalnya, Formulir 941 dan 709).	Tidak ada.	Rendah.	Rendah (3 dokumen).

Karena model dasar biasanya memerlukan lebih sedikit dokumen pelatihan, model ini direkomendasikan sebagai opsi pertama untuk semua tata letak variabel.

Skor keyakinan

Skor keyakinan menunjukkan seberapa kuat model Anda mengaitkan setiap entity dengan nilai yang diprediksi. Nilainya antara nol dan satu, makin dekat ke satu, makin tinggi keyakinan model bahwa nilai tersebut sesuai dengan entitas. Dengan demikian, pengguna dapat menetapkan pemicu untuk peninjauan manual setiap entity saat nilainya rendah. Misalnya, menentukan apakah teks dalam suatu entitas adalah "Hello, world!" atau "HeIIo vvorld!"

Manfaat pendekatan ini memungkinkan untuk menemukan setiap entitas dengan keyakinan rendah, menetapkan nilai minimum untuk prediksi yang digunakan, memilih nilai minimum keyakinan yang optimal, dan mengembangkan strategi baru untuk melatih model dengan akurasi dan skor keyakinan yang lebih tinggi.

Untuk mengetahui informasi selengkapnya tentang konsep dan metrik evaluasi, lihat Mengevaluasi Performa

Sebelumnya

Form Parser

Berikutnya

Mekanisme pengekstrak kustom