Ringkasan ekstraksi

Document AI menawarkan beberapa produk untuk mengekstrak informasi dari dokumen untuk berbagai kasus penggunaan:

  • Parser Formulir
  • Ekstraktor kustom, yang menawarkan tiga jenis pemodelan yang berbeda:

    • Model dasar
    • Berbasis model kustom
    • Berbasis template kustom
  • Parser Tata Letak

Form Parser

Parser Formulir mengekstrak pasangan nilai kunci (KVP), tabel, tanda pilihan (kotak centang), dan kolom umum untuk meningkatkan dan mengotomatiskan ekstraksi. Alat ini dapat mengekstrak hingga 11 entitas umum dan kotak centang secara otomatis. Anda tidak menentukan kolom (skema) yang ingin diekstrak dengan Form Parser. Model ini mendeteksi dan menampilkan entity yang diinginkan dari setiap halaman dokumen.

Pengekstrak kustom

Ekstraktor kustom mengekstrak entity yang Anda tentukan dalam skema dan menawarkan tiga opsi pemodelan: model dasar, berbasis model kustom, dan berbasis template kustom. Mengingat hasil yang menjanjikan dari model dasar dengan sedikit atau tanpa data pelatihan, sebaiknya mulai dengan model dasar sebagai opsi pertama dan coba opsi lain sesuai kebutuhan. Model dasar melakukan prediksi zero-shot hingga few-shot, berdasarkan hingga 5 dokumen berlabel dalam set data, dan prediksi yang disesuaikan dengan lebih dari 10 dokumen berlabel dalam set data.

Metode pelatihan Contoh dokumen Variasi tata letak dokumen Teks atau paragraf bentuk bebas Jumlah dokumen pelatihan untuk kualitas siap produksi, bergantung pada variabilitas
Model dasar dan penyesuaian (AI generatif). Kontrak, persyaratan layanan, invoice, laporan mutasi bank, surat muatan kapal, slip gaji. Tinggi ke Rendah (lebih disarankan). Tinggi. Sedang: 0-50+ dokumen.
Model kustom. Model. Formulir serupa dengan variasi tata letak di seluruh tahun atau vendor (misalnya, W9). Rendah hingga sedang. Rendah. Tinggi: 10-100+ dokumen.
Template. Formulir pajak dengan tata letak tetap (misalnya, Formulir 941 dan 709). Tidak ada. Rendah. Rendah (3 dokumen).

Karena model dasar biasanya memerlukan lebih sedikit dokumen pelatihan, model ini direkomendasikan sebagai opsi pertama untuk semua tata letak variabel.

Parser Tata Letak

Layout Parser mengubah dokumen dalam berbagai format menjadi representasi terstruktur, sehingga konten seperti paragraf, tabel, daftar, dan elemen struktural seperti judul, header halaman, dan footer dapat diakses, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam berbagai aplikasi AI generatif dan penemuan.