Ringkasan Document AI

Dokumen ini adalah panduan konsep dasar penggunaan Document AI. Anda harus membaca halaman ini sebelum melanjutkan ke dokumentasi atau panduan memulai cepat lainnya.

Mengotomatiskan alur kerja pemrosesan dokumen

Bisnis di seluruh dunia sangat mengandalkan dokumen untuk menyimpan dan menyampaikan informasi. Informasi ini sering kali perlu didigitalkan agar dapat bermanfaat. Namun, hal ini biasanya dilakukan melalui proses manual yang memakan waktu.

Contoh:

  • Mendigitalkan buku untuk e-reader.
  • Memproses formulir penerimaan medis di klinik dokter.
  • Mem-parsing tanda terima dan invoice untuk validasi laporan pengeluaran.
  • Mengautentikasi identitas berdasarkan kartu identitas.
  • Mengekstrak informasi pendapatan dari formulir pajak untuk menyetujui pinjaman.
  • Memahami kontrak untuk persyaratan perjanjian bisnis utama.

Setiap alur kerja ini melibatkan pengambilan teks mentah dari dokumen, lalu mengekstraksi teks tertentu dari teks yang sesuai dengan data yang diperlukan (kolom atau entitas). Namun, setiap jenis dokumen memiliki struktur dan tata letak yang berbeda, dan pola kolom berbeda-beda bergantung pada kasus penggunaan tertentu.

Komponen Document AI

Document AI adalah platform pemrosesan dan pemahaman dokumen yang mengambil data tidak terstruktur dari dokumen dan mengubahnya menjadi data terstruktur (bidang tertentu, cocok untuk database), sehingga lebih mudah dipahami, dianalisis, dan digunakan.

Document AI dibangun di atas produk dalam Vertex AI dengan AI generatif untuk membantu Anda membuat aplikasi pemrosesan dokumen berbasis cloud yang skalabel dan menyeluruh tanpa memerlukan keahlian machine learning khusus.

Dengan Document AI, Anda dapat:

  • Mendigitalkan dokumen menggunakan OCR untuk mendapatkan teks, tata letak, dan berbagai add-on seperti deteksi kualitas gambar (untuk keterbacaan) dan pelurusan (sepenuhnya otomatis).
  • Mengekstrak informasi teks dan tata letak, dari file dokumen dan menormalisasi entitas.
  • Mengidentifikasi pasangan nilai kunci (kvp) dalam formulir terstruktur dan tabel reguler. Misalnya: Name: Jill Smith adalah kvp.
  • Mengklasifikasikan jenis dokumen untuk mendorong proses hilir seperti ekstraksi dan penyimpanan.
  • Pisahkan dan klasifikasikan dokumen menurut jenisnya. Misalnya, file PDF dengan beberapa dokumen asli.
  • Siapkan set data yang akan digunakan dalam penyesuaian dan evaluasi model menggunakan fitur pemberian label otomatis, pengelolaan skema, dan pengelolaan set data seperti peninjauan dokumen dan prediksi.
  • Mengintegrasikannya dengan produk seperti Cloud Storage, BigQuery, dan Vertex AI Search untuk membantu Anda menyimpan, menelusuri, mengatur, mengelola, dan menganalisis dokumen dan metadata.

Diagram ini menggambarkan semua langkah pemrosesan dokumen utama yang didukung oleh Document AI dan cara menghubungkannya satu sama lain.

docai-overview-1

Prosesor

Pemroses Document AI berada di antara file dokumen dan model machine learning yang melakukan tindakan pemrosesan dan pemahaman dokumen. Model ini dapat digunakan untuk mengklasifikasikan, memisahkan, mengurai, atau menganalisis dokumen.

Setiap Google Cloud project perlu membuat instance pemrosesnya sendiri.

Prosesor termasuk dalam salah satu kategori berikut:

  • Mendigitalkan: OCR.
  • Ekstrak: Pengekstrak kustom, Form Parser, parser tata letak, dan parser terlatih.
  • Klasifikasi: Pengklasifikasi kustom dan pemisah kustom.

Lihat Daftar lengkap prosesor dan detail untuk mengetahui informasi tentang semua jenis prosesor yang tersedia untuk Document AI.

Prosesor mana yang harus saya gunakan?

Untuk menentukan jenis prosesor yang akan digunakan untuk aplikasi tertentu, berikut beberapa panduan umum:

Kategori Kasus penggunaan Jenis prosesor
Mendigitalkan Mengekstrak teks dan informasi tata letak dari dokumen. Enterprise Document OCR
Menganalisis kualitas gambar yang dipindai (keterbacaan) dokumen. Enterprise Document OCR dengan analisis kualitas gambar diaktifkan
Mengekstrak entity dari dokumen kustom yang tidak memenuhi kriteria prosesor kustom.
Ekstrak Mengekstrak tabel atau kvp dari formulir terstruktur dalam dokumen. Parser Formulir
Mengekstrak elemen seperti teks, tabel, dan daftar dalam dokumen serta menampilkan potongan yang sesuai konteks. Layout Parser
Mengekstrak entity dari dokumen kustom yang memenuhi kriteria prosesor kustom. Membuat pengekstrak kustom
Mengekstrak entity dari jenis dokumen khusus. Pemroses terlatih (Latih ulang untuk meningkatkan kualitas.)
Klasifikasikan Mengklasifikasikan dokumen. Membuat Pengklasifikasi Kustom
Membagi dokumen. Membuat Pemisah Kustom

Diagram ini membantu menentukan prosesor mana yang paling cocok untuk setiap kasus penggunaan.

docai-overview-2

Menggunakan pemroses Document AI

Berikut langkah-langkah utama untuk menggunakan Document AI guna mulai memproses dokumen:

  1. Pilih prosesor yang sesuai untuk kasus penggunaan Anda.

  2. Buat pemroses menggunakan Google Cloud konsol atau Document AI API.

    • Document AI membuat endpoint prediksi tempat Anda dapat mengirim dokumen.

    • Untuk mengetahui petunjuk mendetail, lihat Membuat pemroses.

  3. Latih prosesor dengan data pelatihan dan pengujian dari awal, atau tingkatkan versi prosesor baru (yang telah dilatih sebelumnya) di atas versi yang sudah ada.

  4. Kirimkan dokumen Anda untuk diproses.