Praktik Terbaik dan Batasan yang Diketahui

Praktik Terbaik

  • Kumpulan pelabel tunggal per project - Dalam skenario BYOL, meskipun UI Penyiapan HITL mendukung pembuatan kumpulan pelabel baru untuk setiap pemroses, sebaiknya gunakan satu kumpulan pelabel di semua pemroses dalam project agar tetap sederhana. Hal ini karena pengguna dari beberapa kumpulan pelabel masih dapat ditetapkan ke tugas yang sama, dan menetapkan kumpulan pelabel ke tugas tidak membatasi Pengelola Pelabel untuk menetapkan pelabel lain ke tugas tersebut.
  • Beberapa tugas/jenis dokumen - Beberapa tugas mungkin diperlukan untuk memproses satu jenis dokumen. Tindakan ini diperlukan dalam skenario berikut:
    • Pelabel dengan keterampilan atau kredensial yang berbeda diperlukan untuk meninjau/memvalidasi kolom yang berbeda dari dokumen yang sama.
    • Dokumen dengan kolom yang berbeda (misalnya, invoice dari vendor yang berbeda) mungkin memerlukan skema yang berbeda untuk divalidasi, sehingga perlu diarahkan ke tugas yang berbeda.
    • Dokumen dari pelanggan yang berbeda memiliki kumpulan pelabel yang berbeda yang mengerjakannya (misalnya, invoice dari pelanggan, bahasa, atau negara yang berbeda).
    Dalam skenario ini, sebaiknya buat beberapa pemroses (dan tugas) serta posting dokumen ke tugas yang sesuai. [Pengklasifikasi mungkin diperlukan untuk mengklasifikasikan dokumen ini dan memposting ke pemroses yang benar].
  • Batasi Peninjauan pada kolom yang diperlukan (bukan semua kolom yang diekstrak di halaman), untuk menghemat waktu dan biaya Peninjauan - Waktu/halaman Jawaban diskalakan dengan jumlah kolom yang akan ditinjau. Biaya pemberi label Google didasarkan pada jumlah kolom yang ditinjau. Oleh karena itu, sebaiknya batasi kolom yang akan ditinjau hanya pada kolom yang digunakan dalam proses bisnis downstream.
    • Misalnya, Faktur mungkin memiliki lebih dari 30 kolom, tetapi Anda dapat membatasi Peninjauan hanya pada 4-5 kolom yang penting untuk menyelesaikan faktur.
  • Penamaan Prosesor yang Kompatibel dengan HITL - Nama tugas HITL sama dengan nama prosesor. Sebaiknya gunakan nama yang dipahami oleh pengelola dan pelabel, serta mudah dibedakan dari tugas lain yang akan mereka kerjakan.
  • Membuat Prioritas Tugas - Jika pelabel ditugaskan untuk beberapa tugas, dia akan memprosesnya secara berurutan. Jika pelabel perlu beralih tugas (misalnya, untuk merespons eskalasi pelanggan atau memenuhi SLO), Pengelola Pelabelan harus membatalkan penugasan tugas saat ini dan menugaskan tugas Prioritas Tinggi kepada pelabel menggunakan tab Penugasan di Konsol Pengelola Pelabelan.
    • Petak Tugas X Pemberi Label di Konsol (ditampilkan di bawah) memungkinkan Pengelola Pemberian Label melihat semua penugasan pemberi label ke berbagai tugas dan menyesuaikan pemberi label mana yang mengerjakan tugas mana untuk mendukung prioritas tugas.
  • Menetapkan Filter Validasi Filter validasi
  • Dokumen yang ditolak - Status dokumen yang ditolak beserta Kode alasan [misalnya, jenis dokumen berbeda, dipalsukan, silau, buram, tepi terpotong, dll.] dicatat dalam file JSON Dokumen (konstruksi TextChange untuk semua perubahan, HumanReview untuk alasan penolakan), yang ditampilkan dalam bucket Cloud Storage yang dikonfigurasi. Sebaiknya gunakan metadata ini untuk memisahkan dokumen yang ditolak.
  • Menangani volume penyerapan dokumen yang besar - Kuota saat ini membatasi 600 permintaan dokumen online/menit dan hingga 5 permintaan offline (batch) serentak, yang masing-masing menangani hingga 50 dokumen. Hal ini diharapkan dapat menangani 36.000 permintaan online/jam dan hingga 15.000 permintaan dokumen offline (batch)/jam [karena setiap batch menangani hingga 50 dokumen]. Jika diperlukan volume yang lebih tinggi, hubungi Dukungan.
  • Mengelola biaya dan waktu validasi manual - Validasi manual bisa jadi mahal, baik Anda menggunakan pelabel sendiri atau pelabel Google. Waktu yang dihabiskan per halaman diskalakan dengan jumlah kolom yang ditinjau. Google Workforce (dalam Private Preview) ditagih per label yang ditinjau. Anda dapat mengontrol upaya dan biaya peninjauan dengan membatasi HITL ke kolom penting yang perlu diverifikasi dan dikoreksi. Untuk melakukannya, gunakan filter Validasi tingkat Label di layar konfigurasi Peninjauan Manual.
  • Akses Single Sign-on dengan kredensial Enterprise - Labeler Workbench dan Labeling Manager Console mendukung kredensial Tenaga Kerja Google atau Gmail. Jika single sign-on dengan kredensial perusahaan diperlukan, buat akun Basic Google Workforce untuk tenaga pelabel Anda. Tenaga Kerja Google mendukung SAML dan Anda dapat mengonfigurasi penyedia SSO untuk login ke Labeler Workbench atau Konsol Pengelola Pemberian Label dengan kredensial perusahaan.

Batasan dan Solusi Umum

Berikut adalah beberapa batasan umum dan kemungkinan solusinya. Saat ini kami sedang mengatasi batasan tersebut.

  • Kotak pembatas harus menangkap beberapa teks - Jika HITL digunakan untuk menganotasi dokumen untuk pelatihan, setiap kotak pembatas yang digambar harus mendeteksi beberapa OCR. Nilai tidak boleh kosong. Memasukkan nilai secara manual tidak akan memperbaiki masalah ini.
  • Kumpulan Pemberi Label Baru
  • VPC-SC - Pelanggan yang mengaktifkan VPC-SC di project HITL mereka mungkin tidak dapat menggunakan pelabel Google untuk Peninjauan HITL.
  • Latensi Pasca-peninjauan - Setelah dokumen ditinjau, mungkin diperlukan waktu hingga 30 menit agar dokumen tersebut disimpan di folder Cloud Storage yang telah dikonfigurasi sebelumnya.
  • Batas 10 halaman - Peninjauan HITL dibatasi hingga 10 halaman untuk Invoice. Invoice yang lebih dari 10 halaman tidak dikirim untuk peninjauan HITL.
  • Alur kerja pelabel tunggal - Tugas alur kerja saat ini terbatas pada peninjauan pelabel tunggal. Jika dokumen perlu ditinjau oleh beberapa peninjau (untuk QA, pencegahan penipuan, dll.), upload dokumen yang telah ditinjau ke pemroses kedua dalam mode "Lewati pemroses, kirim semua dokumen untuk Peninjauan HITL", sehingga dokumen tersebut ditinjau.
  • Edit Pengelola Pemberian Label di Kumpulan pemberian label - Dalam tugas BYOL, pengelola pemberian label tidak dapat ditambahkan atau dihapus ke kumpulan pemberian label setelah dibuat. Solusi: Saat membuat kumpulan pelabelan baru,
    • Tetapkan lebih dari 1 pengelola pelabelan, sehingga jika salah satu pengelola keluar sebelum tugas selesai, pengelola lain dapat mengelola kumpulan dan penugasan tugas.
    • Individu yang perlu melihat dasbor analisis tugas atau pelabel di UI Pengelola Pelabelan harus ditambahkan sebagai Pengelola Kumpulan saat membuat kumpulan.
  • Membatalkan Tugas - Setelah dimulai, tugas tidak dapat dibatalkan. Solusinya adalah Pengelola Pelabelan harus menjeda tugas atau membatalkan penetapan tugas kepada pemberi label di Konsol Pengelola Pelabelan.
  • Menetapkan Tugas ke seluruh Kumpulan Pelabel dalam sekali klik - saat ini tidak didukung, tetapi akan segera didukung. Solusinya adalah memilih semua pelabel dan menetapkan tugas kepada mereka.
  • Kumpulan Pemberi Label Baru
  • Pelabel BYOL dengan akun Google Workspace - Jika pengelola pelabelan BYOL dan pelabel memiliki akun Google Workspace, Admin Google Workspace mungkin perlu mengaktifkan "Layanan Lainnya" di bagian bawah halaman Layanan Google (screenshot di bawah), untuk mengaktifkan akses ke Konsol Pengelola Pelabelan dan Workbench Pelabel. Google Workspace