Pertanyaan umum (FAQ)

Siapa yang akan melabeli data saya?
Kami memiliki dua vendor utama yang secara resmi terdaftar sebagai Subpemroses berdasarkan Adendum Pemrosesan Data Cloud (CDPA): GlobalLogic Technologies Ltd dan Teleperformance Global Services. Subpemroses tunduk pada semua kewajiban kepatuhan dan keamanan Subpemroses standar yang berlaku yang ditetapkan dalam CDPA.

Bisakah Anda memberikan informasi tentang keamanan dan perlindungan data saya?
Semua data yang digunakan di Layanan Pelabelan Data AI Platform dan disimpan di Google Cloud dienkripsi secara default. Pemberi label manusia hanya dapat melihat data Anda selama pelabelan. Kami tidak akan mengungkapkan atau menggunakan data Anda untuk tujuan lain apa pun selain pelabelan data yang Anda minta tanpa seizin Anda. Jika Anda menghapus set data yang diberi label oleh layanan pelabelan data, penghapusan semua salinan data Anda dari sistem kami akan dimulai dalam waktu 24 jam. Kami menerapkan langkah-langkah keamanan yang dimaksudkan untuk mencegah kehilangan data, akses tidak sah, atau spam pada data Anda.

Dapatkah saya memberi label pada data layanan kesehatan?
Ya, AI Platform Data Labeling Service mematuhi HIPAA dan dapat digunakan untuk memberi label pada data layanan kesehatan.

Metode kendali mutu apa yang dapat saya gunakan untuk memastikan kualitas pelabelan?

Anda dapat meminta beberapa pemberi label manusia untuk menganotasi setiap bagian data Anda. Jika terdapat ketidaksepakatan pelabelan, kami akan meminta pendapat tambahan dari pemberi label lain hingga ada konsensus atau kami telah mencapai jumlah pemberi label maksimum yang telah Anda tetapkan.

Misalnya, jika Anda meminta 3 pemberi label:

  1. Untuk tugas klasifikasi gambar, ketiga pemberi label akan mengklasifikasikan setiap gambar dan menggunakan suara terbanyak untuk memutuskan jawaban akhir.
  2. Untuk tugas kotak pembatas gambar, kita akan meminta pemberi label pertama menggambar kotak dan pemberi label kedua memverifikasinya. Jika pemberi label kedua tidak setuju dan melakukan pengeditan, kita akan melanjutkan ke pemberi label ketiga untuk mendapatkan pendapat mayoritas.
Petunjuk sangat penting bagi hasil pelabelan karena mengajarkan cara melabeli set data Anda kepada pemberi label. Oleh karena itu, sebaiknya lihat tips tentang cara membuat petunjuk yang baik. Kami dapat memberi tahu Anda jika petunjuknya tidak jelas.
Selain itu, sebaiknya tingkatkan tugas pelabelan data Anda secara bertahap. Mulai tugas pelabelan pertama Anda dengan sejumlah kecil data, lalu lihat apakah hasilnya sesuai dengan yang Anda harapkan. Revisi instruksi Anda sesuai dengan masukan dan hasil yang Anda terima, lalu buat tugas berikutnya untuk melakukan iterasi sampai Anda merasa nyaman untuk mengirimkan data dalam jumlah yang lebih besar. Tindakan ini akan membantu Anda mendapatkan hasil yang berkualitas tinggi dan mengoptimalkan anggaran.

Apa perbedaan antara "tugas" dan "operasi"?
Tugas adalah tindakan yang Anda lakukan menggunakan Layanan Pelabelan Data, seperti mengimpor data, mengekspor data, atau meminta pelabelan. Operasi adalah tugas Google yang berjalan lama untuk menyelesaikan tugas yang Anda minta menggunakan panggilan API.

Bagaimana cara mengetahui kapan operasi (impor, ekspor, atau pelabelan) dilakukan?
Saat Anda menggunakan Data Labeling Service API untuk meminta impor, ekspor, atau pelabelan, respons akan menyertakan nama operasi yang akan menyelesaikan tugas yang diminta. Anda dapat menggunakan nama operasi untuk memeriksa status permintaan.
Saat operasi berjalan, Anda akan melihat kolom progressPercent yang menunjukkan progres (jika tidak ditampilkan, progresnya adalah 0%). Setelah operasi selesai, respons akan menyertakan nilai "done": true.
Anda juga akan menerima email setiap kali operasi selesai.

Bagaimana cara mendapatkan ID set data yang dianotasi setelah meminta pelabelan?
ListAnnotatedDatasets menampilkan nama set data yang dianotasi.Format namanya adalah projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id; ID-nya adalah nilai yang muncul setelah annotatedDataSets/.

Apa artinya ketika saya mendapatkan HttpError 404 dengan pesan "The requested resource access are not available. Permintaan ini ditolak karena konflik sumber daya."?
Ini berarti operasi lain yang berjalan menggunakan resource. Misalnya, Anda mungkin mendapatkan error ini jika meminta pelabelan sebelum operasi impor data selesai.

Mengapa saya tidak dapat menghapus tugas set data/petunjuk/pelabelan?
Kemungkinan ada konflik resource karena operasi yang berjalan menggunakan resource tersebut.

Apakah saya harus mengetik semua label secara manual satu per satu untuk membuat set label?
Ya, jika Anda menggunakan UI Layanan Pelabelan Data AI Platform. Jika menggunakan API, Anda dapat meneruskan argumen sebanyak yang diinginkan secara terprogram.

Mengapa permintaan pelabelan data kotak pembatas gambar saya ditampilkan dalam beberapa menit tanpa anotasi?
Kemungkinan besar format gambar Anda tidak didukung.

Mengapa persentase progres masih di nol setelah saya mengirimkan tugas pelabelan?
Dua kemungkinan alasannya (Anda dapat menghubungi cloudml-data-customer@google.com untuk informasi selengkapnya):
  • Tugas Anda belum diambil karena banyaknya permintaan. Tugas ini dimasukkan ke dalam antrean dan akan dimulai sesegera mungkin.
  • Anda meminta beberapa pemberi label per item dan tidak semua pemberi label telah memberi label pada item data. Misalnya, jika Anda meminta tiga pemberi label, item data akan ditandai sebagai selesai hanya setelah ketiga pemberi label selesai melabelinya. Meskipun semua item data telah diberi label oleh satu atau dua pemberi label, persentase progresnya akan tetap nol.