Tugas dan pemicu tugas

Tugas adalah tindakan yang dijalankan oleh Sensitive Data Protection untuk memindai konten guna menemukan data sensitif atau menghitung risiko identifikasi ulang. Sensitive Data Protection membuat dan menjalankan resource tugas setiap kali Anda memintanya untuk memeriksa data Anda.

Saat ini ada dua jenis tugas Sensitive Data Protection:

  • Tugas inspeksi memeriksa konten Anda untuk menemukan data sensitif sesuai dengan kriteria Anda dan membuat laporan ringkasan tentang lokasi dan jenis data sensitif yang ada.
  • Tugas analisis risiko menganalisis data yang dide-identifikasi dan menampilkan metrik tentang kemungkinan data dapat diidentifikasi ulang.

Anda dapat menjadwalkan kapan Sensitive Data Protection menjalankan tugas dengan membuat pemicu tugas. Pemicu tugas adalah peristiwa yang mengotomatiskan pembuatan tugas Sensitive Data Protection untuk memindai repositori penyimpanan Google Cloud, termasuk bucket Cloud Storage, tabel BigQuery, dan jenis Datastore.

Pemicu tugas memungkinkan Anda menjadwalkan tugas pemindaian dengan menetapkan interval saat setiap pemicu diaktifkan. Pemicu dapat dikonfigurasi untuk mencari temuan baru sejak pemindaian terakhir dijalankan untuk membantu memantau perubahan atau penambahan pada konten, atau untuk membuat laporan temuan terbaru. Pemicu terjadwal berjalan pada interval yang Anda tetapkan, dari 1 hari hingga 60 hari.

Langkah berikutnya

Informasi selengkapnya tentang cara membuat, mengedit, dan menjalankan tugas serta pemicu tugas dalam topik berikut:

Selain itu, quickstart berikut tersedia:

Objek JobTrigger

Pemicu tugas direpresentasikan di DLP API oleh objek JobTrigger.

Kolom konfigurasi pemicu tugas

Setiap JobTrigger berisi beberapa kolom konfigurasi, termasuk:

  • Nama dan nama tampilan pemicu, serta deskripsi.
  • Kumpulan objek Trigger, yang masing-masing berisi objek Schedule, yang menentukan pengulangan pemindaian dalam hitungan detik.
  • Objek InspectJobConfig, yang berisi informasi konfigurasi untuk tugas yang dipicu.
  • Enumerasi Status, yang menunjukkan apakah pemicu saat ini aktif.
  • Kolom stempel waktu yang mewakili waktu pembuatan, pembaruan, dan waktu terakhir dijalankan.
  • Kumpulan objek Error, jika ada, ditemukan saat pemicu diaktifkan.

Metode pemicu tugas

Setiap objek JobTrigger juga menyertakan beberapa metode bawaan. Dengan menggunakan metode ini, Anda dapat:

Latensi tugas

Tidak ada tujuan tingkat layanan (SLO) yang dijamin untuk tugas dan pemicu tugas. Latensi dipengaruhi oleh beberapa faktor, termasuk jumlah data yang akan dipindai, repositori penyimpanan yang dipindai, jenis dan jumlah infoTypes yang Anda pindai, region tempat tugas diproses, dan resource komputasi yang tersedia di region tersebut. Oleh karena itu, latensi tugas pemeriksaan tidak dapat ditentukan sebelumnya.

Untuk membantu mengurangi latensi tugas, Anda dapat mencoba hal berikut:

  • Jika sampling tersedia untuk tugas atau pemicu tugas, aktifkan.
  • Hindari mengaktifkan infoTypes yang tidak diperlukan. Meskipun hal berikut berguna dalam skenario tertentu, infoTypes ini dapat membuat permintaan berjalan jauh lebih lambat daripada permintaan yang tidak menyertakannya:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Selalu tentukan infoTypes secara eksplisit. Jangan gunakan daftar infoTypes kosong.

  • Jika memungkinkan, gunakan region pemrosesan yang berbeda.

Jika Anda masih mengalami masalah latensi dengan tugas setelah mencoba teknik ini, pertimbangkan untuk menggunakan permintaan content.inspect atau content.deidentify, bukan tugas. Metode ini tercakup dalam Perjanjian Tingkat Layanan. Untuk mengetahui informasi selengkapnya, lihat Perjanjian Tingkat Layanan Perlindungan Data Sensitif.

Batasi pemindaian hanya untuk konten baru

Anda dapat mengonfigurasi pemicu tugas untuk menetapkan tanggal rentang waktu secara otomatis untuk file yang disimpan di Cloud Storage atau BigQuery. Saat Anda menetapkan objek TimespanConfig untuk diisi otomatis, Perlindungan Data Sensitif hanya memindai data yang ditambahkan atau diubah sejak pemicu terakhir kali dijalankan:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Untuk pemeriksaan BigQuery, hanya baris yang berusia minimal tiga jam yang disertakan dalam pemindaian. Lihat masalah umum yang terkait dengan operasi ini.

Memicu tugas saat file diupload

Selain dukungan untuk pemicu tugas—yang terintegrasi dengan Sensitive Data Protection—Google Cloud juga memiliki berbagai komponen lain yang dapat Anda gunakan untuk mengintegrasikan atau memicu tugas Sensitive Data Protection. Misalnya, Anda dapat menggunakan fungsi Cloud Run untuk memicu pemindaian Perlindungan Data Sensitif setiap kali file diupload ke Cloud Storage.

Untuk informasi tentang cara menyiapkan operasi ini, lihat Mengotomatiskan klasifikasi data yang diupload ke Cloud Storage.