Mengirim hasil pemeriksaan Perlindungan Data Sensitif ke Data Catalog

Panduan ini menunjukkan cara menggunakan Perlindungan Data Sensitif untuk memeriksa tabel BigQuery dan mengirim hasil pemeriksaan ke Data Catalog.

Anda juga dapat melakukan pembuatan profil data, yang berbeda dengan operasi pemeriksaan. Anda juga dapat mengirim profil data ke Dataplex. Untuk mengetahui informasi selengkapnya, lihat Tabel tag di Dataplex berdasarkan insight dari profil data.

Data Catalog adalah layanan pengelolaan metadata skalabel yang memungkinkan Anda menemukan, mengelola, dan memahami semua data di Google Cloud dengan cepat.

Perlindungan Data Sensitif memiliki integrasi bawaan dengan Data Catalog. Saat Anda menggunakan tindakan Perlindungan Data Sensitif untuk memeriksa data sensitif pada tabel BigQuery, tindakan ini dapat mengirimkan hasilnya langsung ke Data Catalog dalam bentuk template tag.

Dengan menyelesaikan langkah-langkah dalam panduan ini, Anda akan melakukan hal berikut:

  • Aktifkan Katalog Data dan Perlindungan Data Sensitif.
  • Siapkan Perlindungan Data Sensitif untuk memeriksa tabel BigQuery.
  • Mengonfigurasi pemeriksaan Perlindungan Data Sensitif untuk mengirim hasil pemeriksaan ke Data Catalog.

Untuk mengetahui informasi selengkapnya tentang Data Catalog, lihat dokumentasi Data Catalog.

Jika Anda ingin mengirim hasil operasi pembuatan profil data—bukan tugas pemeriksaan—ke Dataplex, lihat dokumentasi untuk membuat profil organisasi, folder, atau project.

Biaya

Dalam dokumen ini, Anda menggunakan komponen Google Cloud yang dapat ditagih berikut:

  • Perlindungan Data Sensitif
  • BigQuery

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga. Pengguna baru Google Cloud mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Sebelum memulai

Sebelum Anda dapat mengirim hasil pemeriksaan Perlindungan Data Sensitif ke Katalog Data, lakukan hal berikut:

  • Langkah 1: Siapkan penagihan.
  • Langkah 2: Buat project baru dan isi tabel BigQuery baru. (Opsional.)
  • Langkah 3: Aktifkan Data Catalog.
  • Langkah 4: Aktifkan Perlindungan Data Sensitif.

Subbagian berikut membahas setiap langkah secara mendetail.

Langkah 1: Siapkan penagihan

Anda harus menyiapkan akun penagihan terlebih dahulu jika belum memilikinya.

Pelajari cara mengaktifkan penagihan

Langkah 2: Buat project baru dan isi tabel BigQuery baru (Opsional)

Jika Anda menyiapkan fitur ini untuk pekerjaan produksi atau sudah memiliki tabel BigQuery yang ingin diperiksa, buka project Google Cloud yang berisi tabel tersebut dan lanjutkan ke Langkah 3.

Jika Anda mencoba fitur ini dan ingin memeriksa data pengujian, buat project baru. Untuk menyelesaikan langkah ini, Anda harus memiliki peran Project Creator IAM. Pelajari peran IAM lebih lanjut.

  1. Buka halaman New Project di Konsol Google Cloud.

    Project Baru

  2. Pada menu drop-down Billing account, pilih akun penagihan yang akan menerima tagihan project.
  3. Pada menu drop-down Organization, pilih organisasi tempat Anda ingin membuat project.
  4. Pada menu drop-down Location, pilih organisasi atau folder tempat Anda ingin membuat project.
  5. Klik Create untuk membuat project.

Selanjutnya, download dan simpan contoh data:

  1. Buka repositori tutorial Cloud Functions di GitHub.
  2. Pilih salah satu file CSV yang memiliki data contoh, lalu download filenya.
  3. Selanjutnya, buka BigQuery di Konsol Google Cloud.
  4. Pilih project Anda.
  5. Klik Create Dataset.
  6. Klik Create Table.
  7. Klik Upload, lalu pilih file yang ingin diupload.
  8. Beri nama tabel, lalu klik Buat Tabel.

Langkah 3: Aktifkan Data Catalog

Selanjutnya, aktifkan Data Catalog untuk project yang berisi tabel BigQuery yang ingin Anda periksa menggunakan Perlindungan Data Sensitif.

Untuk mengaktifkan Data Catalog menggunakan Konsol Google Cloud:

  1. Daftarkan aplikasi Anda untuk Data Catalog.

    Mendaftarkan aplikasi Anda untuk Data Catalog

  2. Di halaman pendaftaran, dari menu drop-down Create a project, pilih project yang ingin Anda gunakan dengan Data Catalog.
  3. Setelah Anda memilih project, klik Continue.

Data Catalog sekarang diaktifkan untuk project Anda.

Langkah 4: Aktifkan Perlindungan Data Sensitif

Aktifkan Perlindungan Data Sensitif untuk project yang sama tempat Anda mengaktifkan Data Catalog.

Untuk mengaktifkan Perlindungan Data Sensitif menggunakan Konsol Google Cloud:

  1. Daftarkan aplikasi Anda untuk Perlindungan Data Sensitif.

    Mendaftarkan aplikasi Anda untuk Perlindungan Data Sensitif

  2. Di halaman pendaftaran, dari menu drop-down Create a project, pilih project yang sama dengan yang Anda pilih di langkah sebelumnya.
  3. Setelah Anda memilih project, klik Continue.

Perlindungan Data Sensitif sekarang diaktifkan untuk project Anda.

Mengonfigurasi dan menjalankan tugas pemeriksaan Perlindungan Data Sensitif

Anda dapat mengonfigurasi dan menjalankan tugas pemeriksaan Perlindungan Data Sensitif menggunakan Konsol Google Cloud atau DLP API.

Template tag Data Catalog disimpan di project dan region yang sama dengan tabel BigQuery. Jika memeriksa tabel dari project lain, Anda harus memberikan peran Pemilik TagTemplate Data Catalog (roles/datacatalog.tagTemplateOwner) kepada agen layanan Perlindungan Data Sensitif dalam project tempat tabel BigQuery berada.

Konsol Google Cloud

Untuk menyiapkan tugas pemeriksaan tabel BigQuery menggunakan Perlindungan Data Sensitif:

  1. Di bagian Perlindungan Data Sensitif pada Konsol Google Cloud, buka halaman Buat tugas atau pemicu tugas.

    Buka Buat tugas atau pemicu tugas

  2. Masukkan informasi tugas Perlindungan Data Sensitif dan klik Lanjutkan untuk menyelesaikan setiap langkah:

    • Untuk Langkah 1: Pilih data input, beri nama tugas dengan memasukkan nilai di kolom Name. Di Lokasi, pilih BigQuery dari menu Jenis penyimpanan, lalu masukkan informasi untuk tabel yang akan diperiksa. Bagian Pengambilan sampel telah dikonfigurasi sebelumnya untuk menjalankan pemeriksaan sampel terhadap data Anda. Anda dapat menyesuaikan kolom Batasi baris menurut dan Jumlah baris maksimum untuk menghemat resource jika Anda memiliki data dalam jumlah besar. Untuk detail selengkapnya, lihat Memilih data input.

    • (Opsional) Pada Langkah 2: Konfigurasikan deteksi, Anda mengonfigurasi jenis data yang akan dicari, yang disebut "infoTypes". Untuk tujuan panduan ini, pastikan infoType default tetap dipilih. Untuk detail selengkapnya, lihat Mengonfigurasi deteksi.

    • Untuk Langkah 3: Tambahkan tindakan, aktifkan Save to Data Catalog.

    • (Opsional) Untuk Langkah 4: Schedule, untuk keperluan panduan ini, biarkan menu disetel ke None agar pemeriksaan hanya berjalan sekali. Untuk mempelajari lebih lanjut cara menjadwalkan tugas pemeriksaan berulang, lihat Jadwal.

  3. Klik Create. Tugas akan segera berjalan.

DLP API

Di bagian ini, Anda akan mengonfigurasi dan menjalankan tugas pemeriksaan Perlindungan Data Sensitif.

Tugas pemeriksaan yang Anda konfigurasikan di sini menginstruksikan Perlindungan Data Sensitif untuk memeriksa contoh data BigQuery yang dijelaskan pada Langkah 2 di atas atau data BigQuery Anda sendiri. Konfigurasi tugas yang Anda tentukan juga merupakan tempat Anda menginstruksikan Perlindungan Data Sensitif untuk menyimpan hasil pemeriksaannya ke Data Catalog.

Langkah 1: Catat ID project Anda

  1. Buka Konsol Google Cloud.

    Buka konsol Google Cloud.

  2. Klik Pilih.

  3. Pada menu drop-down Select from, pilih organisasi tempat Anda mengaktifkan Data Catalog.

  4. Di bagian ID, salin project ID untuk project yang berisi data yang ingin Anda periksa. Ini adalah project yang dijelaskan dalam langkah menetapkan repositori penyimpanan sebelumnya di halaman ini.

  5. Di bagian Name, klik project untuk memilihnya.

Langkah 2: Buka APIs Explorer dan konfigurasi tugas

  1. Buka APIs Explorer di halaman referensi untuk metode dlpJobs.create. Agar petunjuk ini tetap tersedia, klik kanan link berikut dan buka di tab atau jendela baru:

    Membuka Penjelajah API

  2. Di kotak parent, masukkan kode berikut, dengan project-id adalah project ID yang Anda catat sebelumnya di langkah sebelumnya:

    projects/project-id

    Selanjutnya, salin JSON berikut. Pilih konten kolom Isi kolom permintaan di APIs Explorer, lalu tempel JSON untuk mengganti kontennya. Pastikan untuk mengganti placeholder project-id, bigquery-dataset-name, dan bigquery-table-name dengan project ID dan set data BigQuery serta nama tabel yang sebenarnya.

    {
      "inspectJob":
      {
        "storageConfig":
        {
          "bigQueryOptions":
          {
            "tableReference":
            {
              "projectId": "project-id",
              "datasetId": "bigquery-dataset-name",
              "tableId": "bigquery-table-name"
            }
          }
        },
        "inspectConfig":
        {
          "infoTypes":
          [
            {
              "name": "EMAIL_ADDRESS"
            },
            {
              "name": "PERSON_NAME"
            },
            {
              "name": "US_SOCIAL_SECURITY_NUMBER"
            },
            {
              "name": "PHONE_NUMBER"
            }
          ],
          "includeQuote": true,
          "minLikelihood": "UNLIKELY",
          "limits":
          {
            "maxFindingsPerRequest": 100
          }
        },
        "actions":
        [
          {
            "publishFindingsToCloudDataCatalog": {}
          }
        ]
      }
    }
    

Untuk mempelajari opsi pemeriksaan yang tersedia lebih lanjut, lihat Memeriksa penyimpanan dan database untuk data sensitif. Untuk mengetahui daftar lengkap jenis informasi yang dapat diperiksa oleh Perlindungan Data Sensitif, lihat referensi InfoType.

Langkah 3: Jalankan permintaan untuk memulai tugas pemeriksaan

Setelah mengonfigurasi tugas dengan mengikuti langkah-langkah sebelumnya, klik Execute untuk mengirim permintaan. Jika permintaan berhasil, respons akan muncul dengan kode berhasil dan objek JSON yang menunjukkan status tugas Perlindungan Data Sensitif yang baru saja Anda buat.

Respons terhadap permintaan inspeksi mencakup ID tugas dari tugas pemeriksaan Anda sebagai kunci "name", dan status tugas pemeriksaan saat ini sebagai kunci "state". Karena Anda baru saja mengirimkan permintaan, status tugas pada saat itu adalah "PENDING".

Memeriksa status tugas pemeriksaan Perlindungan Data Sensitif

Setelah Anda mengirimkan permintaan inspeksi, tugas inspeksi akan segera dimulai.

Konsol Google Cloud

Untuk memeriksa status tugas pemeriksaan:

  1. Di Konsol Google Cloud, buka Perlindungan Data Sensitif.

    Buka Perlindungan Data Sensitif

  2. Klik tab Tugas & pemicu tugas, lalu klik Semua tugas.

Pekerjaan yang baru saja Anda jalankan kemungkinan akan berada di bagian atas daftar. Periksa kolom State untuk memastikan statusnya Done.

Anda dapat mengklik ID Lowongan dari tugas tersebut untuk melihat hasilnya. Setiap pendeteksi infoType yang tercantum pada halaman Detail tugas diikuti dengan jumlah kecocokan yang ditemukan dalam konten.

DLP API

Untuk memeriksa status tugas pemeriksaan:

  1. Buka APIs Explorer di halaman referensi untuk metode dlpJobs.get dengan mengklik tombol berikut:

    Membuka Penjelajah API

  2. Di kotak name, ketik nama tugas dari respons JSON terhadap permintaan inspeksi dalam bentuk berikut:

    projects/project-id/dlpJobs/job-id
    ID pekerjaan dalam bentuk i-1234567890123456789.

  3. Untuk mengirim permintaan, klik Jalankan.

Jika kunci "state" objek JSON respons menunjukkan bahwa tugas tersebut adalah "DONE", berarti tugas pemeriksaan telah selesai.

Untuk melihat JSON respons lainnya, scroll halaman ke bawah. Di bagian "result" > "infoTypeStats", setiap jenis informasi yang tercantum harus memiliki "count" yang sesuai. Jika tidak, pastikan Anda memasukkan JSON secara akurat, dan jalur atau lokasi ke data Anda sudah benar.

Setelah tugas pemeriksaan selesai, Anda dapat melanjutkan ke bagian berikutnya dalam panduan ini untuk melihat hasil pemeriksaan di Security Command Center.

Melihat hasil pemeriksaan Perlindungan Data Sensitif di Data Catalog

Karena Anda menginstruksikan Perlindungan Data Sensitif untuk mengirim hasil tugas pemeriksaannya ke Data Catalog, Anda kini dapat melihat tag dan template tag yang dibuat otomatis di UI Data Catalog:

  1. Buka halaman Data Catalog di Konsol Google Cloud.

    Buka Data Catalog

  2. Telusuri tabel yang telah Anda periksa.
  3. Klik hasil yang cocok dengan tabel Anda untuk melihat metadata tabel.

Screenshot berikut menunjukkan tampilan metadata Katalog Data dari tabel contoh:

Temuan Perlindungan Data Sensitif di Katalog Data.

Ringkasan pemeriksaan

Temuan dari Perlindungan Data Sensitif disertakan dalam bentuk ringkasan untuk tabel yang Anda periksa. Ringkasan ini mencakup jumlah total infoType, serta data ringkasan tentang tugas pemeriksaan yang mencakup tanggal dan ID resource tugas.

Semua infoTypes yang telah diperiksa akan dicantumkan. Kasus dengan temuan menunjukkan jumlah yang lebih besar dari nol.

Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam topik ini, lakukan salah satu hal berikut, bergantung pada apakah Anda menggunakan data sampel atau data Anda sendiri:

Menghapus project

Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat sambil mengikuti petunjuk yang diberikan dalam topik ini.

Untuk menghapus project:

  1. Di konsol Google Cloud, buka halaman Project.

    Buka halaman Projects

  2. Dalam daftar project, pilih project yang ingin Anda hapus, lalu klik Delete project. Setelah memilih kotak centang di samping nama project, klik Hapus project
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Saat Anda menghapus project menggunakan metode ini, tugas Perlindungan Data Sensitif dan bucket Cloud Storage yang Anda buat juga akan dihapus, dan selesai. Anda tidak perlu mengikuti petunjuk di bagian berikut.

Menghapus tugas Perlindungan Data Sensitif atau pemicu tugas

Jika Anda memeriksa data Anda sendiri, hapus tugas pemeriksaan atau pemicu tugas yang baru saja Anda buat.

Konsol Google Cloud

  1. Di Konsol Google Cloud, buka Perlindungan Data Sensitif.

    Buka Perlindungan Data Sensitif

  2. Klik tab Tugas & pemicu tugas, lalu klik tab Pemicu tugas.

  3. Di kolom Tindakan untuk pemicu tugas yang ingin Anda hapus, klik menu tindakan lainnya (ditampilkan sebagai tiga titik yang disusun secara vertikal) , lalu klik Hapus.

Selain itu, Anda juga dapat menghapus detail tugas untuk tugas yang dijalankan. Klik tab Semua tugas, lalu di kolom Tindakan untuk tugas yang ingin Anda hapus, klik menu tindakan lainnya (ditampilkan sebagai tiga titik yang disusun secara vertikal), lalu Hapus.

DLP API

  1. Buka APIs Explorer di halaman referensi untuk metode dlpJobs.delete dengan mengklik tombol berikut:

    Membuka Penjelajah API

  2. Di kotak name, ketik nama tugas dari respons JSON terhadap permintaan inspeksi, yang memiliki bentuk berikut:

    projects/project-id/dlpJobs/job-id
    ID pekerjaan dalam bentuk i-1234567890123456789.

Jika telah membuat tugas pemeriksaan tambahan atau jika ingin memastikan bahwa Anda telah berhasil menghapus tugas, Anda dapat mencantumkan semua tugas yang ada:

  1. Buka APIs Explorer di halaman referensi untuk metode dlpJobs.list dengan mengklik tombol berikut:

    Membuka Penjelajah API

  2. Di kotak parent, ketik ID project dalam bentuk berikut, dengan project-id sebagai ID project Anda:

    projects/project-id

  3. Klik Jalankan.

Jika tidak ada tugas yang tercantum dalam respons, Anda telah menghapus semua tugas. Jika tugas tercantum dalam respons, ulangi prosedur penghapusan di atas untuk tugas tersebut.

Langkah selanjutnya