Mengirim hasil pemeriksaan Perlindungan Data Sensitif ke Data Catalog

Panduan ini menunjukkan cara menggunakan Perlindungan Data Sensitif untuk memeriksa tabel BigQuery dan mengirim hasil pemeriksaan ke Data Catalog.

Anda juga dapat melakukan pembuatan profil data, yang berbeda dengan operasi pemeriksaan. Anda juga dapat mengirim profil data ke Dataplex. Untuk informasi selengkapnya, lihat Memberi tag pada tabel di Dataplex berdasarkan insight dari profil data.

Data Catalog adalah layanan pengelolaan metadata yang skalabel, yang memungkinkan Anda menemukan, mengelola, dan memahami semua data Anda di Google Cloud dengan cepat.

Sensitive Data Protection memiliki integrasi bawaan dengan Data Catalog. Saat Anda menggunakan tindakan Perlindungan Data Sensitif untuk memeriksa tabel BigQuery guna menemukan data sensitif, tindakan ini dapat mengirim hasil langsung ke Data Catalog dalam bentuk template tag.

Dengan menyelesaikan langkah-langkah dalam panduan ini, Anda akan melakukan hal berikut:

  • Aktifkan Data Catalog dan Perlindungan Data Sensitif.
  • Siapkan Perlindungan Data Sensitif untuk memeriksa tabel BigQuery.
  • Konfigurasikan pemeriksaan Perlindungan Data Sensitif untuk mengirim hasil pemeriksaan ke Data Catalog.

Untuk informasi selengkapnya tentang Data Catalog, lihat dokumentasi Data Catalog.

Jika Anda ingin mengirim hasil operasi pembuatan profil data—bukan tugas pemeriksaan—ke Dataplex, lihat dokumentasi untuk membuat profil organisasi, folder, atau project.

Biaya

Dalam dokumen ini, Anda akan menggunakan komponen Google Cloud yang dapat ditagih berikut:

  • Sensitive Data Protection
  • BigQuery

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga. Pengguna baru Google Cloud mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Sebelum memulai

Sebelum Anda dapat mengirim hasil pemeriksaan Sensitive Data Protection ke Data Catalog, lakukan hal berikut:

  • Langkah 1: Siapkan penagihan.
  • Langkah 2: Buat project baru dan isi tabel BigQuery baru. (Opsional.)
  • Langkah 3: Aktifkan Katalog Data.
  • Langkah 4: Aktifkan Perlindungan Data Sensitif.

Subbagian berikut membahas setiap langkah secara mendetail.

Langkah 1: Siapkan penagihan

Anda harus menyiapkan akun penagihan terlebih dahulu jika belum memilikinya.

Pelajari cara mengaktifkan penagihan

Langkah 2: Buat project baru dan isi tabel BigQuery baru (Opsional)

Jika Anda menyiapkan fitur ini untuk pekerjaan produksi atau sudah memiliki tabel BigQuery yang ingin diperiksa, buka project Google Cloud yang berisi tabel tersebut dan lanjutkan ke Langkah 3.

Jika Anda mencoba fitur ini dan ingin memeriksa data pengujian, buat project baru. Untuk menyelesaikan langkah ini, Anda harus memiliki peran Pembuat Project IAM. Pelajari lebih lanjut peran IAM.

  1. Buka halaman New Project di konsol Google Cloud.

    Project Baru

  2. Pada menu drop-down Billing account, pilih akun penagihan yang akan ditagih untuk project tersebut.
  3. Pada menu drop-down Organization, pilih organisasi tempat Anda ingin membuat project.
  4. Pada menu drop-down Lokasi, pilih organisasi atau folder tempat Anda ingin membuat project.
  5. Klik Create untuk membuat project.

Selanjutnya, download dan simpan data sampel:

  1. Buka repositori tutorial fungsi Cloud Run di GitHub.
  2. Pilih salah satu file CSV yang memiliki contoh data, lalu download file tersebut.
  3. Selanjutnya, buka BigQuery di konsol Google Cloud.
  4. Pilih project Anda.
  5. Klik Create Dataset.
  6. Klik Create Table.
  7. Klik Upload, lalu pilih file yang ingin Anda upload.
  8. Beri nama tabel, lalu klik Create Table.

Langkah 3: Aktifkan Katalog Data

Selanjutnya, aktifkan Data Catalog untuk project yang berisi tabel BigQuery yang ingin Anda periksa menggunakan Perlindungan Data Sensitif.

Untuk mengaktifkan Data Catalog menggunakan konsol Google Cloud:

  1. Daftarkan aplikasi Anda untuk Data Catalog.

    Mendaftarkan aplikasi Anda untuk Katalog Data

  2. Di halaman pendaftaran, dari menu drop-down Create a project, pilih project yang ingin Anda gunakan dengan Data Catalog.
  3. Setelah memilih project, klik Lanjutkan.

Data Catalog kini diaktifkan untuk project Anda.

Langkah 4: Aktifkan Perlindungan Data Sensitif

Aktifkan Sensitive Data Protection untuk project yang sama dengan project tempat Anda mengaktifkan Data Catalog.

Untuk mengaktifkan Sensitive Data Protection menggunakan konsol Google Cloud:

  1. Daftarkan aplikasi Anda untuk Perlindungan Data Sensitif.

    Mendaftarkan aplikasi Anda untuk Perlindungan Data Sensitif

  2. Di halaman pendaftaran, dari menu drop-down Create a project, pilih project yang sama dengan yang Anda pilih di langkah sebelumnya.
  3. Setelah memilih project, klik Lanjutkan.

Sensitive Data Protection kini diaktifkan untuk project Anda.

Mengonfigurasi dan menjalankan tugas inspeksi Perlindungan Data Sensitif

Anda dapat mengonfigurasi dan menjalankan tugas pemeriksaan Perlindungan Data Sensitif menggunakan konsol Google Cloud atau DLP API.

Template tag Katalog Data disimpan di project dan region yang sama dengan tabel BigQuery. Jika Anda memeriksa tabel dari project lain, Anda harus memberikan peran Pemilik TagTemplate Katalog Data (roles/datacatalog.tagTemplateOwner) kepada agen layanan Perlindungan Data Sensitif di project tempat tabel BigQuery berada.

Konsol Google Cloud

Untuk menyiapkan tugas pemeriksaan tabel BigQuery menggunakan Perlindungan Data Sensitif:

  1. Di bagian Sensitive Data Protection di konsol Google Cloud, buka halaman Create job or job trigger.

    Buka Membuat tugas atau pemicu tugas

  2. Masukkan informasi tugas Perlindungan Data Sensitif, lalu klik Continue untuk menyelesaikan setiap langkah:

    • Untuk Langkah 1: Pilih data input, beri nama tugas dengan memasukkan nilai di kolom Name. Di Location, pilih BigQuery dari menu Storage type, lalu masukkan informasi untuk tabel yang akan diperiksa. Bagian Sampling dikonfigurasi sebelumnya untuk menjalankan pemeriksaan sampel terhadap data Anda. Anda dapat menyesuaikan kolom Batasi baris menurut dan Jumlah maksimum baris untuk menghemat resource jika Anda memiliki data dalam jumlah besar. Untuk mengetahui detail selengkapnya, lihat Memilih data input.

    • (Opsional) Di Langkah 2: Konfigurasikan deteksi, Anda mengonfigurasi jenis data yang akan ditelusuri, yang disebut "infoTypes". Untuk tujuan panduan ini, biarkan infoTypes default dipilih. Untuk mengetahui detail selengkapnya, lihat Mengonfigurasi deteksi.

    • Untuk Langkah 3: Tambahkan tindakan, aktifkan Simpan ke Data Catalog.

    • (Opsional) Untuk Langkah 4: Jadwalkan, untuk tujuan walkthrough ini, biarkan menu ditetapkan ke Tidak ada sehingga pemeriksaan hanya berjalan sekali. Untuk mempelajari lebih lanjut cara menjadwalkan tugas pemeriksaan berulang, lihat Jadwal.

  3. Klik Create. Tugas akan langsung berjalan.

DLP API

Di bagian ini, Anda akan mengonfigurasi dan menjalankan tugas pemeriksaan Perlindungan Data Sensitif.

Tugas pemeriksaan yang Anda konfigurasikan di sini akan menginstruksikan Perlindungan Data Sensitif untuk memeriksa sampel data BigQuery yang dijelaskan di Langkah 2 di atas atau data BigQuery Anda sendiri. Konfigurasi tugas yang Anda tentukan juga merupakan tempat Anda menginstruksikan Sensitive Data Protection untuk menyimpan hasil pemeriksaannya ke Data Catalog.

Langkah 1: Catat ID project Anda

  1. Buka Konsol Google Cloud.

    Buka konsol Google Cloud.

  2. Klik Pilih.

  3. Pada menu drop-down Select from, pilih organisasi tempat Anda mengaktifkan Katalog Data.

  4. Di bagian ID, salin project ID untuk project yang berisi data yang ingin Anda periksa. Ini adalah project yang dijelaskan dalam langkah menetapkan repositori penyimpanan sebelumnya di halaman ini.

  5. Di bagian Nama, klik project untuk memilihnya.

Langkah 2: Buka API Explorer dan konfigurasikan tugas

  1. Buka API Explorer di halaman referensi untuk metode dlpJobs.create. Agar petunjuk ini tetap tersedia, klik kanan link berikut dan buka di tab atau jendela baru:

    Membuka API Explorer

  2. Di kotak parent, masukkan kode berikut, dengan project-id adalah project ID yang Anda catat sebelumnya di langkah sebelumnya:

    projects/project-id

    Selanjutnya, salin JSON berikut. Pilih konten kolom Request body di API Explorer, lalu tempel JSON untuk mengganti konten. Pastikan untuk mengganti placeholder project-id, bigquery-dataset-name, dan bigquery-table-name dengan project ID, set data, dan nama tabel BigQuery yang sebenarnya.

    {
      "inspectJob":
      {
        "storageConfig":
        {
          "bigQueryOptions":
          {
            "tableReference":
            {
              "projectId": "project-id",
              "datasetId": "bigquery-dataset-name",
              "tableId": "bigquery-table-name"
            }
          }
        },
        "inspectConfig":
        {
          "infoTypes":
          [
            {
              "name": "EMAIL_ADDRESS"
            },
            {
              "name": "PERSON_NAME"
            },
            {
              "name": "US_SOCIAL_SECURITY_NUMBER"
            },
            {
              "name": "PHONE_NUMBER"
            }
          ],
          "includeQuote": true,
          "minLikelihood": "UNLIKELY",
          "limits":
          {
            "maxFindingsPerRequest": 100
          }
        },
        "actions":
        [
          {
            "publishFindingsToCloudDataCatalog": {}
          }
        ]
      }
    }
    

Untuk mempelajari opsi pemeriksaan yang tersedia lebih lanjut, lihat Memeriksa penyimpanan dan database untuk menemukan data sensitif. Untuk mengetahui daftar lengkap jenis informasi yang dapat diperiksa oleh Perlindungan Data Sensitif, lihat Referensi InfoTypes.

Langkah 3: Jalankan permintaan untuk memulai tugas inspeksi

Setelah Anda mengonfigurasi tugas dengan mengikuti langkah-langkah sebelumnya, klik Execute untuk mengirim permintaan. Jika permintaan berhasil, respons akan muncul dengan kode berhasil dan objek JSON yang menunjukkan status tugas Perlindungan Data Sensitif yang baru saja Anda buat.

Respons terhadap permintaan inspeksi Anda menyertakan ID tugas tugas inspeksi Anda sebagai kunci "name", dan status saat ini dari tugas inspeksi sebagai kunci "state". Karena Anda baru saja mengirimkan permintaan, status tugas pada saat itu adalah "PENDING".

Memeriksa status tugas pemeriksaan Perlindungan Data Sensitif

Setelah Anda mengirimkan permintaan inspeksi, tugas inspeksi akan segera dimulai.

Konsol Google Cloud

Untuk memeriksa status tugas inspeksi:

  1. Di konsol Google Cloud, buka Sensitive Data Protection.

    Buka Perlindungan Data Sensitif

  2. Klik tab Tugas & pemicu tugas, lalu klik Semua tugas.

Tugas yang baru saja Anda jalankan kemungkinan akan berada di bagian atas daftar. Periksa kolom Status untuk memastikan statusnya adalah Selesai.

Anda dapat mengklik ID Tugas tugas untuk melihat hasilnya. Setiap detektor infoType yang tercantum di halaman Detail lowongan diikuti dengan jumlah kecocokan yang ditemukan dalam konten.

DLP API

Untuk memeriksa status tugas inspeksi:

  1. Buka API Explorer di halaman referensi untuk metode dlpJobs.get dengan mengklik tombol berikut:

    Membuka API Explorer

  2. Di kotak name, ketik nama tugas dari respons JSON ke permintaan inspeksi dalam bentuk berikut:

    projects/project-id/dlpJobs/job-id
    ID tugas dalam bentuk i-1234567890123456789.

  3. Untuk mengirimkan permintaan, klik Execute.

Jika kunci "state" objek JSON respons menunjukkan bahwa tugasnya adalah "DONE", tugas inspeksi telah selesai.

Untuk melihat JSON respons lainnya, scroll halaman ke bawah. Di bagian "result" > "infoTypeStats", setiap jenis informasi yang tercantum harus memiliki "count" yang sesuai. Jika tidak, pastikan Anda memasukkan JSON dengan akurat, dan bahwa jalur atau lokasi ke data Anda sudah benar.

Setelah tugas pemeriksaan selesai, Anda dapat melanjutkan ke bagian berikutnya dalam panduan ini untuk melihat hasil pemeriksaan di Security Command Center.

Melihat hasil pemeriksaan Perlindungan Data Sensitif di Data Catalog

Karena Anda menginstruksikan Sensitive Data Protection untuk mengirim hasil tugas pemeriksaannya ke Data Catalog, kini Anda dapat melihat tag dan template tag yang dibuat secara otomatis di UI Data Catalog:

  1. Buka halaman Data Catalog di konsol Google Cloud.

    Buka Data Catalog

  2. Telusuri tabel yang Anda periksa.
  3. Klik hasil yang cocok dengan tabel Anda untuk melihat metadata tabel.

Screenshot berikut menunjukkan tampilan metadata Data Catalog dari contoh tabel:

Temuan Perlindungan Data Sensitif di Data Catalog..

Ringkasan pemeriksaan

Temuan dari Perlindungan Data Sensitif disertakan dalam bentuk ringkasan untuk tabel yang Anda periksa. Ringkasan ini mencakup total jumlah infoType, serta data ringkasan tentang tugas inspeksi yang menyertakan tanggal dan ID resource tugas.

Semua infoTypes yang diperiksa akan dicantumkan. Laporan yang memiliki temuan akan menampilkan jumlah lebih besar dari nol.

Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam topik ini, lakukan salah satu hal berikut, bergantung pada apakah Anda menggunakan data sampel atau data Anda sendiri:

Menghapus project

Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat sembari mengikuti petunjuk yang diberikan dalam topik ini.

Untuk menghapus project:

  1. Di konsol Google Cloud, buka halaman Project.

    Buka halaman Projects

  2. Dalam daftar project, pilih project yang ingin Anda hapus, lalu klik Hapus project. Setelah memilih kotak centang di samping nama project, klik Hapus project
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Saat Anda menghapus project menggunakan metode ini, tugas Perlindungan Data Sensitif dan bucket Cloud Storage yang Anda buat juga akan dihapus, dan Anda sudah selesai. Anda tidak perlu mengikuti petunjuk di bagian berikut.

Menghapus tugas atau pemicu tugas Sensitive Data Protection

Jika Anda memeriksa data Anda sendiri, hapus tugas pemeriksaan atau pemicu tugas yang baru saja Anda buat.

Konsol Google Cloud

  1. Di konsol Google Cloud, buka Sensitive Data Protection.

    Buka Perlindungan Data Sensitif

  2. Klik tab Tugas & pemicu tugas, lalu klik tab Pemicu tugas.

  3. Di kolom Actions untuk pemicu tugas yang ingin Anda hapus, klik menu more actions (ditampilkan sebagai tiga titik yang disusun secara vertikal) , lalu klik Delete.

Secara opsional, Anda juga dapat menghapus detail tugas untuk tugas yang Anda jalankan. Klik tab All jobs, lalu di kolom Actions untuk tugas yang ingin Anda hapus, klik menu more actions (ditampilkan sebagai tiga titik yang disusun secara vertikal) , lalu Delete.

DLP API

  1. Buka API Explorer di halaman referensi untuk metode dlpJobs.delete dengan mengklik tombol berikut:

    Membuka API Explorer

  2. Di kotak name, ketik nama tugas dari respons JSON ke permintaan inspeksi, yang memiliki bentuk berikut:

    projects/project-id/dlpJobs/job-id
    ID tugas dalam bentuk i-1234567890123456789.

Jika Anda membuat tugas inspeksi tambahan atau ingin memastikan bahwa Anda telah berhasil menghapus tugas, Anda dapat mencantumkan semua tugas yang ada:

  1. Buka API Explorer di halaman referensi untuk metode dlpJobs.list dengan mengklik tombol berikut:

    Membuka API Explorer

  2. Di kotak parent, ketik ID project dalam bentuk berikut, dengan project-id adalah ID project Anda:

    projects/project-id

  3. Klik Jalankan.

Jika tidak ada tugas yang tercantum dalam respons, berarti Anda telah menghapus semua tugas. Jika tugas tercantum dalam respons, ulangi prosedur penghapusan di atas untuk tugas tersebut.

Langkah selanjutnya