Referensi metrik

Halaman ini mencantumkan dan menjelaskan semua metrik yang dikumpulkan dalam profil data.

Ada tiga jenis profil data—profil data project, profil data tabel, dan profil data kolom.

Profil data project

Setiap profil data project memiliki kolom berikut. Nilai untuk kolom ini digabungkan berdasarkan resource yang dibuat profilnya dalam project.

Insight

Profil data project memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data pada statusnya saat ini. Untuk informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk project ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data project memberikan metadata berikut:

Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir kali dibuat.
ID Project
ID project yang dibuat profilnya.
Nama fasilitas
Nama yang sepenuhnya memenuhi syarat untuk profil data.
Status
Ikon yang menunjukkan status operasi pembuatan profil.

Profil data tabel

Setiap profil data tabel memiliki kolom berikut:

Insight

Profil data tabel memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data pada statusnya saat ini. Untuk informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk tabel ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data tabel memberikan metadata berikut:

Database
Database yang berisi tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
ID set data
ID set data yang berisi tabel ini.
Enkripsi
Apakah enkripsi untuk tabel ini dikelola oleh Google atau oleh organisasi Anda.
Waktu habis masa berlaku
Opsional. Waktu habis masa berlaku tabel ini.
Jumlah kolom yang gagal
Jumlah kolom yang dilewati dalam tabel ini karena error.
Memeriksa snapshot konfigurasi
Snapshot template inspeksi yang digunakan saat profil dibuat. Untuk mengetahui informasi selengkapnya, lihat Snapshot profil data.
Instance
Instance yang berisi tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir kali dibuat.
Update terbaru di BigQuery
Tanggal dan waktu terakhir kali tabel ini diubah.
ID Project
ID project yang berisi tabel ini.
Publik

Apakah tabel ini tersedia untuk semua pengguna atau dibatasi untuk pengguna tertentu.

Label resource

Label yang dimiliki tabel pada saat profil dibuat.

Tag resource

Tag yang dimiliki tabel pada saat profil dibuat.

Nama fasilitas

Nama yang sepenuhnya memenuhi syarat untuk profil data.

Jumlah baris

Jumlah baris dalam tabel ini saat profil dibuat.

Jumlah kolom yang dipindai

Jumlah kolom yang dibuat profilnya dalam tabel ini.

Akun layanan

Jumlah akun layanan dengan izin IAM untuk mengakses tabel ini.

Status

Indikasi apakah profil berhasil dibuat.

ID tabel

ID tabel ini.

Waktu pembuatan tabel

Tanggal dan waktu tabel dibuat.

Ukuran tabel

Ukuran tabel ini saat profil dibuat.

Jenis

Jenis penemuan yang dilakukan.

Profil data kolom

Setiap profil data kolom memiliki kolom berikut:

Insight

Profil data kolom memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data pada statusnya saat ini. Untuk informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk kolom ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
infoType yang diprediksi

Jika satu infoType bawaan atau kustom jelas lebih dominan daripada yang lain di kolom, Perlindungan Data Sensitif akan menetapkan kolom ini ke infoType tersebut. Jika tidak, kolom ini tidak memiliki nilai.

Untuk melihat daftar semua infoType yang terdeteksi di kolom, lihat kolom InfoType lainnya.

Sensitive Data Protection hanya memindai infoType yang Anda tentukan dalam template inspeksi. Dengan demikian, hanya infoType tersebut yang dapat muncul di kolom Predicted infoType. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detector infoType EMAIL_ADDRESS dalam template inspeksi, kolom ini tidak akan berisi EMAIL_ADDRESS.

Jika data kolom sebagian besar cocok dengan beberapa infoType yang terkait erat dan termasuk dalam kategori umum yang sama, Sensitive Data Protection akan menetapkan kolom ini ke infoType yang lebih umum. Misalnya, jika kolom sebagian besar memiliki campuran infoType PASSPORT, AUSTRALIA_PASSPORT, dan CANADA_PASSPORT, kolom Predicted infoType ditetapkan ke PASSPORT. Kolom InfoTypes lainnya menampilkan infoType yang lebih spesifik dan perkiraan prevalensi infoType tersebut.

InfoType lainnya

InfoType yang terdeteksi di kolom yang tidak memiliki sinyal yang cukup kuat untuk dianggap sebagai infoType yang diprediksi kolom tersebut. Dalam dokumen ini, lihat infoType yang diprediksi.

Untuk profil data yang dibuat setelah 13 Oktober 2022, setiap infoType yang tercantum di kolom ini memiliki perkiraan prevalensi. Estimasi prevalensi adalah perkiraan persentase baris non-null tempat infoType terdeteksi.

Misalnya, Anda memiliki kolom yang memiliki metrik berikut:

  • infoType yang diprediksi: FDA_CODE
  • infoType lainnya: PERSON_NAME (2%), STREET_ADDRESS (1%)

Dalam contoh ini, ada indikasi kuat bahwa kolom berisi kode FDA. Perlindungan Data Sensitif juga menentukan bahwa sekitar 2% baris non-null dalam kolom mungkin berisi nama orang dan 1% mungkin berisi alamat jalan.

Sensitive Data Protection hanya memindai infoType yang Anda tentukan dalam template inspeksi. Dengan demikian, hanya infoType tersebut yang dapat muncul di kolom InfoType lainnya. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detector infoType EMAIL_ADDRESS dalam template inspeksi, kolom ini tidak akan berisi EMAIL_ADDRESS.

Estimasi proporsi null

Perkiraan proporsi nilai null di kolom ini, yang dikategorikan sebagai tinggi, sedang, rendah, atau sangat rendah. Nilai ini tinggi jika sebagian besar entri di kolom ini bernilai null.

Estimasi keunikan

Estimasi jumlah data dalam kolom ini yang unik, yang dikategorikan sebagai tinggi, sedang, atau rendah. Tingkat keunikan yang tinggi menunjukkan bahwa kolom berisi nilai yang berbeda. Kehadiran nilai unik yang tinggi dapat menunjukkan bahwa kolom berisi ID.

Tingkat keunikan yang rendah menunjukkan bahwa kolom berisi banyak nilai umum seperti enum atau nilai boolean.

Jika Perlindungan Data Sensitif menentukan bahwa tidak ada cukup baris dalam tabel untuk menghitung metrik ini, nilai ini akan kosong.

Skor teks bebas

Probabilitas bahwa kolom ini berisi teks bebas. Nilai yang mendekati 1 menunjukkan bahwa kolom kemungkinan berisi teks bebas atau bahasa alami. Nilai yang mungkin berkisar dari 0 hingga 1.

Skor teks bebas yang tinggi dapat meningkatkan tingkat sensitivitas dan risiko data kolom.

Metadata

Profil data kolom memberikan metadata berikut:

Database
Database yang berisi kolom tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Jenis data
Jenis data konten kolom ini.
ID set data
ID set data yang berisi kolom tabel ini.
ID kolom
Nama kolom.
Instance
Instance yang berisi kolom tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Lokasi instance
Lokasi instance yang berisi kolom tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir kali dibuat.
Tag kebijakan
Menunjukkan apakah tag kebijakan diterapkan ke kolom. Untuk mengetahui informasi tentang praktik terbaik dalam menggunakan tag kebijakan, lihat Menggunakan tag kebijakan di BigQuery.
ID Project
ID project yang berisi kolom tabel ini.
Nama fasilitas
Nama yang sepenuhnya memenuhi syarat untuk profil data.
Status
Ikon yang menunjukkan status operasi pembuatan profil.
ID tabel
ID tabel yang berisi kolom ini.

File profil data penyimpanan

Perlindungan Data Sensitif menggunakan istilah penyimpanan file untuk merujuk ke bucket penyimpanan file.

Setiap profil data penyimpanan file memiliki kolom berikut.

Insight

Profil data penyimpanan file memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data pada statusnya saat ini. Untuk informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Cluster file
Memberikan ringkasan untuk setiap cluster file yang terdeteksi saat profil penyimpanan file ini dibuat. Untuk informasi selengkapnya tentang setiap ringkasan, lihat Ringkasan cluster file di halaman ini.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk penyimpanan file ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data penyimpanan file memberikan metadata berikut:

Lokasi penyimpanan data

Jika Anda membuat profil bucket Cloud Storage dual-region, kolom ini akan mencantumkan kedua region.

Jika Anda membuat profil bucket Amazon S3, nilai ini adalah region AWS tempat bucket disimpan.

Enkripsi

Apakah enkripsi untuk penyimpanan file ini dikelola oleh Google atau oleh organisasi Anda.

Jenis penyimpanan file

Jenis data yang dibuat profilnya—data Cloud Storage atau data Amazon S3.

Jalur penyimpanan file

Nama penyimpanan file.

Memeriksa snapshot konfigurasi

Ringkasan template inspeksi yang digunakan saat profil dibuat. Untuk informasi selengkapnya, lihat Snapshot profil data.

Jenis lokasi

Jenis lokasi tempat penyimpanan file disimpan: region, dual-region, atau multi-region.

Profil pertama yang dibuat

Tanggal dan waktu profil dibuat untuk pertama kalinya.

Profil terakhir dibuat

Tanggal dan waktu profil terakhir dibuat.

ID induk

Resource yang memiliki data yang dibuat profilnya.

  • Jika profil data ditujukan untuk resource Google Cloud, ini adalah ID project yang berisi data.
  • Jika profil data ditujukan untuk bucket Amazon S3, ini adalah ID akun AWS yang berisi bucket.
Publik

Apakah penyimpanan file ini tersedia untuk semua pengguna atau dibatasi untuk pengguna tertentu.

Label resource

Label yang dimiliki penyimpanan file pada saat profil dibuat.

Tag resource

Tag yang dimiliki penyimpanan file saat profil dibuat.

Lokasi resource

Region atau multi-region yang berisi penyimpanan file.

Jika Anda membuat profil bucket Cloud Storage dual-region, nilai ini bergantung pada apakah bucket disimpan di region ganda yang telah ditentukan sebelumnya:

  • Untuk dual-region standar, Perlindungan Data Sensitif menetapkan nilai ini ke nama dual-region standar.
  • Untuk region ganda standar, Perlindungan Data Sensitif menetapkan nilai ini ke multi-region yang berisi region ganda. Untuk mengetahui informasi tentang cara region dipetakan ke multi-region, lihat Region ganda.
Nama fasilitas

Nama yang sepenuhnya memenuhi syarat untuk profil data.

Status

Indikasi apakah profil berhasil dibuat.

Ringkasan cluster file

Saat profil data penyimpanan file dibuat, file akan dikelompokkan ke dalam cluster file. Perlindungan Data Sensitif memberikan ringkasan untuk setiap cluster file.

Setiap ringkasan cluster file memiliki kolom berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam cluster file ini. Untuk informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Error
Error apa pun yang terdeteksi saat profil data penyimpanan file dibuat.
Ekstensi file yang dipindai
Daftar jenis file yang terdeteksi dan dipindai untuk membuat profil data penyimpanan file.
Ekstensi file yang dilihat
Daftar jenis file yang terdeteksi, tetapi tidak selalu dipindai.
InfoType
Daftar infoTypes bawaan dan kustom yang terdeteksi di cluster file ini.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk cluster file ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Jenis
Menunjukkan kategori file dalam cluster ini. Untuk informasi selengkapnya tentang semua cluster file yang didukung, lihat Cluster file.