Referensi metrik

Halaman ini mencantumkan dan menjelaskan semua metrik yang dikumpulkan dalam profil data.

Ada tiga jenis profil data—profil data project, profil data tabel, dan profil data kolom.

Profil data project

Setiap profil data project memiliki kolom berikut. Nilai untuk kolom ini digabungkan berdasarkan resource yang di-profil dalam project.

Insight

Profil data project memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam statusnya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk project ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data project menyediakan metadata berikut:

Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir dibuat.
ID Project
ID project yang di-profil.
Nama fasilitas
Nama lengkap profil data.
Status
Ikon yang menunjukkan status operasi pembuatan profil.

Profil data tabel

Setiap profil data tabel memiliki kolom berikut:

Insight

Profil data tabel memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam statusnya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk tabel ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data tabel menyediakan metadata berikut:

Database
Database yang berisi tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
ID set data
ID set data yang berisi tabel ini.
Enkripsi
Apakah enkripsi untuk tabel ini dikelola oleh Google atau oleh organisasi Anda.
Waktu habis masa berlaku
Opsional. Waktu habis masa berlaku tabel ini.
Jumlah kolom yang gagal
Jumlah kolom yang dilewati dalam tabel ini karena error.
Periksa snapshot konfigurasi
Snapshot template inspeksi yang digunakan saat profil dibuat. Untuk mengetahui informasi selengkapnya, lihat Snapshot profil data.
Instance
Instance yang berisi tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir dibuat.
Pembaruan terbaru di BigQuery
Tanggal dan waktu tabel ini terakhir diubah.
ID Project
ID project yang berisi tabel ini.
Publik

Apakah tabel ini tersedia untuk semua pengguna atau dibatasi untuk pengguna tertentu.

Label resource

Label yang dimiliki tabel pada saat profil dibuat.

Tag resource

Tag yang dimiliki tabel pada waktu profil dibuat.

Nama fasilitas

Nama profil data yang sepenuhnya memenuhi syarat.

Jumlah baris

Jumlah baris dalam tabel ini saat profil dibuat.

Jumlah kolom yang dipindai

Jumlah kolom yang diprofilkan dalam tabel ini.

Akun layanan

Jumlah akun layanan dengan izin IAM untuk mengakses tabel ini.

Status

Indikasi apakah profil berhasil dibuat.

ID tabel

ID tabel ini.

Waktu pembuatan tabel

Tanggal dan waktu tabel dibuat.

Ukuran tabel

Ukuran tabel ini saat profil dibuat.

Jenis

Jenis penemuan yang dilakukan.

Profil data kolom

Setiap profil data kolom memiliki kolom berikut:

Insight

Profil data kolom memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam statusnya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk kolom ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
InfoType yang diprediksi

Jika satu infoType bawaan atau kustom jelas lebih dominan daripada yang lain dalam kolom, Sensitive Data Protection akan menyetel kolom ini ke infoType tersebut. Jika tidak, kolom ini tidak memiliki nilai.

Untuk melihat daftar semua infoType yang terdeteksi di kolom, lihat kolom InfoType lainnya.

Sensitive Data Protection hanya memindai infoType yang Anda tentukan dalam template inspeksi. Oleh karena itu, hanya infoType tersebut yang dapat muncul di kolom InfoType yang diprediksi. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detektor infoType EMAIL_ADDRESS dalam template pemeriksaan, maka kolom ini tidak berisi EMAIL_ADDRESS.

Jika data kolom sebagian besar cocok dengan beberapa infoType terkait erat yang termasuk dalam kategori umum yang sama, Sensitive Data Protection menetapkan kolom ini ke infoType yang lebih umum. Misalnya, jika kolom sebagian besar memiliki campuran infoType PASSPORT, AUSTRALIA_PASSPORT, dan CANADA_PASSPORT, kolom InfoType yang diprediksi akan disetel ke PASSPORT. Kolom InfoType lainnya menampilkan infoType yang lebih spesifik dan perkiraan prevalensinya.

InfoType lainnya

InfoType yang terdeteksi di kolom yang tidak memiliki sinyal yang cukup kuat untuk dianggap sebagai infoType yang diprediksi di kolom tersebut. Dalam dokumen ini, lihat Predicted infoType.

Untuk profil data yang dibuat setelah 13 Oktober 2022, setiap infoType yang tercantum dalam kolom ini memiliki perkiraan prevalensi. Perkiraan prevalensi adalah perkiraan persentase baris non-null tempat infoType terdeteksi.

Misalnya, Anda memiliki kolom yang memiliki metrik berikut:

  • Predicted infoType: FDA_CODE
  • InfoType lainnya: PERSON_NAME (2%), STREET_ADDRESS (1%)

Dalam contoh ini, ada indikasi kuat bahwa kolom berisi kode FDA. Sensitive Data Protection juga menentukan bahwa sekitar 2% baris non-null dalam kolom mungkin berisi nama orang dan 1% mungkin berisi alamat jalan.

Sensitive Data Protection hanya memindai infoType yang Anda tentukan dalam template inspeksi. Oleh karena itu, hanya infoType tersebut yang dapat muncul di kolom InfoType lainnya. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detektor infoType EMAIL_ADDRESS dalam template pemeriksaan, maka kolom ini tidak berisi EMAIL_ADDRESS.

Estimasi proporsi null

Perkiraan proporsi nilai null dalam kolom ini, yang dikategorikan sebagai tinggi, sedang, rendah, atau sangat rendah. Nilai ini tinggi jika sebagian besar entri dalam kolom ini adalah null.

Estimasi keunikan

Estimasi seberapa banyak data dalam kolom ini yang unik, yang dikategorikan sebagai tinggi, sedang, atau rendah. Tingkat keunikan yang tinggi menunjukkan bahwa kolom berisi nilai yang berbeda. Kehadiran nilai unik yang tinggi dapat menunjukkan bahwa kolom berisi ID.

Tingkat keunikan yang rendah menunjukkan bahwa kolom berisi banyak nilai umum, seperti nilai enum atau boolean.

Jika Perlindungan Data Sensitif menentukan bahwa tidak ada cukup baris dalam tabel untuk menghitung metrik ini, nilai ini akan kosong.

Skor teks bebas

Probabilitas bahwa kolom ini berisi teks bebas. Nilai yang mendekati 1 menunjukkan bahwa kolom kemungkinan berisi teks bentuk bebas atau bahasa alami. Nilai yang mungkin berkisar dari 0 hingga 1.

Skor teks bebas yang tinggi dapat meningkatkan tingkat risiko dan sensitivitas data kolom.

Metadata

Profil data kolom memberikan metadata berikut:

Database
Database yang berisi kolom tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Jenis data
Jenis data konten kolom ini.
ID set data
ID set data yang berisi kolom tabel ini.
ID kolom
Nama kolom.
Instance
Instance yang berisi kolom tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Lokasi instance
Lokasi instance yang berisi kolom tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir yang dibuat
Tanggal dan waktu profil terakhir dibuat.
Tag kebijakan
Menunjukkan apakah tag kebijakan diterapkan ke kolom. Untuk mengetahui informasi tentang praktik terbaik dalam menggunakan tag kebijakan, lihat Menggunakan tag kebijakan di BigQuery.
ID Project
ID project yang berisi kolom tabel ini.
Nama fasilitas
Nama lengkap profil data.
Status
Ikon yang menunjukkan status operasi pembuatan profil.
ID tabel
ID tabel yang berisi kolom ini.

Profil data penyimpanan file

Sensitive Data Protection menggunakan istilah penyimpanan file untuk merujuk ke bucket atau penampung penyimpanan file.

Setiap profil data toko file memiliki kolom berikut.

Insight

Profil data penyimpanan file memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam statusnya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Kelompok file
Memberikan ringkasan untuk setiap cluster file yang terdeteksi saat profil file store ini dibuat. Untuk mengetahui informasi selengkapnya tentang setiap ringkasan, lihat Ringkasan cluster file di halaman ini.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk penyimpanan file ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data penyimpanan file menyediakan metadata berikut:

Lokasi penyimpanan data

Jika Anda membuat profil bucket Cloud Storage dual-region, kolom ini akan mencantumkan dua region.

Jika Anda membuat profil penyimpanan file dari penyedia cloud lain, nilai ini adalah region tempat penyedia cloud menyimpan penyimpanan file.

Enkripsi

Apakah enkripsi untuk penyimpanan file ini dikelola oleh Google atau oleh organisasi Anda.

Jenis penyimpanan file

Sumber data yang diprofilkan—Cloud Storage, Amazon S3, atau Azure Blob Storage.

Jalur penyimpanan file

Nama penyimpanan file.

Periksa snapshot konfigurasi

Snapshot template pemeriksaan yang digunakan saat profil dibuat. Untuk mengetahui informasi selengkapnya, lihat Snapshot profil data.

Jenis lokasi

Jenis lokasi tempat penyimpanan file disimpan: region, dual-region, atau multi-region.

Profil pertama kali dibuat

Tanggal dan waktu saat profil dibuat untuk pertama kalinya.

Profil terakhir dibuat

Tanggal dan waktu profil terakhir dibuat.

ID induk

Resource yang memiliki data yang diprofilkan.

  • Jika profil data ditujukan untuk resource Google Cloud , maka ini adalah ID project yang berisi data.
  • Jika profil data ditujukan untuk bucket Amazon S3, maka ini adalah ID akun AWS yang berisi bucket tersebut.
  • Jika profil data ditujukan untuk kontainer Azure Blob Storage, maka ini adalah ID langganan Azure yang berisi kontainer.
Publik

Apakah penyimpanan file ini tersedia untuk semua pengguna atau dibatasi untuk pengguna tertentu.

Label resource

Label yang dimiliki penyimpanan file pada saat profil dibuat.

Tag resource

Tag yang dimiliki penyimpanan file pada saat profil dibuat.

Lokasi resource

Region atau multi-region yang berisi penyimpanan file.

Jika Anda membuat profil bucket Cloud Storage dual-region, nilai ini bergantung pada apakah bucket disimpan di dual region yang telah ditentukan sebelumnya:

  • Untuk dual region standar, Perlindungan Data Sensitif menetapkan nilai ini ke nama dual region standar.
  • Untuk dual region standar, Perlindungan Data Sensitif menetapkan nilai ini ke multi-region yang berisi dual region. Untuk mengetahui informasi tentang cara memetakan wilayah ke multi-region, lihat Dual-region.
Nama fasilitas

Nama lengkap profil data.

Status

Indikasi apakah profil berhasil dibuat.

Ringkasan cluster file

Saat profil data penyimpanan file dibuat, file dikelompokkan ke dalam cluster file. Sensitive Data Protection memberikan ringkasan untuk setiap cluster file.

Setiap ringkasan cluster file memiliki kolom berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam cluster file ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Error
Error apa pun yang terdeteksi saat profil data penyimpanan file dibuat.
Ekstensi file yang dipindai
Daftar jenis file yang terdeteksi dan dipindai untuk membuat profil data penyimpanan file.
Ekstensi file yang terlihat
Daftar jenis file yang terdeteksi, tetapi belum tentu dipindai.
InfoType
Daftar infoType bawaan dan kustom yang terdeteksi dalam cluster file ini.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk cluster file ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Jenis

Menunjukkan kategori file dalam cluster ini. Untuk mengetahui informasi selengkapnya tentang semua cluster file yang didukung, lihat Cluster file yang didukung dalam operasi penemuan.