Referensi metrik

Halaman ini mencantumkan dan menjelaskan semua metrik yang dikumpulkan di profil data.

Ada tiga jenis profil data, yaitu profil data project, profil data tabel, dan profil data kolom.

Profil data project

Setiap profil data project memiliki kolom berikut. Nilai untuk kolom ini digabungkan berdasarkan resource yang dibuat profilnya dalam project.

Insight

Profil data proyek memberikan wawasan berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam kondisinya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas project ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data project menyediakan metadata berikut:

Profil terakhir dibuat
Tanggal dan waktu profil terakhir dibuat.
Project ID
ID project yang dibuat profilnya.
Nama fasilitas
Nama profil data yang sepenuhnya memenuhi syarat.
Status
Ikon yang menunjukkan status operasi pembuatan profil.

Profil data tabel

Setiap profil data tabel memiliki kolom berikut:

Insight

Profil data tabel memberikan insight berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam kondisinya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas tabel ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.

Metadata

Profil data tabel menyediakan metadata berikut:

Database
Database yang berisi tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
ID set data
ID set data yang berisi tabel ini.
Enkripsi
Apakah enkripsi untuk tabel ini dikelola oleh Google atau oleh organisasi Anda.
Waktu habis masa berlaku
Opsional. Waktu tabel ini berakhir masa berlakunya.
Jumlah kolom yang gagal
Jumlah kolom yang dilewati dalam tabel ini karena terjadi error.
Memeriksa snapshot konfigurasi
Snapshot template pemeriksaan yang digunakan saat profil dibuat. Untuk mengetahui informasi selengkapnya, lihat Snapshot profil data.
Instance
Instance yang berisi tabel yang telah dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir dibuat
Tanggal dan waktu profil terakhir dibuat.
Update terbaru di BigQuery
Tanggal dan waktu tabel ini terakhir diubah.
Project ID
ID project yang berisi tabel ini.
Publik
Apakah tabel ini tersedia untuk semua pengguna atau terbatas untuk pengguna tertentu.
Label resource
Label yang dimiliki tabel pada saat profil dibuat.
Nama fasilitas
Nama profil data yang sepenuhnya memenuhi syarat.
Jumlah baris
Jumlah baris dalam tabel ini saat profil dibuat.
Jumlah kolom yang dipindai
Jumlah kolom yang diprofilkan dalam tabel ini.
Akun layanan
Jumlah akun layanan dengan izin IAM untuk mengakses tabel ini.
Status
Indikasi apakah profil berhasil dibuat.
ID tabel
ID tabel ini.
Waktu pembuatan tabel
Tanggal dan waktu tabel dibuat.
Ukuran tabel
Ukuran tabel ini saat profil dibuat.
Jenis
Jenis penemuan yang berperforma baik.

Profil data kolom

Setiap profil data kolom memiliki kolom berikut:

Insight

Profil data kolom memberikan wawasan berikut:

Risiko data
Tingkat risiko yang terkait dengan data dalam kondisinya saat ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
Sensitivitas
Skor yang menunjukkan tingkat sensitivitas untuk kolom ini. Untuk mengetahui informasi selengkapnya, lihat Tingkat sensitivitas dan risiko data.
InfoType yang diprediksi

Jika satu infoType bawaan atau kustom dengan jelas mendominasi kolom lain di kolom, Perlindungan Data Sensitif menetapkan kolom ini ke infoType tersebut. Jika tidak, kolom ini tidak akan memiliki nilai.

Untuk melihat daftar semua infoTypes yang terdeteksi di kolom, lihat kolom Other infoTypes.

Perlindungan Data Sensitif hanya akan memindai infoType yang Anda tentukan dalam template pemeriksaan. Dengan demikian, hanya infoType tersebut yang dapat muncul di kolom Predicted infoType. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detektor infoType EMAIL_ADDRESS dalam template inspeksi, berarti kolom ini tidak berisi EMAIL_ADDRESS.

Dalam dokumen ini, lihat Other infoTypes.

infoTypes lainnya

InfoTypes yang terdeteksi di kolom yang tidak memiliki sinyal yang cukup kuat untuk dianggap sebagai infoType yang diprediksi milik kolom tersebut. Dalam dokumen ini, lihat Prediksi infoType.

Untuk profil data yang dibuat setelah 13 Oktober 2022, setiap infoType yang tercantum dalam kolom ini memiliki estimasi prevalensi. Estimasi prevalensi adalah perkiraan persentase baris non-null tempat infoType terdeteksi.

Misalnya, anggaplah Anda memiliki kolom yang memiliki metrik berikut:

  • Prediksi infoType: FDA_CODE
  • InfoTypes lainnya: PERSON_NAME (2%), STREET_ADDRESS (1%)

Dalam contoh ini, ada indikasi kuat bahwa kolom berisi kode FDA. Perlindungan Data Sensitif juga menentukan bahwa sekitar 2% baris non-null di kolom mungkin berisi nama orang dan 1% mungkin berisi alamat.

Perlindungan Data Sensitif hanya akan memindai infoType yang Anda tentukan dalam template pemeriksaan. Jadi, hanya infoTypes tersebut yang dapat muncul di kolom Other infoTypes. Misalnya, jika kolom memiliki alamat email, tetapi Anda tidak menyertakan detektor infoType EMAIL_ADDRESS dalam template inspeksi, berarti kolom ini tidak berisi EMAIL_ADDRESS.

Estimasi proporsi null

Perkiraan proporsi nilai null dalam kolom ini, yang dikategorikan sebagai tinggi, sedang, rendah, atau sangat rendah. Nilai ini tinggi jika sebagian besar entri di kolom ini adalah null.

Estimasi keunikan

Estimasi berapa banyak data dalam kolom ini yang unik, yang dikategorikan sebagai tinggi, sedang, atau rendah. Tingkat keunikan yang tinggi menunjukkan bahwa kolom berisi nilai yang berbeda. Nilai unik yang tinggi dapat menunjukkan bahwa kolom berisi ID.

Tingkat keunikan yang rendah menunjukkan bahwa kolom berisi banyak nilai umum, seperti enum atau nilai boolean.

Jika Perlindungan Data Sensitif menentukan bahwa baris di tabel tidak cukup untuk menghitung metrik ini, nilai ini kosong.

Skor teks bebas

Probabilitas kolom ini berisi teks bentuk bebas. Nilai yang mendekati 1 menunjukkan bahwa kolom cenderung berisi teks berformat bebas atau natural-language. Nilai yang memungkinkan berkisar dari 0 hingga 1.

Skor teks bebas yang tinggi dapat meningkatkan tingkat risiko dan sensitivitas data pada kolom.

Metadata

Profil data kolom menyediakan metadata berikut:

Database
Database yang berisi kolom tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Jenis data
Jenis data konten kolom ini.
ID set data
ID set data yang berisi kolom tabel ini.
ID kolom
Nama kolom.
Instance
Instance yang berisi kolom tabel yang dibuat profilnya. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Lokasi instance
Lokasi instance yang berisi kolom tabel yang diprofilkan. Kolom ini hanya berlaku untuk penemuan Cloud SQL.
Profil terakhir dibuat
Tanggal dan waktu profil terakhir dibuat.
Tag kebijakan
Menunjukkan apakah tag kebijakan diterapkan pada kolom. Untuk mengetahui informasi tentang praktik terbaik penggunaan tag kebijakan, lihat Menggunakan tag kebijakan di BigQuery.
Project ID
ID project yang berisi kolom tabel ini.
Nama fasilitas
Nama profil data yang sepenuhnya memenuhi syarat.
Status
Ikon yang menunjukkan status operasi pembuatan profil.
ID tabel
ID tabel yang berisi kolom ini.