Perlindungan Data Sensitif membantu Anda memahami, mengelola, dan melindungi data sensitif. Dengan Perlindungan Data Sensitif, Anda dapat dengan mudah mengklasifikasikan dan menyamarkan data sensitif yang tersimpan di konten berbasis teks dan gambar, termasuk konten yang disimpan di repositori penyimpanan Google Cloud.
Klasifikasi teks
Dengan input teks berikut:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Outputnya adalah daftar temuan, yang disusun ke dalam kategori berikut:
InfoType
Likelihood
Offset
(Di mana dalam string potensiInfoType
ditemukan)
Contoh output ditampilkan pada tabel di bawah.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Penyamaran teks otomatis
Penyamaran otomatis menghasilkan output dengan menghapus pencocokan data sensitif, bukan memberi Anda daftar temuan.
Contoh input penyamaran otomatisasi:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Contoh output yang menggunakan placeholder "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Klasifikasi gambar
Perlindungan Data Sensitif menggunakan teknologi Pengenalan Karakter Optik (OCR) untuk mengenali teks sebelum klasifikasi. Serupa dengan klasifikasi teks, metode ini menampilkan temuan, tetapi juga menambahkan kotak pembatas tempat teks ditemukan.
Klasifikasi penyimpanan
Klasifikasi penyimpanan memindai data yang disimpan di Cloud Storage, Firestore dalam mode Datastore (Datastore), dan BigQuery. Anda dapat menentukan lokasi penyimpanan untuk bucket Cloud Storage, jenis Datastore, atau tabel BigQuery yang ingin dipindai oleh Perlindungan Data Sensitif, bukan menstreaming data ke Perlindungan Data Sensitif dalam permintaan.
Saat memindai file di lokasi Cloud Storage, Perlindungan Data Sensitif mendukung pemindaian file biner, teks, gambar, Microsoft Word, Microsoft Excel, Microsoft Powerpoint, PDF, dan Apache Avro. Daftar ekstensi file untuk jenis file dalam Cloud Storage yang dapat dipindai oleh Perlindungan Data Sensitif tersedia di halaman referensi API untuk FileType
.
File dengan jenis yang tidak dikenal akan dipindai sebagai file biner.
Hasil pemindaian dapat disimpan ke tabel BigQuery baru atau dipublikasikan ke topik Pub/Sub. Dari sana, Anda dapat menggunakan alat BigQuery bawaan untuk menjalankan analisis SQL yang lengkap atau alat seperti Looker Studio untuk membuat laporan.
Untuk informasi selengkapnya tentang memindai repositori penyimpanan untuk data sensitif menggunakan Perlindungan Data Sensitif, lihat Memeriksa penyimpanan dan database untuk data sensitif.
Untuk informasi selengkapnya tentang memvisualisasikan hasil pemindaian menggunakan alat Google Cloud lainnya, lihat Menganalisis dan melaporkan temuan Perlindungan Data Sensitif.
Langkah selanjutnya
- Pelajari lebih lanjut pemeriksaan dan penyamaran gambar.
- Pelajari metode transformasi yang dapat Anda gunakan dengan Perlindungan Data Sensitif.
- Bekerja melalui codelab Menyamarkan Data Sensitif dengan Perlindungan Data Sensitif.
- Pelajari lebih lanjut cara membuat salinan data yang telah dide-identifikasi di penyimpanan.