Klasifikasi, penyamaran, dan de-identifikasi

Sensitive Data Protection membantu Anda memahami, mengelola, dan melindungi data sensitif. Dengan Sensitive Data Protection, Anda dapat dengan mudah mengklasifikasikan dan menyamarkan data sensitif yang terdapat dalam konten dan gambar berbasis teks, termasuk konten yang disimpan di repositori penyimpanan Google Cloud.

Klasifikasi teks

Dengan input teks berikut:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Outputnya adalah daftar temuan, yang diatur ke dalam kategori berikut:

Contoh output ditampilkan dalam tabel di bawah.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Penyamaran teks otomatis

Penyamaran otomatis menghasilkan output dengan pencocokan data sensitif yang dihapus, bukan memberikan daftar temuan kepada Anda.

Contoh input penyamaran otomatis:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Contoh output menggunakan placeholder "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Klasifikasi gambar

Perlindungan Data Sensitif menggunakan teknologi Pengenalan Karakter Optik (OCR) untuk mengenali teks sebelum klasifikasi. Mirip dengan klasifikasi teks, metode ini menampilkan temuan, tetapi juga menambahkan kotak pembatas tempat teks ditemukan.

Klasifikasi penyimpanan

Klasifikasi penyimpanan memindai data yang disimpan di Cloud Storage, Firestore dalam mode Datastore (Datastore), dan BigQuery. Daripada melakukan streaming data ke Sensitive Data Protection, Anda harus menentukan lokasi penyimpanan untuk bucket Cloud Storage, jenis Datastore, atau tabel BigQuery yang ingin dipindai oleh Sensitive Data Protection dalam permintaan Anda.

Saat memindai file di lokasi Cloud Storage, Perlindungan Data Sensitif mendukung pemindaian file biner, teks, gambar, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF, dan Apache Avro. Daftar ekstensi file untuk jenis file dalam Cloud Storage yang dapat dipindai oleh Perlindungan Data Sensitif tersedia di halaman referensi API untuk FileType. File dengan jenis yang tidak dikenal akan dipindai sebagai file biner.

Hasil pemindaian dapat disimpan ke tabel BigQuery baru atau dipublikasikan ke topik Pub/Sub. Dari sana, Anda dapat menggunakan alat BigQuery bawaan untuk menjalankan analisis SQL yang kaya atau alat seperti Looker Studio untuk membuat laporan.

Untuk informasi selengkapnya tentang cara memindai repositori penyimpanan untuk menemukan data sensitif menggunakan Perlindungan Data Sensitif, lihat Memeriksa penyimpanan dan database untuk menemukan data sensitif.

Untuk informasi selengkapnya tentang cara memvisualisasikan hasil pemindaian menggunakan alat Google Cloud lainnya, lihat Menganalisis dan melaporkan temuan Perlindungan Data Sensitif.

Langkah selanjutnya