Inspeksi dan penyamaran gambar

Perlindungan Data Sensitif dapat memeriksa dan menyamarkan teks sensitif dari gambar sesuai dengan kriteria yang Anda tentukan.

Dengan menggunakan detektor infoType dan pengenalan karakter optik (OCR), Perlindungan Data Sensitif memeriksa gambar berenkode base64 untuk menemukan teks dan mendeteksi data sensitif dalam teks. Kemudian, model ini dapat menampilkan informasi tentang lokasi data sensitif dalam gambar, atau menyamarkan data sensitif dengan menyamarkannya dengan persegi panjang buram.

Inspeksi dan penyamaran adalah dua tindakan yang berbeda:

  • Pemeriksaan: Sensitive Data Protection memeriksa gambar berenkode base64 yang dikirim untuk intoTypes yang ditentukan. Fungsi ini menampilkan InfoTypes yang terdeteksi, beserta satu atau beberapa kumpulan koordinat dan dimensi piksel. Setiap kumpulan nilai koordinat dan dimensi piksel menunjukkan sudut kiri bawah dan dimensi kotak pembatas. Setiap kotak batas sesuai dengan semua atau sebagian temuan Perlindungan Data Sensitif.
  • Samarkan: Perlindungan Data Sensitif memeriksa gambar berenkode base64 yang dikirim untuk infoType yang ditentukan. Sensitive Data Protection menyembunyikan temuan data sensitif dengan menyamarkannya dengan persegi panjang buram. Metode ini menampilkan gambar yang disamarkan dan dienkode base64 dalam format gambar yang sama dengan gambar asli. Anda juga dapat mengonfigurasi warna kotak penyamaran dalam permintaan.

Tentang pemeriksaan

Pemeriksaan gambar Perlindungan Data Sensitif mengambil gambar berenkode base64, mengenali teks apa pun dalam gambar, lalu menelusuri teks untuk menemukan data apa pun yang cocok dengan kriteria pemeriksaannya. Terakhir, Perlindungan Data Sensitif menampilkan lokasi data sensitif yang terdeteksi.

Perhatikan gambar berikut. Gambar ini adalah contoh file gambar umum yang dihasilkan dari pemindaian dokumen kertas.

Gambar asli yang tidak disamarkan.
Gambar asli yang tidak disamarkan (klik untuk memperbesar).

Jika Anda menginstruksikan Perlindungan Data Sensitif untuk memeriksa gambar ini guna menemukan Nomor Jaminan Sosial Amerika Serikat, prosesnya akan melalui proses yang diilustrasikan dalam diagram berikut.

Proses pemeriksaan gambar.
Proses pemeriksaan gambar (klik untuk memperbesar).
  1. Gambar yang dienkode base64 di-streaming ke Perlindungan Data Sensitif menggunakan metode content.inspect.
  2. Dengan menggunakan pengenalan karakter optik (OCR), Perlindungan Data Sensitif mengenali teks dalam dokumen.
  3. Perlindungan Data Sensitif memindai teks yang dikenali menggunakan konfigurasi deteksi data sensitif yang Anda tetapkan sebelumnya dan mengidentifikasi kecocokan apa pun.
  4. Sensitive Data Protection menampilkan koordinat dan dimensi wilayah dalam gambar tempat data sensitif ditemukan sesuai dengan kriteria deteksi Anda.

Koordinat yang ditampilkan menunjukkan tempat untuk menemukan data sensitif. Perhatikan bahwa Perlindungan Data Sensitif sering menggunakan beberapa kotak untuk menunjukkan lokasi satu instance data sensitif dalam gambar. Hal ini terutama berlaku saat teks ditulis dengan tangan, seperti dalam contoh ini.

Jika tidak menemukan data apa pun dalam gambar yang sesuai dengan kriteria deteksi Anda, Perlindungan Data Sensitif akan menampilkan respons HTTP 200 yang kosong dan berhasil.

Tentang penyamaran

Penyamaran gambar sama dengan pemeriksaan gambar, dengan satu langkah tambahan. Setelah Perlindungan Data Sensitif mengidentifikasi lokasi data sensitif dalam gambar, alih-alih menampilkan koordinat area yang berisi data, Perlindungan Data Sensitif akan mengisi area tersebut pada gambar, yang menampilkan gambar yang disamarkan dan dienkode base64.

Sekali lagi, pertimbangkan gambar asli dari bagian sebelumnya. Jika Anda menginstruksikan Perlindungan Data Sensitif untuk menyamarkan semua nomor Jaminan Sosial AS dari gambar, prosesnya akan melalui proses yang diilustrasikan dalam diagram berikut.

Proses penyamaran gambar.
Proses penyamaran gambar (klik untuk memperbesar).
  1. Gambar yang dienkode base64 di-streaming ke Perlindungan Data Sensitif menggunakan metode image.redact.
  2. Dengan menggunakan pengenalan karakter optik (OCR), Perlindungan Data Sensitif mengenali teks dalam dokumen.
  3. Perlindungan Data Sensitif memindai teks yang dikenali menggunakan konfigurasi deteksi data sensitif yang Anda tetapkan sebelumnya dan mengidentifikasi kecocokan apa pun.
  4. Perlindungan Data Sensitif menyamarkan semua data sensitif yang terdeteksi dengan menutupinya dengan persegi panjang buram. Kemudian, gambar dienkode dalam base64 dan ditampilkan dalam respons permintaan.

Jika tidak menemukan data apa pun dalam gambar yang sesuai dengan kriteria deteksi Anda, Sensitive Data Protection akan menampilkan gambar yang dienkode base64 tanpa perubahan.

Langkah selanjutnya