De-identifikasi data

De-identifikasi adalah proses menghapus informasi identifikasi dari data. Cloud Healthcare API mendeteksi data sensitif di instance DICOM dan resource FHIR, seperti informasi kesehatan terlindungi (PHI), lalu menggunakan transformasi de-identifikasi untuk menyamarkan, menghapus, atau mengaburkan data tersebut. De-identifikasi memiliki beberapa kasus penggunaan, termasuk:

  • Saat berbagi informasi kesehatan dengan pihak yang tidak memiliki hak istimewa
  • Saat membuat {i>dataset<i} dari berbagai sumber dan menganalisisnya
  • Saat melakukan anonimisasi data agar dapat digunakan dalam model machine learning

Ringkasan de-identifikasi

De-identifikasi berfungsi di tingkat berikut:

  • Di tingkat set data. De-identifikasi terjadi pada semua data di penyimpanan DICOM dan penyimpanan FHIR dalam set data. Jika set data berisi instance DICOM dan resource FHIR, Anda dapat melakukan de-identifikasi semua instance dan resource secara bersamaan.

    Untuk melakukan de-identifikasi data sensitif di tingkat set data, panggil metode datasets.deidentify Cloud Healthcare API.
  • Di tingkat toko FHIR. De-identifikasi terjadi pada semua data di penyimpanan FHIR tertentu dalam set data.

    Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan FHIR, panggil metode fhirStores.deidentify Cloud Healthcare API.
  • Di tingkat toko DICOM. De-identifikasi terjadi pada semua data di penyimpanan DICOM tertentu dalam set data.

    Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan DICOM, panggil metode dicomStores.deidentify Cloud Healthcare API.

De-identifikasi tidak memengaruhi set data asli, penyimpanan FHIR, penyimpanan DICOM, atau data asli. Bergantung pada cara Anda mengonfigurasi de-identifikasi, operasi akan berperilaku sebagai berikut:

  • Jika Anda melakukan de-identifikasi data pada tingkat set data, salinan data asli yang telah dide-identifikasi akan ditulis ke set data baru yang disebut set data tujuan.
  • Jika Anda melakukan de-identifikasi data pada tingkat penyimpanan DICOM atau FHIR, salinan data asli yang telah dide-identifikasi akan ditulis ke penyimpanan DICOM atau FHIR yang ada dalam set data yang sudah ada. Penyimpanan DICOM output dan penyimpanan FHIR masing-masing disebut penyimpanan DICOM tujuan dan penyimpanan FHIR tujuan.

Set data sumber, penyimpanan FHIR, atau penyimpanan DICOM, serta set data tujuan, penyimpanan FHIR, atau penyimpanan DICOM harus berada di lokasi Google Cloud yang sama. De-identifikasi data di beberapa lokasi Google Cloud tidak didukung.

Lokasi de-identifikasi

Saat Cloud Healthcare API melakukan de-identifikasi data, data tersebut mungkin diproses di lokasi yang berbeda dari tempat sumber dan tujuan penyimpanan FHIR atau DICOM berada. Setelah de-identifikasi selesai, data disimpan di lokasi Google Cloud yang sama dengan penyimpanan FHIR atau penyimpanan DICOM sumber.

Melakukan de-identifikasi data di Konsol Google Cloud

Anda dapat melakukan de-identifikasi data untuk set data, penyimpanan FHIR, atau penyimpanan DICOM dari dalam Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Melakukan de-identifikasi data di Konsol Google Cloud (DICOM) dan Melakukan de-identifikasi data di Konsol Google Cloud (FHIR).

De-identifikasi DICOM

Instance DICOM berisi sekumpulan elemen metadata nilai kunci (dikenal sebagai tag), dan satu atau beberapa gambar. Operasi deidentify dapat menghapus tag tertentu yang berisi data sensitif. Operasi ini juga dapat menggunakan pengenalan karakter optik (OCR) otomatis untuk menyamarkan teks burn-in pada gambar yang dimuat dalam instance DICOM.

Untuk contoh cara melakukan de-identifikasi data DICOM, lihat Melakukan de-identifikasi data DICOM.

De-identifikasi FHIR

Setiap resource FHIR adalah objek mirip JSON yang berisi elemen nilai kunci. Beberapa elemen distandardisasi, sementara yang lain adalah teks bebas. Anda dapat menggunakan operasi deidentify untuk mencapai salah satu hasil berikut:

  • Menghapus nilai tertentu di resource

  • Memproses bagian teks arbitrer untuk menghapus hanya bagian sensitif, membiarkan sisa data sebagaimana adanya

Untuk contoh cara melakukan de-identifikasi data FHIR, lihat Melakukan de-identifikasi data FHIR.