De-identifikasi adalah proses penghapusan informasi identitas dari data. Cloud Healthcare API mendeteksi data sensitif dalam instance DICOM dan resource FHIR, seperti informasi kesehatan terlindungi (PHI), lalu menggunakan transformasi de-identifikasi untuk menyamarkan, menghapus, atau mengaburkan data. De-identifikasi memiliki beberapa kasus penggunaan, termasuk:
- Saat membagikan informasi kesehatan kepada pihak yang tidak memiliki hak istimewa
- Saat membuat set data dari beberapa sumber dan menganalisisnya
- Saat menganonimkan data agar dapat digunakan dalam model machine learning
Ringkasan de-identifikasi
De-identifikasi berfungsi pada tingkat berikut:
- Di tingkat set data. De-identifikasi terjadi pada semua data di penyimpanan DICOM dan penyimpanan FHIR dalam set data. Jika set data
berisi instance DICOM dan resource FHIR, Anda dapat melakukan de-identifikasi semua
instance dan resource secara bersamaan.
Untuk melakukan de-identifikasi data sensitif di tingkat set data, panggil metodedatasets.deidentify
Cloud Healthcare API. - Di tingkat penyimpanan FHIR. De-identifikasi terjadi pada semua data di
penyimpanan FHIR tertentu dalam set data.
Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan FHIR, panggil metodefhirStores.deidentify
Cloud Healthcare API. - Di tingkat penyimpanan DICOM. De-identifikasi terjadi pada semua data di penyimpanan
DICOM tertentu dalam set data.
Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan DICOM, panggil metodedicomStores.deidentify
Cloud Healthcare API.
De-identifikasi tidak memengaruhi set data asli, penyimpanan FHIR, penyimpanan DICOM, atau data asli. Bergantung pada cara Anda mengonfigurasi de-identifikasi, operasi ini akan berperilaku sebagai berikut:
- Jika Anda menghapus identitas data di tingkat set data, salinan data asli yang telah dihapus identitasnya akan ditulis ke set data baru yang disebut set data tujuan.
- Jika Anda melakukan de-identifikasi data di tingkat penyimpanan DICOM atau FHIR, salinan data asli yang telah di-de-identifikasi akan ditulis ke penyimpanan DICOM atau FHIR yang ada dalam set data yang ada. Penyimpanan DICOM output dan penyimpanan FHIR masing-masing disebut penyimpanan DICOM tujuan dan penyimpanan FHIR tujuan.
Set data sumber, penyimpanan FHIR, atau penyimpanan DICOM dan set data tujuan, penyimpanan FHIR, atau penyimpanan DICOM harus berada di lokasi Google Cloud yang sama. De-identifikasi data di beberapa lokasi Google Cloud tidak didukung.
Lokasi de-identifikasi
Saat Cloud Healthcare API mende-identifikasi data, data tersebut mungkin diproses di lokasi yang berbeda dengan lokasi penyimpanan FHIR atau DICOM sumber dan tujuan. Setelah de-identifikasi selesai, data akan disimpan di lokasi Google Cloud yang sama dengan penyimpanan FHIR sumber atau penyimpanan DICOM.
Melakukan de-identifikasi data di konsol Google Cloud
Anda dapat melakukan de-identifikasi data untuk set data, penyimpanan FHIR, atau penyimpanan DICOM dari dalam Konsol Google Cloud. Untuk informasi selengkapnya, lihat Melakukan de-identifikasi data di konsol Google Cloud (DICOM) dan Melakukan de-identifikasi data di konsol Google Cloud (FHIR).
De-identifikasi DICOM
Instance DICOM berisi kumpulan elemen metadata nilai kunci (dikenal sebagai
tag), dan satu atau beberapa gambar. Operasi deidentify
dapat menghapus tag tertentu
yang berisi data sensitif. Operasi ini juga dapat menggunakan pengenalan karakter optik otomatis (OCR) untuk menyamarkan teks yang di-burn-in pada gambar yang terdapat dalam instance DICOM.
Untuk mengetahui contoh cara melakukan de-identifikasi data DICOM, lihat Melakukan de-identifikasi data DICOM.
De-identifikasi FHIR
Setiap resource FHIR adalah objek mirip JSON yang berisi elemen nilai kunci.
Beberapa elemen terstandardisasi, sementara yang lain berupa teks bebas. Anda dapat menggunakan
operasi deidentify
untuk mencapai salah satu hasil berikut:
Menghapus nilai tertentu dalam resource
Memproses bagian teks arbitrer untuk menghapus bagian sensitif saja, sehingga data lainnya tetap apa adanya
Untuk contoh cara melakukan de-identifikasi data FHIR, lihat Melakukan de-identifikasi data FHIR.