De-identifikasi data

De-identifikasi adalah proses penghapusan informasi identitas dari data. Cloud Healthcare API mendeteksi data sensitif dalam instance DICOM dan resource FHIR, seperti informasi kesehatan terlindungi (PHI), lalu menggunakan transformasi de-identifikasi untuk menyamarkan, menghapus, atau mengaburkan data. De-identifikasi memiliki beberapa kasus penggunaan, termasuk:

  • Saat membagikan informasi kesehatan kepada pihak yang tidak memiliki hak istimewa
  • Saat membuat set data dari beberapa sumber dan menganalisisnya
  • Saat menganonimkan data agar dapat digunakan dalam model machine learning

Ringkasan de-identifikasi

De-identifikasi berfungsi pada tingkat berikut:

  • Di tingkat set data. De-identifikasi terjadi pada semua data di penyimpanan DICOM dan penyimpanan FHIR dalam set data. Jika set data berisi instance DICOM dan resource FHIR, Anda dapat melakukan de-identifikasi semua instance dan resource secara bersamaan.

    Untuk melakukan de-identifikasi data sensitif di tingkat set data, panggil metode datasets.deidentify Cloud Healthcare API.
  • Di tingkat penyimpanan FHIR. De-identifikasi terjadi pada semua data di penyimpanan FHIR tertentu dalam set data.

    Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan FHIR, panggil metode fhirStores.deidentify Cloud Healthcare API.
  • Di tingkat penyimpanan DICOM. De-identifikasi terjadi pada semua data di penyimpanan DICOM tertentu dalam set data.

    Untuk melakukan de-identifikasi data sensitif di tingkat penyimpanan DICOM, panggil metode dicomStores.deidentify Cloud Healthcare API.

De-identifikasi tidak memengaruhi set data asli, penyimpanan FHIR, penyimpanan DICOM, atau data asli. Bergantung pada cara Anda mengonfigurasi de-identifikasi, operasi ini akan berperilaku sebagai berikut:

  • Jika Anda menghapus identitas data di tingkat set data, salinan data asli yang telah dihapus identitasnya akan ditulis ke set data baru yang disebut set data tujuan.
  • Jika Anda melakukan de-identifikasi data di tingkat penyimpanan DICOM atau FHIR, salinan data asli yang telah di-de-identifikasi akan ditulis ke penyimpanan DICOM atau FHIR yang ada dalam set data yang ada. Penyimpanan DICOM output dan penyimpanan FHIR masing-masing disebut penyimpanan DICOM tujuan dan penyimpanan FHIR tujuan.

Set data sumber, penyimpanan FHIR, atau penyimpanan DICOM dan set data tujuan, penyimpanan FHIR, atau penyimpanan DICOM harus berada di lokasi Google Cloud yang sama. De-identifikasi data di beberapa lokasi Google Cloud tidak didukung.

Lokasi de-identifikasi

Saat Cloud Healthcare API mende-identifikasi data, data tersebut mungkin diproses di lokasi yang berbeda dengan lokasi penyimpanan FHIR atau DICOM sumber dan tujuan. Setelah de-identifikasi selesai, data akan disimpan di lokasi Google Cloud yang sama dengan penyimpanan FHIR sumber atau penyimpanan DICOM.

Melakukan de-identifikasi data di konsol Google Cloud

Anda dapat melakukan de-identifikasi data untuk set data, penyimpanan FHIR, atau penyimpanan DICOM dari dalam Konsol Google Cloud. Untuk informasi selengkapnya, lihat Melakukan de-identifikasi data di konsol Google Cloud (DICOM) dan Melakukan de-identifikasi data di konsol Google Cloud (FHIR).

De-identifikasi DICOM

Instance DICOM berisi kumpulan elemen metadata nilai kunci (dikenal sebagai tag), dan satu atau beberapa gambar. Operasi deidentify dapat menghapus tag tertentu yang berisi data sensitif. Operasi ini juga dapat menggunakan pengenalan karakter optik otomatis (OCR) untuk menyamarkan teks yang di-burn-in pada gambar yang terdapat dalam instance DICOM.

Untuk mengetahui contoh cara melakukan de-identifikasi data DICOM, lihat Melakukan de-identifikasi data DICOM.

De-identifikasi FHIR

Setiap resource FHIR adalah objek mirip JSON yang berisi elemen nilai kunci. Beberapa elemen terstandardisasi, sementara yang lain berupa teks bebas. Anda dapat menggunakan operasi deidentify untuk mencapai salah satu hasil berikut:

  • Menghapus nilai tertentu dalam resource

  • Memproses bagian teks arbitrer untuk menghapus bagian sensitif saja, sehingga data lainnya tetap apa adanya

Untuk contoh cara melakukan de-identifikasi data FHIR, lihat Melakukan de-identifikasi data FHIR.