데이터 익명화

익명화는 데이터에서 식별 정보를 삭제하는 프로세스입니다. Cloud Healthcare API는 DICOM 인스턴스FHIR 리소스에서 보호 건강 정보(PHI)와 같은 민감한 정보를 감지한 후, 익명화 변환을 사용해서 데이터를 마스킹, 삭제, 은폐합니다. 익명화에는 다음과 같은 여러 사용 사례가 있습니다.

  • 권한이 없는 당사자와 건강 정보 공유
  • 여러 소스에서 데이터 세트를 만들고 분석할 때
  • 머신러닝 모델에서 사용할 수 있도록 데이터 익명처리

익명화 개요

익명화는 다음과 같은 수준에서 작동합니다.

  • 데이터 세트 수준에서 익명화는 DICOM 저장소의 모든 데이터와 데이터 세트의 FHIR 저장소에서 이루어집니다. 데이터 세트에 DICOM 인스턴스와 FHIR 리소스가 모두 포함된 경우 모든 인스턴스와 리소스를 동시에 익명화할 수 있습니다.

    데이터 세트 수준에서 민감한 정보를 익명화하려면 Cloud Healthcare API datasets.deidentify 메서드를 호출하세요.
  • FHIR 저장소 수준 익명화는 데이터 세트의 특정 FHIR 저장소에 있는 모든 데이터에서 발생합니다.

    FHIR 저장소 수준에서 민감한 정보를 익명화하려면 Cloud Healthcare API fhirStores.deidentify 메서드를 호출합니다.
  • DICOM 저장소 수준 익명화는 데이터 세트의 특정 DICOM 저장소에 있는 모든 데이터에서 발생합니다.

    DICOM 저장소 수준에서 민감한 정보를 익명화하려면 Cloud Healthcare API dicomStores.deidentify 메서드를 호출합니다.

익명화는 원본 데이터 세트, FHIR 저장소, DICOM 저장소 또는 원본 데이터에 영향을 주지 않습니다. 익명화를 구성하는 방법에 따라 작업은 다음과 같이 행동합니다.

  • 데이터 세트 수준에서 데이터를 익명화하는 경우 원래 데이터의 익명화된 복사본이 대상 데이터 세트라는 새 데이터 세트에 기록됩니다.
  • DICOM 또는 FHIR 저장소 수준에서 데이터를 익명화하는 경우 원래 데이터의 익명화된 복사본은 기존 데이터 세트의 기존 DICOM 또는 FHIR 저장소에 기록됩니다. 출력 DICOM 저장소 및 FHIR 저장소를 각각 목적지 DICOM 저장소목적지 FHIR 저장소라고 합니다.

소스 데이터 세트, FHIR 저장소 또는 DICOM 저장소와 대상 데이터 세트, FHIR 저장소 또는 DICOM 저장소는 동일한 Google Cloud 위치에 있어야 합니다. 여러 Google Cloud 위치 간의 데이터 익명화는 지원되지 않습니다.

익명화 위치

Cloud Healthcare API가 데이터를 익명화하면 소스 및 대상 FHIR 또는 DICOM 저장소가 있는 위치와 다른 위치에서 데이터가 처리될 수 있습니다. 익명화가 완료되면 데이터는 소스 FHIR 저장소 또는 DICOM 저장소와 동일한 Google Cloud 위치에 저장됩니다.

Google Cloud Console에서 데이터 익명화

Google Cloud 콘솔 내에서 데이터 세트, FHIR 저장소 또는 DICOM 저장소의 데이터를 익명화할 수 있습니다. 자세한 내용은 Google Cloud 콘솔에서 데이터 익명화(DICOM)Google Cloud 콘솔에서 데이터 익명화(FHIR)를 참조하세요.

DICOM 익명화

DICOM 인스턴스에는 키-값 메타데이터 요소(태그라고도 함) 세트와 하나 이상의 이미지가 포함됩니다. deidentify 작업은 민감한 정보가 포함된 특정 태그를 삭제할 수 있습니다. 이 작업은 DICOM 인스턴스에 포함된 이미지에서 번인 텍스트를 수정하기 위해 자동 광학 문자 인식 (OCR)을 사용할 수도 있습니다.

DICOM 데이터를 익명화하는 방법의 예시는 DICOM 데이터 익명화를 참조하세요.

FHIR 익명화

각 FHIR 리소스는 키-값 요소를 포함하는 JSON과 비슷한 객체입니다. 일부 요소는 표준화되어 있고 일부 요소는 자유 텍스트입니다. deidentify 작업을 사용하여 다음 결과 중 하나를 달성할 수 있습니다.

  • 리소스의 특정 값 삭제

  • 임의의 텍스트 부분을 처리하여 민감한 부분만 삭제하고 나머지 데이터는 그대로 둡니다.

FHIR 데이터를 익명화하는 방법의 예시는 FHIR 데이터 익명화를 참조하세요.