익명화는 데이터에서 식별 정보를 삭제하는 프로세스입니다.
Cloud Healthcare API는 DICOM 인스턴스 및 FHIR 리소스에서 보호 건강 정보(PHI)와 같은 민감한 정보를 감지한 후, 익명화 변환을 사용해서 데이터를 마스킹, 삭제, 은폐합니다. 익명화에는 다음과 같은 여러 사용 사례가 있습니다.
권한이 없는 당사자와 건강 정보 공유
여러 소스에서 데이터 세트를 만들고 분석할 때
머신러닝 모델에서 사용할 수 있도록 데이터 익명처리
익명화 개요
익명화는 다음과 같은 수준에서 작동합니다.
데이터 세트 수준에서 익명화는 DICOM 저장소의 모든 데이터와 데이터 세트의 FHIR 저장소에서 이루어집니다. 데이터 세트에 DICOM 인스턴스와 FHIR 리소스가 모두 포함된 경우 모든 인스턴스와 리소스를 동시에 익명화할 수 있습니다.
데이터 세트 수준에서 민감한 정보를 익명화하려면 Cloud Healthcare API datasets.deidentify 메서드를 호출하세요.
FHIR 저장소 수준 익명화는 데이터 세트의 특정 FHIR 저장소에 있는 모든 데이터에서 발생합니다.
익명화는 원본 데이터 세트, FHIR 저장소, DICOM 저장소 또는 원본 데이터에 영향을 주지 않습니다. 익명화를 구성하는 방법에 따라 작업은 다음과 같이 행동합니다.
데이터 세트 수준에서 데이터를 익명화하는 경우 원래 데이터의 익명화된 복사본이 대상 데이터 세트라는 새 데이터 세트에 기록됩니다.
DICOM 또는 FHIR 저장소 수준에서 데이터를 익명화하는 경우 원래 데이터의 익명화된 복사본은 기존 데이터 세트의 기존 DICOM 또는 FHIR 저장소에 기록됩니다. 출력 DICOM 저장소 및 FHIR 저장소를 각각 목적지 DICOM 저장소 및 목적지 FHIR 저장소라고 합니다.
소스 데이터 세트, FHIR 저장소 또는 DICOM 저장소와 대상 데이터 세트, FHIR 저장소 또는 DICOM 저장소는 동일한 Google Cloud 위치에 있어야 합니다. 여러 위치 간의 데이터 익명화는 지원되지 않습니다. Google Cloud
익명화 위치
Cloud Healthcare API가 데이터를 익명화하면 소스 및 대상 FHIR 또는 DICOM 저장소가 있는 위치와 다른 위치에서 데이터가 처리될 수 있습니다.
익명화가 완료되면 데이터는 소스 FHIR 저장소 또는 DICOM 저장소와 동일한 Google Cloud 위치에 저장됩니다.
데이터가 소스 FHIR 또는 DICOM 저장소와 동일한 위치에서 처리되도록 하려면 DeidentifyConfig에서 useRegionalDataProcessing 옵션을 지정하면 됩니다.
DICOM 인스턴스에는 키-값 메타데이터 요소(태그라고도 함) 세트와 하나 이상의 이미지가 포함됩니다. deidentify 작업은 민감한 정보가 포함된 특정 태그를 삭제할 수 있습니다. 이 작업은 DICOM 인스턴스에 포함된 이미지에서 번인 텍스트를 수정하기 위해 자동 광학 문자 인식 (OCR)을 사용할 수도 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-05(UTC)"],[[["\u003cp\u003eDe-identification involves removing identifying information from data, such as protected health information (PHI), in DICOM instances and FHIR resources using the Cloud Healthcare API to mask, delete, or obscure the data.\u003c/p\u003e\n"],["\u003cp\u003eDe-identification can be performed at the dataset level, FHIR store level, or DICOM store level, and the process does not affect the original data, creating copies in destination locations instead.\u003c/p\u003e\n"],["\u003cp\u003eThe Cloud Healthcare API can process data in a location that differs from where the source and destination reside, but the final data will be stored in the same Google Cloud location as the source.\u003c/p\u003e\n"],["\u003cp\u003eDICOM de-identification can remove specific tags containing sensitive data and use OCR to redact text in images, whereas FHIR de-identification can remove specific values or process text to selectively remove only sensitive portions.\u003c/p\u003e\n"],["\u003cp\u003eThe de-identification process is useful when sharing health information with non-privileged parties, creating datasets for analysis from multiple sources, or anonymizing data for machine learning.\u003c/p\u003e\n"]]],[],null,["# Data de-identification\n\nDe-identification is the process of removing identifying information from data.\nThe Cloud Healthcare API detects sensitive data in\n[DICOM instances](/healthcare-api/docs/how-tos/dicom-deidentify)\nand [FHIR resources](/healthcare-api/docs/how-tos/fhir-deidentify), such as protected\nhealth information (PHI), and then uses a de-identification transformation to\nmask, delete, or otherwise obscure the data. De-identification has multiple\nuses cases, including:\n\n- When sharing health information with non-privileged parties\n- When creating datasets from multiple sources and analyzing them\n- When anonymizing data so that it can be used in machine learning models\n\nDe-identification overview\n--------------------------\n\n\nDe-identification works at the following levels:\n\n- At the dataset level. De-identification occurs on all data in DICOM stores and FHIR stores in the dataset. If a dataset contains both DICOM instances and FHIR resources, you can de-identify all of the instances and resources at the same time. \n\n To de-identify sensitive data at the dataset level, call the Cloud Healthcare API [`datasets.deidentify`](/healthcare-api/docs/reference/rest/v1/projects.locations.datasets/deidentify) method.\n- At the FHIR store level. De-identification occurs on all data in a specific FHIR store in a dataset. \n\n To de-identify sensitive data at the FHIR store level, call the Cloud Healthcare API [`fhirStores.deidentify`](/healthcare-api/docs/reference/rest/v1/projects.locations.datasets.fhirStores/deidentify) method.\n- At the DICOM store level. De-identification occurs on all data in a specific DICOM store in a dataset. \n\n To de-identify sensitive data at the DICOM store level, call the Cloud Healthcare API [`dicomStores.deidentify`](/healthcare-api/docs/reference/rest/v1/projects.locations.datasets.dicomStores/deidentify) method.\n\n\nDe-identification doesn't impact the original dataset, FHIR store, DICOM store,\nor the original data. Depending on how you configure the de-identification, the\noperation behaves as follows:\n\n- If you are de-identifying data at the dataset level, de-identified copies of the original data are written to a new dataset called the *destination dataset*.\n- If you are de-identifying data at the DICOM or FHIR store level, de-identified copies of the original data are written to an existing DICOM or FHIR store in an existing dataset. The output DICOM store and FHIR store are called the *destination DICOM store* and *destination FHIR store*, respectively.\n\n\nThe source dataset, FHIR store, or DICOM store and the destination\ndataset, FHIR store, or DICOM store must reside in\nthe same Google Cloud location. De-identifying data across\nmultiple Google Cloud locations is not supported.\n\nDe-identification location\n--------------------------\n\n\nWhen the Cloud Healthcare API de-identifies data, the data might be processed in a location that is different from where the source and destination FHIR or DICOM store resides.\nAfter de-identification finishes, the data is stored in the same Google Cloud location as the source FHIR store or DICOM store.\n\n\nTo ensure data is processed in the same location as the source FHIR or DICOM store, you can specify\nthe `useRegionalDataProcessing` option in\n[`DeidentifyConfig`](/healthcare-api/docs/reference/rest/v1/projects.locations.datasets.fhirStores#DeidentifyConfig).\n\nDe-identifying data in the Google Cloud console\n-----------------------------------------------\n\n\nYou can de-identify data for a dataset, FHIR store, or DICOM store from within the Google Cloud console. For more information see [De-identifying data in the Google Cloud console (DICOM)](/healthcare-api/docs/how-tos/dicom-deidentify#de-identifying_data_in_the)\nand [De-identifying data in the Google Cloud console (FHIR)](/healthcare-api/docs/how-tos/fhir-deidentify#de-identifying_data_in_the).\n\nDICOM de-identification\n-----------------------\n\nA DICOM instance contains a set of key-value metadata elements (known as\n*tags* ), and one or more images. The `deidentify` operation can remove specific\ntags that contain sensitive data. The operation can also use automated optical\ncharacter recognition (OCR) to redact burnt-in text on images contained in\nDICOM instances.\n\nFor examples of how to de-identify DICOM data, see [De-identifying DICOM data](/healthcare-api/docs/how-tos/dicom-deidentify).\n\nFHIR de-identification\n----------------------\n\nEach FHIR resource is a JSON-like object that contains key-value elements.\nSome elements are standardized, while others are free text. You can use the\n`deidentify` operation to achieve one of the following results:\n\n- Remove specific values in the resource\n\n- Process the arbitrary text portions to remove only the sensitive portions,\n leaving the rest of the data as is\n\nFor examples of how to de-identify FHIR data, see [De-identifying FHIR data](/healthcare-api/docs/how-tos/fhir-deidentify)."]]