A desidentificação é o processo de remoção de informações de identificação dos dados. A Cloud Healthcare API deteta dados confidenciais em instâncias DICOM e recursos FHIR, como informações de saúde protegidas (PHI), e, em seguida, usa uma transformação de desidentificação para mascarar, eliminar ou ocultar os dados de outra forma. A desidentificação tem vários exemplos de utilização, incluindo:
- Quando partilha informações de saúde com partes não privilegiadas
- Quando cria conjuntos de dados a partir de várias origens e os analisa
- Quando anonimiza dados para que possam ser usados em modelos de aprendizagem automática
Vista geral da desidentificação
A desidentificação funciona nos seguintes níveis:
- Ao nível do conjunto de dados. A desidentificação ocorre em todos os dados nos armazenamentos DICOM e nos armazenamentos FHIR no conjunto de dados. Se um conjunto de dados
contiver instâncias DICOM e recursos FHIR, pode desidentificar todas as
instâncias e recursos ao mesmo tempo.
Para desidentificar dados confidenciais ao nível do conjunto de dados, chame o métododatasets.deidentify
da Cloud Healthcare API. - Ao nível do FHIR store. A desidentificação ocorre em todos os dados num
repositório FHIR específico num conjunto de dados.
Para desidentificar dados confidenciais ao nível do repositório FHIR, chame o métodofhirStores.deidentify
da Cloud Healthcare API. - Ao nível do arquivo DICOM. A desidentificação ocorre em todos os dados num
armazenamento DICOM específico num conjunto de dados.
Para desidentificar dados confidenciais ao nível do armazenamento DICOM, chame o métododicomStores.deidentify
da Cloud Healthcare API.
A desidentificação não afeta o conjunto de dados original, o FHIR store, o DICOM store nem os dados originais. Consoante a forma como configura a anulação da identificação, a operação comporta-se da seguinte forma:
- Se estiver a remover a identificação dos dados ao nível do conjunto de dados, são escritas cópias sem identificação dos dados originais num novo conjunto de dados denominado conjunto de dados de destino.
- Se estiver a remover a identificação dos dados ao nível do arquivo DICOM ou FHIR, são escritas cópias sem identificação dos dados originais num arquivo DICOM ou FHIR existente num conjunto de dados existente. O arquivo DICOM de saída e o arquivo FHIR são denominados, respetivamente, arquivo DICOM de destino e arquivo FHIR de destino.
O conjunto de dados de origem, o FHIR store ou o DICOM store e o conjunto de dados de destino, o FHIR store ou o DICOM store têm de estar na mesma Google Cloud localização. A anonimização de dados em várias localizações não é suportada. Google Cloud
Localização de desidentificação
Quando a Cloud Healthcare API desidentifica dados, estes podem ser processados numa localização diferente da localização onde reside a origem e o destino da loja FHIR ou DICOM. Após a conclusão da desidentificação, os dados são armazenados na mesma Google Cloud localização que o FHIR store ou o DICOM store de origem.
Para garantir que os dados são processados na mesma localização que o arquivo FHIR ou DICOM de origem, pode especificar a opção useRegionalDataProcessing
em DeidentifyConfig
.
Remover a identificação dos dados na Google Cloud consola
Pode anular a identificação dos dados de um conjunto de dados, de uma loja FHIR ou de uma loja DICOM a partir da Google Cloud consola. Para mais informações, consulte os artigos Desidentificar dados na Google Cloud consola (DICOM) e Desidentificar dados na Google Cloud consola (FHIR).
Desidentificação de DICOM
Uma instância DICOM contém um conjunto de elementos de metadados de chave-valor (conhecidos como etiquetas) e uma ou mais imagens. A operação deidentify
pode remover etiquetas específicas que contenham dados confidenciais. A operação também pode usar o reconhecimento ótico de carateres (OCR) automático para ocultar texto incorporado em imagens contidas em instâncias DICOM.
Para ver exemplos de como desidentificar dados DICOM, consulte o artigo Desidentificar dados DICOM.
Desidentificação de FHIR
Cada recurso FHIR é um objeto semelhante a JSON que contém elementos de chave-valor.
Alguns elementos são padronizados, enquanto outros são texto livre. Pode usar a operação deidentify
para alcançar um dos seguintes resultados:
Remova valores específicos no recurso
Processar as partes de texto arbitrárias para remover apenas as partes confidenciais, deixando o resto dos dados tal como está
Para ver exemplos de como desidentificar dados FHIR, consulte o artigo Desidentificar dados FHIR.