Desidentificação dos dados

A desidentificação é o processo de remoção de informações de identificação dos dados. A Cloud Healthcare API deteta dados confidenciais em instâncias DICOM e recursos FHIR, como informações de saúde protegidas (PHI), e, em seguida, usa uma transformação de desidentificação para mascarar, eliminar ou ocultar os dados de outra forma. A desidentificação tem vários exemplos de utilização, incluindo:

  • Quando partilha informações de saúde com partes não privilegiadas
  • Quando cria conjuntos de dados a partir de várias origens e os analisa
  • Quando anonimiza dados para que possam ser usados em modelos de aprendizagem automática

Vista geral da desidentificação

A desidentificação funciona nos seguintes níveis:

  • Ao nível do conjunto de dados. A desidentificação ocorre em todos os dados nos armazenamentos DICOM e nos armazenamentos FHIR no conjunto de dados. Se um conjunto de dados contiver instâncias DICOM e recursos FHIR, pode desidentificar todas as instâncias e recursos ao mesmo tempo.

    Para desidentificar dados confidenciais ao nível do conjunto de dados, chame o método datasets.deidentify da Cloud Healthcare API.
  • Ao nível do FHIR store. A desidentificação ocorre em todos os dados num repositório FHIR específico num conjunto de dados.

    Para desidentificar dados confidenciais ao nível do repositório FHIR, chame o método fhirStores.deidentify da Cloud Healthcare API.
  • Ao nível do arquivo DICOM. A desidentificação ocorre em todos os dados num armazenamento DICOM específico num conjunto de dados.

    Para desidentificar dados confidenciais ao nível do armazenamento DICOM, chame o método dicomStores.deidentify da Cloud Healthcare API.

A desidentificação não afeta o conjunto de dados original, o FHIR store, o DICOM store nem os dados originais. Consoante a forma como configura a anulação da identificação, a operação comporta-se da seguinte forma:

  • Se estiver a remover a identificação dos dados ao nível do conjunto de dados, são escritas cópias sem identificação dos dados originais num novo conjunto de dados denominado conjunto de dados de destino.
  • Se estiver a remover a identificação dos dados ao nível do arquivo DICOM ou FHIR, são escritas cópias sem identificação dos dados originais num arquivo DICOM ou FHIR existente num conjunto de dados existente. O arquivo DICOM de saída e o arquivo FHIR são denominados, respetivamente, arquivo DICOM de destino e arquivo FHIR de destino.

O conjunto de dados de origem, o FHIR store ou o DICOM store e o conjunto de dados de destino, o FHIR store ou o DICOM store têm de estar na mesma Google Cloud localização. A anonimização de dados em várias localizações não é suportada. Google Cloud

Localização de desidentificação

Quando a Cloud Healthcare API desidentifica dados, estes podem ser processados numa localização diferente da localização onde reside a origem e o destino da loja FHIR ou DICOM. Após a conclusão da desidentificação, os dados são armazenados na mesma Google Cloud localização que o FHIR store ou o DICOM store de origem.

Para garantir que os dados são processados na mesma localização que o arquivo FHIR ou DICOM de origem, pode especificar a opção useRegionalDataProcessing em DeidentifyConfig.

Remover a identificação dos dados na Google Cloud consola

Pode anular a identificação dos dados de um conjunto de dados, de uma loja FHIR ou de uma loja DICOM a partir da Google Cloud consola. Para mais informações, consulte os artigos Desidentificar dados na Google Cloud consola (DICOM) e Desidentificar dados na Google Cloud consola (FHIR).

Desidentificação de DICOM

Uma instância DICOM contém um conjunto de elementos de metadados de chave-valor (conhecidos como etiquetas) e uma ou mais imagens. A operação deidentify pode remover etiquetas específicas que contenham dados confidenciais. A operação também pode usar o reconhecimento ótico de carateres (OCR) automático para ocultar texto incorporado em imagens contidas em instâncias DICOM.

Para ver exemplos de como desidentificar dados DICOM, consulte o artigo Desidentificar dados DICOM.

Desidentificação de FHIR

Cada recurso FHIR é um objeto semelhante a JSON que contém elementos de chave-valor. Alguns elementos são padronizados, enquanto outros são texto livre. Pode usar a operação deidentify para alcançar um dos seguintes resultados:

  • Remova valores específicos no recurso

  • Processar as partes de texto arbitrárias para remover apenas as partes confidenciais, deixando o resto dos dados tal como está

Para ver exemplos de como desidentificar dados FHIR, consulte o artigo Desidentificar dados FHIR.