Esta página descreve as etapas que você pode seguir para corrigir descobertas de perfis de dados.
Alto risco de dados
Colunas ou tabelas com alto risco de dados têm evidências de informações confidenciais sem proteções adicionais. Para diminuir a pontuação de risco dos dados, faça o seguinte:
Para colunas com dados confidenciais, aplique uma tag de política do BigQuery para restringir o acesso a contas com direitos de acesso específicos.
Antes de fazer essa alteração, verifique se o agente de serviço tem as permissões necessárias para criar o perfil de tabelas com restrições no nível da coluna. Caso contrário, o Cloud DLP mostrará um erro. Para ver mais informações, consulte Resolver problemas com o criador de perfil de dados.
Desidentifique os dados brutos brutos usando técnicas de desidentificação, como mascaramento e tokenização.
Se os dados de alto risco não forem necessários, considere remover as colunas confidenciais.
Alta pontuação de texto livre
Uma coluna com uma alta pontuação de texto livre,
especialmente uma que tenha evidências de vários infoTypes (como
PHONE_NUMBER
, US_SOCIAL_SECURITY_NUMBER
e DATE_OF_BIRTH
), pode conter
dados não estruturados e instâncias de informações de identificação
pessoal (PII). Essa coluna pode ser uma nota ou um campo de comentário. O texto de forma livre apresenta um risco em potencial. Por exemplo, nesses campos, alguém pode digitar "O cliente nasceu em 1º de janeiro de 1985".
O Cloud DLP foi criado para lidar com dados não estruturados. Para entender melhor esse tipo de dados, faça o seguinte:
Para identificar as linhas ou células em que pode haver PII, execute uma inspeção sob demanda na tabela do BigQuery.
Desidentifique os dados brutos brutos usando técnicas como mascaramento e tokenização.
A seguir
Saiba como o Cloud DLP calcula os níveis de risco e sensibilidade dos dados de tabelas e colunas.
Saiba mais sobre como a tokenização torna os dados utilizáveis sem sacrificar a privacidade.
Saiba como a Forrester classificou o Google Cloud como líder em plataformas de segurança de dados não estruturados.