Nesta série de documentos, apresentamos estratégias para avaliar e mitigar o risco de dados na sua organização. Ela também descreve e compara dois serviços de proteção de dados sensíveis que ajudam você a saber mais sobre sua postura atual de segurança de dados.
Objetivos da gestão de risco de dados
Gerenciar riscos de dados envolve armazenar, processar e usar seus dados nos níveis de risco adequados para sua empresa. Ao realizar o gerenciamento de risco de dados, recomendamos que você atinja os seguintes objetivos:
- Seus dados foram descobertos e classificados adequadamente.
- O risco de exposição de dados é devidamente compreendido.
- Os dados são protegidos por controles adequados ou são removidos por ofuscação.
Ao avaliar suas cargas de trabalho de dados, comece fazendo estas perguntas:
- Que tipo de dados essa carga de trabalho processa? Alguns deles são confidenciais?
- Esses dados estão devidamente expostos? Por exemplo, o acesso aos dados é restrito aos usuários certos, no ambiente certo e para uma finalidade aprovada?
- O risco desses dados pode ser reduzido com estratégias de minimização e ofuscação de dados?
Adotar uma abordagem bem informada e baseada em risco pode ajudar você a aproveitar ao máximo seus dados sem comprometer a privacidade dos usuários.
Exemplo de análise
Para este exemplo, suponha que sua equipe de dados esteja tentando criar um modelo de machine learning com base no feedback dos clientes nas avaliações do produto.
Que tipo de dados essa carga de trabalho processa? Alguns deles são confidenciais?
Na carga de trabalho de dados, você descobriu que a chave primária usada é o endereço de e-mail do cliente. Os endereços de e-mail dos clientes geralmente contêm os nomes dos clientes. Além disso, as avaliações do produto contêm dados não estruturados (ou dados de formato livre) enviados pelo cliente. Os dados não estruturados podem conter instâncias intermitentes de dados confidenciais, como números de telefone e endereços.
Esses dados estão devidamente expostos?
Você descobriu que os dados são acessíveis apenas para a equipe do produto. No entanto, você quer compartilhar os dados com sua equipe de análise de dados, para que possam usá-los para criar um modelo de machine learning. Expor os dados a mais pessoas também significa expô-los a mais ambientes de desenvolvimento onde esses dados serão armazenados e processados. Você determinou que o risco de exposição aumentará.
É possível reduzir o risco desses dados com estratégias de minimização e ofuscação de dados?
Você sabe que a equipe de análise não precisa das informações confidenciais de identificação pessoal (PII, na sigla em inglês) presentes no conjunto de dados. No entanto, é preciso agregar os dados por cliente. Elas precisam de uma maneira de determinar quais avaliações pertencem ao mesmo cliente. Para atender a essa necessidade, você decide tokenizar todas as PII estruturadas (os endereços de e-mail do cliente) para manter a integridade referencial dos seus dados. Você também decide inspecionar os dados não estruturados (as avaliações) e mascarar quaisquer dados confidenciais intermitentes neles.
A seguir
- Comparar os serviços de proteção de dados sensíveis que ajudam você a saber mais sobre seus dados (próximo documento desta série)