Esta série de documentos oferece estratégias para avaliar e reduzir o risco de dados na sua organização. Ele também descreve e compara dois serviços de proteção de dados sensíveis que ajudam você a saber mais sobre sua postura atual de segurança de dados.
Objetivos da gestão de riscos de dados
Gerenciar o risco de dados envolve armazenar, processar e usar seus dados dentro dos níveis de risco adequados para sua empresa. Ao realizar o gerenciamento de risco de dados, recomendamos que você busque os seguintes objetivos:
- Seus dados são descobertos e classificados corretamente.
- O risco de exposição de dados é entendido corretamente.
- Os dados são protegidos por controles adequados ou minimizados por ofuscação.
Ao avaliar suas cargas de trabalho de dados, comece fazendo estas perguntas:
- Que tipo de dados essa carga de trabalho processa e algum deles é sensível?
- Esses dados estão expostos corretamente? Por exemplo, o acesso aos dados é restrito aos usuários certos, no ambiente certo e para uma finalidade aprovada?
- É possível reduzir o risco desses dados com estratégias de ofuscação e minimização de dados?
Uma abordagem bem informada e baseada em riscos pode ajudar você a aproveitar ao máximo seus dados sem comprometer a privacidade dos usuários.
Exemplo de análise
Neste exemplo, suponha que sua equipe de dados esteja tentando criar um modelo de machine learning com base no feedback dos clientes nas avaliações de produtos.
Que tipo de dados essa carga de trabalho processa? Algum deles é sensível?
Na carga de trabalho de dados, você descobriu que a chave primária usada é o endereço de e-mail do cliente. Os endereços de e-mail dos clientes geralmente contêm os nomes deles. Além disso, as avaliações reais do produto contêm dados não estruturados (ou dados de forma livre) enviados pelo cliente. Os dados não estruturados podem conter instâncias intermitentes de dados sensíveis, como números de telefone e endereços.
Esses dados estão expostos corretamente?
Você descobriu que os dados só podem ser acessados pela equipe de produto. No entanto, você quer compartilhar os dados com sua equipe de análise de dados para que ela possa usá-los para criar um modelo de aprendizado de máquina. Expor os dados a mais pessoas também significa expô-los a mais ambientes de desenvolvimento em que esses dados serão armazenados e processados. Você determinou que o risco de exposição vai aumentar.
É possível reduzir o risco desses dados com estratégias de ofuscação e minimização de dados?
Você sabe que a equipe de análise não precisa de nenhuma das informações sensíveis de identificação pessoal (PII) no conjunto de dados. No entanto, eles precisam agregar os dados por cliente. Eles precisam de uma maneira de determinar quais avaliações pertencem ao mesmo cliente. Para atender a essa necessidade, você decide tokenizar todos os PII estruturados (os endereços de e-mail dos clientes) para manter a integridade referencial dos dados. Você também decide inspecionar os dados não estruturados, as avaliações, e mascarar os dados sensíveis intermitentes neles.
A seguir
- Compare os serviços de proteção de dados sensíveis que ajudam você a saber mais sobre seus dados (próximo documento desta série).