这一系列文档提供了评估和降低贵组织数据风险的策略。该文档还介绍并比较了两项敏感数据保护服务,可帮助您详细了解当前的数据安全状况。
数据风险管理的目标
管理数据风险包括在适合贵商家的风险级别内存储、处理和使用数据。在执行数据风险管理时,我们建议您以实现以下目标为目标:
- 系统会正确发现和分类您的数据。
- 正确了解数据泄露风险。
- 数据受到适当控制措施的保护,或通过混淆处理来降低风险。
在评估数据工作负载时,您可以先问自己以下问题:
- 此工作负载处理哪类数据?其中是否有敏感数据?
- 这些数据是否已正确披露?例如,是否仅允许在正确的环境中,出于已获批准的用途,向正确的用户授予对数据的访问权限?
- 能否通过数据最小化和混淆策略降低此类数据的风险?
采取基于风险且信息充分的方法,有助于您充分利用数据,同时保护用户隐私。
分析示例
在本例中,假设您的数据团队正尝试根据商品评价中的客户反馈构建机器学习模型。
此工作负载处理哪类数据?其中是否有敏感数据?
在数据工作负载中,您发现所用的主键是客户电子邮件地址。客户电子邮件地址通常包含客户的姓名。此外,实际的商品评价包含客户提交的非结构化数据(或自由格式数据)。非结构化数据可能会包含手机号码和地址等敏感数据的间歇性实例。
这些数据是否已正确披露?
您发现只有产品团队可以访问这些数据。不过,您希望将这些数据分享给数据分析团队,以便他们据此构建机器学习模型。向更多人公开数据也意味着向更多开发环境公开数据,这些开发环境将存储和处理这些数据。您确定暴露风险会增加。
能否通过数据最小化和混淆策略降低此类数据的风险?
您知道分析团队不需要数据集中的任何实际敏感个人身份信息 (PII)。不过,他们需要汇总每个客户的数据。他们需要一种方法来确定哪些评价属于同一客户。为了满足这一需求,您决定对所有结构化个人身份信息(即客户电子邮件地址)进行令牌化处理,以保持数据的引用完整性。您还决定检查非结构化数据(评价),并遮盖其中的所有间歇性敏感数据。
后续步骤
- 比较可帮助您了解数据的 Sensitive Data Protection 服务(本系列的下一个文档)