本页介绍了如何通过 Google Cloud 控制台在检查配置中添加和修改 infoType。
使用 Sensitive Data Protection 检查或分析数据时,您可以使用检查配置指定要扫描的信息类型(infoTypes)。您可以通过 Google Cloud 控制台中的以下敏感数据保护操作来设置检查配置:
Google Cloud 控制台中的这些操作都有一个 InfoTypes 部分,您可以在其中选择 infoType、修改内置 infoType 的设置,以及添加自定义 infoType。包含 InfoTypes 部分的步骤因您要执行的操作而异。下表显示了每项操作的相关工作流程步骤。
操作 | 相关步骤 |
---|---|
创建检查模板 | 配置检测 |
创建检查作业或作业触发器 | 配置检测 |
创建发现扫描配置 | 选择检查模板 |
选择内置 infoType
- 在 InfoType 部分,点击管理 infoType。
如需缩小 infoType 的选择范围,请在过滤条件字段中应用过滤条件。选择要过滤的房源名称,然后输入房源值。例如,若要过滤出与澳大利亚相关的所有 infoType,请将属性名称设置为地理位置。在“Property value”(属性值)中,选择或输入 Australia(澳大利亚)。
如果您知道 infoType 名称,也可以直接在过滤字段中输入该名称。
如需查看某个 infoType 的所有类别标记,请点击该 infoType 的
切换完整单元格内容。如需隐藏或取消隐藏列,请点击
Column display options(列显示选项),然后选择要显示的列的名称。选择要添加到检查配置中的 infoType。
点击完成。
修改内置 infoType 的设置
在设置要添加到检查配置中的 infoType 时,您还可以修改一个或多个 infoType 的设置。您可以修改敏感度级别,对于某些 infoType,还可以修改 infoType 版本。
- 选择要添加到检查配置中的内置 infoType,包括您无需修改的 infoType。请勿点击完成。
点击修改所选的 infoType。
对于要修改的每个 infoType,请使用下拉菜单选择灵敏度级别或检测器版本。
点击确认。
点击完成。
添加自定义 InfoType
本部分介绍了如何根据一组底层数据添加自定义 infoType。基础数据可以是以下任一项:
- 您在检查配置中内嵌提供的字词或短语的列表。
- 您存储在 Cloud Storage 文本文件中的字词或短语列表。
您存储在 Cloud Storage 中的大型文本文档或 BigQuery 中的列中的大量字词或短语。
对于此类型,您必须先创建指向大型自定义字典的存储 infoType,然后才能执行此任务。
您在检查配置中内嵌提供的正则表达式。
您能否重复使用新的自定义 infoType 取决于您在创建自定义 infoType 时执行的操作:
如果您在创建检查作业或作业触发器时创建了自定义 infoType,则该自定义 infoType 仅适用于该作业或作业触发器。
如果您在创建检查模板时创建了自定义 infoType,则该自定义 infoType 可供使用该检查模板的任何操作使用。
如果您在配置性能分析时创建了自定义 infoType,Sensitive Data Protection 会根据您的检查配置创建新的检查模板。自定义 infoType 适用于使用该新检查模板的任何操作。
如需详细了解自定义 infoType,请参阅自定义 infoType 检测器。
如需添加自定义 infoType 检测器,请执行以下操作:
- 在 InfoType 部分,点击管理 infoType。
- 在自定义标签页中,点击添加自定义 infoType。
对于 Type,选择要创建的自定义 infoType 检测器的类型:
字词或短语:与您输入到该字段中的一个或多个字词或短语匹配。您最多可以输入 128 KB 的数据,相当于数千条条目。
选择此类型后,系统会显示字词或词组列表字段。输入您希望敏感数据保护功能匹配的字词或短语。如需匹配多个字词或短语,请在输入每个字词或短语后按
Enter
。如需了解详情,请参阅创建常规自定义字典检测器。字典路径:匹配您存储在 Cloud Storage 文本文件中的字词或短语。如果您要搜索数十万个字词或短语,请使用此自定义 infoType。如果您的列表包含敏感字词,并且您不想在检查配置中内嵌存储这些字词,此方法也很有用。
选择此类型后,系统会显示字典位置字段。输入或浏览到存储字典文件的 Cloud Storage 路径。如需了解详情,请参阅创建常规自定义字典检测器。
正则表达式:根据正则表达式匹配内容。
选择此类型后,系统会显示 Regex 字段。输入正则表达式模式,以匹配字词和短语。如需了解详情,请参阅支持的正则表达式语法。
infoType:匹配您存储在 Cloud Storage 中的大型文本文档或 BigQuery 中的单个列中的字词或短语。
此选项会添加大型自定义字典检测器。如果您要搜索数百万个字词或短语,请使用此类自定义 infoType。
对于此类型,您必须已创建指向底层大型自定义字典的存储的 infoType。
选择此类型后,系统会显示存储的 infoType 名称字段。输入存储的 infoType 的完整资源名称。
对于 InfoType,请输入要创建的自定义 infoType 的名称。
如果您要创建的类型为存储的 infoType 的自定义 infoType,请输入一个不同于底层存储的 infoType 的名称。
对于可能性,选择要分配给与此自定义 infoType 匹配的所有发现结果的默认可能性级别。您可以使用热词规则进一步微调各个发现结果的可能性级别。如果未指定默认值,则默认可能性级别会设为
VERY_LIKELY
。如需了解详情,请参阅匹配概率。对于敏感度,选择要为与此自定义 infoType 匹配的所有发现结果分配的敏感度级别。如果您未指定值,则这些发现的敏感度级别会设为
HIGH
。敏感度得分用于数据分析。在分析数据时,敏感数据保护功能会使用 infoType 的敏感度得分来计算敏感度级别。
点击完成。
可选:如需添加其他自定义 infoType,请再次点击添加自定义 infoType。
点击完成。
后续步骤
- 请参阅内置 infoType 检测器列表。
- 详细了解自定义 infoType 检测器。
- 了解如何通过 DLP API 创建常规自定义字典检测器。
- 了解如何通过 DLP API 创建大型自定义字典检测器。
- 了解如何通过 DLP API 创建自定义正则表达式检测器。