您可以使用模板创建和保留配置信息以用于 Sensitive Data Protection。模板可用于将配置(如检查的内容和对内容进行去标识化的方式)与请求的实现分离。模板提供了一种可靠的方法,让您能够重复使用配置并在用户和数据集之间实现一致性。
Sensitive Data Protection 支持两种类型的模板:
- 去标识化模板:用于保存去标识化作业配置信息的模板,包括 infoType 和记录(结构化数据集)转换。
- 检查模板:用于保留检查扫描作业配置信息的模板,包括要使用的预定义或自定义检测器。如需详细了解检查模板,请参阅创建敏感数据保护检查模板。
如需了解敏感数据保护中模板的相关概念,请参阅模板。
本主题的其余部分将向您介绍如何创建用于 Sensitive Data Protection 的去标识化模板。
创建去标识化模板
控制台
在 Google Cloud 控制台中,前往创建模板页面。
以下部分介绍了如何填写创建模板页面。
定义模板
在定义模板部分,按如下所示填写字段:
- 在模板类型部分,选择去标识化(移除敏感数据)。
对于数据转换类型,选择要应用的转换类型:
InfoType 匹配的内容。Sensitive Data Protection 仅将每个转换应用于被识别为特定 infoType 的值。此转换类型适用于非结构化文本。
记录。Sensitive Data Protection 在应用转换时会考虑数据的结构化格式。此转换类型适用于表格数据。
图片。敏感数据保护功能可隐去图片中所有检测到的文本,或仅隐去与特定 infoType 匹配的文本。
对于模板 ID,请输入模板的唯一标识符。
在 Display name 部分,输入模板的名称。
对于说明,请说明模板。
对于资源位置,选择 Global 或要去标识化的数据所在的位置。
点击继续。
配置去标识化步骤
配置去标识化中显示的字段取决于您选择的数据转换类型。
InfoType
如果您选择了 InfoType 作为数据转换类型,请执行以下操作:
在转换字段中,选择要应用于发现结果的转换方法。
系统会根据您的选择显示更多字段。根据需要填写相应字段。如需了解详情,请参阅转换参考文档。
在要转换的 InfoType 部分,指定您是否要将转换应用于在检查配置中定义的所有检测到的 infoType。
如果您选择指定 InfoType,请选择要将转换方法应用到的 InfoType。
如果您想为转换规则未涵盖的 infoType 添加转换规则,请点击添加转换规则。然后,根据需要填写相应字段。重复执行此步骤,直到为要转换的所有 infoType 配置转换规则。
点击创建。
录制
如果您选择了记录作为数据转换类型,请执行以下操作:
- 在要转换的字段或列中,输入包含要转换的数据的表列的名称。然后按
ENTER
。 对包含要转换的数据的每一列重复此步骤。 指定转换类型:
按 infoType 匹配。Sensitive Data Protection 会将每个单元格视为非结构化文本,并仅将转换应用于它在单元格中找到的 infoType。敏感数据保护不会转换 infoType 周围的任何数据。
如果您选择此选项,请执行以下操作:
- 点击添加转换。在转换字段中,选择要应用于发现结果的转换方法。
指定是否要将转换应用于检查配置中定义的所有检测到的 infoType。
如果您选择指定 InfoType,请选择要将转换规则应用到的 InfoType。
如果您想向特定 infoType 分配特定转换规则,可以根据需要添加更多转换。
基元字段转换。Sensitive Data Protection 始终会根据您选择的转换方法转换整个单元格。如果您想转换整列数据(无论这些列中的单元格是否检测到 infoType),此选项会非常有用。
如果您选择此选项,请在 Transformation(转换)字段中选择要应用于您指定的列的转换方法。
在上述两种情况下,系统都会根据您选择的转换方法显示更多字段。根据需要填写相应字段。如需了解详情,请参阅转换参考文档。
点击创建。
Image
如果您选择了图片作为数据转换类型,请执行以下操作:
可选:如需更改用于遮盖隐去内容的方框的颜色,请点击隐去内容颜色字段中的黑色方框,然后选择其他颜色。
在要转换的 infoType 部分,指定要隐去的内容:所有检测到的文本、检查配置中定义的所有 infoType,还是仅特定 infoType。
如果您选择指定 InfoType,请选择要将转换规则应用到的 InfoType。
如果您想为转换规则未涵盖的 infoType 添加转换规则,请点击添加转换规则。然后,根据需要填写相应字段。重复执行此步骤,直到为要转换的所有 infoType 配置转换规则。
点击创建。
协议
值得注意的是,去标识化模板只是一种可重复使用的去标识化配置,外加一些元数据。在 API 术语中,DeidentifyTemplate
对象其实相当于包含更多元数据字段(如显示名和说明)的 DeidentifyConfig
对象。因此,要创建新的去标识化模板,基本步骤如下:
- 从
DeidentifyConfig
对象开始。 - 调用或通过 POST 发布
projects.deidentifyTemplates
资源的create
方法,在请求中包含一个带显示名、说明和该DeidentifyConfig
对象的DeidentifyTemplate
对象。
返回的 DeidentifyTemplate
立即可供使用。您可以通过其 name
在其他调用或作业中引用它。您可以通过调用 *.deidentifyTemplates.list
方法列出现有模板。如需查看特定模板,请调用 *.deidentifyTemplates.get
方法。请注意,可创建的模板数量上限为 1000。
如果您曾使用 Sensitive Data Protection 对文本、图片或结构化内容中的敏感数据进行去标识化,则表示您已创建 DeidentifyConfig
对象。再执行一步,即可将其转换为 DeidentifyTemplate
对象。
REST 示例
下面的 JSON 示例展示了您可以向 projects.deidentifyTemplates.create
方法发送哪些内容。此 JSON 会创建一个具有给定显示名和说明的新模板,并依据 infoType EMAIL_ADDRESS
和 GENERIC_ID
扫描匹配项。如果找到与这些 infoType 匹配的内容,该 JSON 将使用星号 (*
) 字符遮盖前三个字符。
HTTP 方法和网址
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/deidentifyTemplates
将 PROJECT_ID
替换为项目 ID。
JSON 输入
{
"deidentifyTemplate":{
"displayName":"Email and id masker",
"description":"De-identifies emails and ids with a series of asterisks.",
"deidentifyConfig":{
"infoTypeTransformations":{
"transformations":[
{
"infoTypes":[
{
"name":"GENERIC_ID"
}
],
"primitiveTransformation":{
"replaceWithInfoTypeConfig":{
}
}
},
{
"infoTypes":[
{
"name":"EMAIL_ADDRESS"
}
],
"primitiveTransformation":{
"characterMaskConfig":{
"charactersToIgnore":[
{
"charactersToSkip":"@"
}
],
"maskingCharacter":"*"
}
}
}
]
}
}
}
}
JSON 输出
{ "name":"projects/PROJECT_ID/deidentifyTemplates/JOB-ID", "displayName":"Email and id masker", "description":"De-identifies emails and ids with a series of asterisks.", "createTime":"2018-11-30T07:17:59.536022Z", "updateTime":"2018-11-30T07:17:59.536022Z", "deidentifyConfig":{ "infoTypeTransformations":{ "transformations":[ { "infoTypes":[ { "name":"GENERIC_ID" } ], "primitiveTransformation":{ "replaceWithInfoTypeConfig":{ } } }, { "infoTypes":[ { "name":"EMAIL_ADDRESS" } ], "primitiveTransformation":{ "characterMaskConfig":{ "maskingCharacter":"*", "charactersToIgnore":[ { "charactersToSkip":"@" } ] } } } ] } } }
如需快速尝试此操作,您可以使用下面嵌入的 APIs Explorer。 如需了解有关如何使用 JSON 将请求发送到 DLP API 的常规信息,请参阅 JSON 快速入门。
使用去标识化模板
创建新模板后,您可以在任何可接受 deidentifyTemplateName
的位置使用其 name
标识符,例如:
projects.content.deidentify
:使用模板作为其配置,对内容中的潜在敏感数据进行去标识化。请注意,此方法可以使用检查模板或去标识化模板。
列出去标识化模板
如需列出已创建的所有去标识化模板,请使用任一 *.*.list
方法:
本部分演示了如何使用敏感数据保护功能列出检查模板。此过程与列出去标识化模板的过程相同。
C#
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
PHP
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
删除去标识化模板
如需删除特定的去标识化模板,请使用任一 *.*.delete
方法:
无论使用哪种 *.*.delete
方法,均需添加要删除的模板的资源名称。
C#
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
PHP
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解如何安装和使用敏感数据保护客户端库,请参阅 敏感数据保护客户端库。
如需向 Sensitive Data Protection 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。