您可以使用模板创建和保留配置信息,以用于敏感数据保护。模板可用于将配置(如检查的内容和对内容进行去标识化的方式)与请求的实现分离。模板提供了一种可靠的方法,让您能够重复使用配置并在用户和数据集之间实现一致性。
敏感数据保护支持两种类型的模板:
- 去标识化模板:用于保存去标识化作业配置信息的模板,包括 infoType 和记录(结构化数据集)转换。
- 检查模板:用于保留检查扫描作业配置信息的模板,包括要使用的预定义或自定义检测器。如需详细了解检查模板,请参阅创建敏感数据保护检查模板。
如需了解敏感数据保护中模板的概念性信息,请参阅模板。
本主题的其余部分介绍如何创建用于敏感数据保护的去标识化模板。
创建去标识化模板
控制台
在 Google Cloud 控制台中,前往创建模板页面。
以下部分介绍了如何在 Create template(创建模板)页面中填写内容。
定义模板
在定义模板部分中,按如下所示填写各个字段:
- 在模板类型部分,选择去标识化(移除敏感数据)。
对于数据转换类型,选择要应用的转换类型:
InfoType 匹配的内容。敏感数据保护会将每个转换仅应用于被标识为特定 infoType 的值。此转换类型适用于非结构化文本。
记录。敏感数据保护在应用转换时会考虑数据的结构化格式。此转换类型适用于表格数据。
Image。敏感数据保护会隐去图片中所有检测到的文本或仅隐去与特定 infoType 匹配的文本。
对于模板 ID,输入模板的唯一标识符。
在显示名称部分,输入模板的名称。
在说明部分,描述模板。
对于资源位置,选择全局或要去标识化的数据的位置。
点击继续。
配置去标识化步骤
配置去标识化中显示的字段选择取决于您选择的数据转换类型。
InfoType
如果您选择 InfoType 作为数据转换类型,请执行以下操作:
在转换字段中,选择要应用于发现结果的转换方法。
系统会根据您的选择显示更多字段。根据需要填写字段。如需了解详情,请参阅转换参考文档。
在要转换的 InfoType 部分中,指定是否要将转换应用于检查配置中定义的所有检测到的 infoType。
如果选择指定 infoType,请选择要应用转换方法的 infoType。
如果要为转换规则未涵盖的 infoType 添加转换规则,请点击添加转换规则。然后,根据需要填写字段。重复此步骤,直到您为要转换的所有 infoType 配置转换规则为止。
点击创建。
录制
如果您选择 Record 作为数据转换类型,请执行以下操作:
- 在要转换的字段或列部分,输入包含要转换的数据的表列的名称。然后按
ENTER
。 对包含要转换的数据的所有列重复此步骤。 指定转换类型:
匹配 infoType。敏感数据保护将每个单元格视为非结构化文本,并仅将转换应用于它在单元格中找到的 infoType。敏感数据保护不会转换 infoType 周围的任何数据。
如果您选择此选项,请执行以下操作:
- 点击添加转换。在转换字段中,选择要应用于发现结果的转换方法。
指定是否要将转换应用于检查配置中定义的所有已检测到的 infoType。
如果选择指定 infoType,请选择要应用转换规则的 infoType。
如果要将某些转换规则分配给某些 infoType,可以根据需要添加更多转换。
原初字段转换。敏感数据保护始终会根据您选择的转换方法转换整个单元格。如果要转换整列数据(无论这些列中的单元格是否检测到 infoType),此选项非常有用。
如果您选择此选项,请在转换字段中选择要应用于您指定的列的转换方法。
在这两种情况下,系统都会根据您选择的转换方法显示更多字段。根据需要填写字段。如需了解详情,请参阅转换参考文档。
点击创建。
映像
如果您选择了 Image 作为数据转换类型,请执行以下操作:
可选:如需更改遮盖遮盖的文本的框的颜色,请点击遮盖颜色字段中的黑色框,然后选择其他颜色。
在要转换的 InfoType 部分中,指定要隐去的内容:所有检测到的文本、检查配置中定义的所有 infoType,或仅特定 infoType。
如果选择指定 infoType,请选择要应用转换规则的 infoType。
如果要为转换规则未涵盖的 infoType 添加转换规则,请点击添加转换规则。然后,根据需要填写字段。重复此步骤,直到您为要转换的所有 infoType 配置转换规则为止。
点击创建。
协议
值得注意的是,去标识化模板只是一种可重复使用的去标识化配置,外加一些元数据。在 API 术语中,DeidentifyTemplate
对象其实相当于包含更多元数据字段(如显示名和说明)的 DeidentifyConfig
对象。因此,要创建新的去标识化模板,基本步骤如下:
- 从
DeidentifyConfig
对象开始。 - 调用或通过 POST 发布
projects.deidentifyTemplates
资源的create
方法,在请求中包含一个带显示名、说明和该DeidentifyConfig
对象的DeidentifyTemplate
对象。
返回的 DeidentifyTemplate
立即可供使用。您可以通过其 name
在其他调用或作业中引用它。您可以通过调用 *.deidentifyTemplates.list
方法列出现有模板。如需查看特定模板,请调用 *.deidentifyTemplates.get
方法。请注意,可创建的模板数量上限为 1000。
如果您曾使用敏感数据保护对文本、图片或结构化内容中的敏感数据进行去标识化,则您已创建过 DeidentifyConfig
对象。再执行一步,即可将其转换为 DeidentifyTemplate
对象。
REST 示例
下面的 JSON 示例展示了您可以向 projects.deidentifyTemplates.create
方法发送哪些内容。此 JSON 会创建一个具有给定显示名和说明的新模板,并依据 infoType EMAIL_ADDRESS
和 GENERIC_ID
扫描匹配项。如果找到与这些 infoType 匹配的内容,该 JSON 将使用星号 (*
) 字符遮盖前三个字符。
HTTP 方法和网址
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/deidentifyTemplates
将 PROJECT_ID
替换为项目 ID。
JSON 输入
{
"deidentifyTemplate":{
"displayName":"Email and id masker",
"description":"De-identifies emails and ids with a series of asterisks.",
"deidentifyConfig":{
"infoTypeTransformations":{
"transformations":[
{
"infoTypes":[
{
"name":"GENERIC_ID"
}
],
"primitiveTransformation":{
"replaceWithInfoTypeConfig":{
}
}
},
{
"infoTypes":[
{
"name":"EMAIL_ADDRESS"
}
],
"primitiveTransformation":{
"characterMaskConfig":{
"charactersToIgnore":[
{
"charactersToSkip":"@"
}
],
"maskingCharacter":"*"
}
}
}
]
}
}
}
}
JSON 输出
{ "name":"projects/PROJECT_ID/deidentifyTemplates/JOB-ID", "displayName":"Email and id masker", "description":"De-identifies emails and ids with a series of asterisks.", "createTime":"2018-11-30T07:17:59.536022Z", "updateTime":"2018-11-30T07:17:59.536022Z", "deidentifyConfig":{ "infoTypeTransformations":{ "transformations":[ { "infoTypes":[ { "name":"GENERIC_ID" } ], "primitiveTransformation":{ "replaceWithInfoTypeConfig":{ } } }, { "infoTypes":[ { "name":"EMAIL_ADDRESS" } ], "primitiveTransformation":{ "characterMaskConfig":{ "maskingCharacter":"*", "charactersToIgnore":[ { "charactersToSkip":"@" } ] } } } ] } } }
如需快速尝试此操作,您可以使用下面嵌入的 APIs Explorer。 如需了解有关如何使用 JSON 将请求发送到 DLP API 的一般信息,请参阅 JSON 快速入门。
使用去标识化模板
创建新模板后,您可以在任何可接受 deidentifyTemplateName
的位置使用其 name
标识符,例如:
projects.content.deidentify
:使用模板作为其配置,对内容中的潜在敏感数据进行去标识化。请注意,此方法可以使用检查模板或去标识化模板。
列出去标识化模板
如需列出已创建的所有去标识化模板,请使用任一 *.*.list
方法:
本部分介绍如何使用敏感数据保护列出检查模板。此过程与列出去标识化模板的过程相同。
C#
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
PHP
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
删除去标识化模板
如需删除特定的去标识化模板,请使用任一 *.*.delete
方法:
无论使用哪种 *.*.delete
方法,均需添加要删除的模板的资源名称。
C#
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
PHP
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解如何安装和使用用于敏感数据保护的客户端库,请参阅敏感数据保护客户端库。
如需向敏感数据保护服务进行身份验证,请设置应用默认凭据。如需了解详情,请参阅为本地开发环境设置身份验证。