Cloud Data Loss Prevention 可以检测 CSV 等结构化数据中的敏感数据并对其进行分类。通过对表进行检查或去标识化,结构和列可为 Cloud DLP 提供额外的线索,以便为某些用例提供更好的结果。
检查表
以下代码示例演示了如何检查数据表中是否存在敏感内容。 表支持各种类型。
协议
要详细了解如何将 DLP API 与 JSON 结合使用,请参阅 JSON 快速入门。
JSON 输入:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"table":{
"headers": [{"name":"name"}, {"name":"phone"}],
"rows": [{
"values":[
{"string_value": "John Doe"},
{"string_value": "(206) 555-0123"}
]}
],
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"includeQuote":true
}
}
JSON 输出:
{
"result": {
"findings": [
{
"quote": "(206) 555-0123",
"infoType": {
"name": "PHONE_NUMBER"
},
"likelihood": "VERY_LIKELY",
"location": {
"byteRange": {
"end": "14"
},
"codepointRange": {
"end": "14"
},
"contentLocations": [
{
"recordLocation": {
"fieldId": {
"name": "phone"
},
"tableLocation": {
}
}
}
]
},
"createTime": "2019-03-08T23:55:10.980Z"
}
]
}
}
Java
如需了解如何安装和使用 Cloud DLP 客户端库,请参阅 Cloud DLP 客户端库。
Python
如需了解如何安装和使用 Cloud DLP 客户端库,请参阅 Cloud DLP 客户端库。
文本与结构化文本
对文本进行结构化可以帮助提供上下文。如果以字符串形式来检查与前述示例中的请求相同的请求(即,仅采用“John Doe, (206) 555-0123”形式),则提供的结果准确性会降低。这是因为 Cloud DLP 在了解该数字的目的方面所具备的上下文线索较少。可能的话,请考虑将字符串解析为表对象,以获得最准确的扫描结果。