Cloud Data Loss Prevention (Cloud DLP) 现已成为敏感数据保护功能的一部分。API 名称保持不变：Cloud Data Loss Prevention API (DLP API)。如需了解构成敏感数据保护的服务，请参阅敏感数据保护概览。

此页面由 Cloud Translation API 翻译。

创建自定义正则表达式检测器

借助正则表达式 (regex) 自定义 infoType 检测器，您可以创建自己的检测器，使 Sensitive Data Protection 能够基于正则表达式模式检测匹配项。例如，假设您的医疗记录编号采用 ###-#-##### 形式。您可以定义一个正则表达式模式，如下所示：

[0-9]{3}-[0-9]{1}-[0-9]{5}

然后，Sensitive Data Protection 会匹配以下项：

012-4-56789

正则表达式自定义 infoType 检测器详解

如 API 概览中所述，要创建自定义正则表达式 infoType 检测器，需要定义一个包含下列内容的 CustomInfoType 对象：

您希望在 InfoType 对象中为自定义 infoType 检测器指定的名称。
（可选）Likelihood 值。如果省略此字段，正则表达式匹配项将返回默认可能性 VERY_LIKELY。如果您发现正则表达式自定义 infoType 检测器返回太多误报，请尝试减小基本可能性，并通过检测规则和上下文信息来提高可能性。如需了解详情，请参阅对发现结果的可能性进行自定义。
（可选）DetectionRule 或热词规则。这些规则可在指定热词的一定接近范围内调整结果的可能性。详细了解对发现结果的可能性进行自定义中的热词规则。
（可选）SensitivityScore 值。如果省略此字段，则正则表达式的匹配项将返回默认敏感度级别 HIGH。

敏感度得分用于数据剖析。在分析数据时，Sensitive Data Protection 会使用 infoType 的敏感度得分来计算敏感度级别。
一个 Regex 对象，由定义正则表达式的单个模式构成。

作为一个 JSON 对象，包含所有可选组件的正则表达式自定义 infoType 检测器如下所示：

{
  "customInfoTypes":[
    {
      "infoType":{
        "name":"CUSTOM_INFOTYPE_NAME"
      },
      "likelihood":"LIKELIHOOD_LEVEL",
      "detectionRules":[
        {
          "hotwordRule":{
            HOTWORD_RULE
          }
        },
      "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
      ],
      "regex":{
        "pattern":"REGULAR_EXPRESSION_PATTERN"
      }
    }
  ],
  ...
}

正则表达式示例：匹配医疗记录编号

下面采用以下多种语言的 JSON 代码段和代码显示了一个正则表达式自定义 infoType 检测器，它指示 Sensitive Data Protection 匹配输入文本“Patient's MRN 444-5-22222”中的医疗记录编号 (MRN)，并为每个匹配项分配可能性 POSSIBLE。