文本分类
假设存在以下文本输入:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
输出是一个结果列表,分为以下几类:
InfoType
Likelihood
Offset
(在字符串中找到潜在的InfoType
的位置)
下表中显示了示例输出。
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
自动遮盖文本
自动遮盖会生成一个输出,其中并未提供结果列表,而是移除了敏感数据匹配项。
自动遮盖输入的示例:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
使用占位符“***”输出的示例:
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
资源
- 如需详细了解如何使用敏感数据保护来隐去文本,请参阅隐去文本内容中的敏感数据。
- 如需详细了解如何使用敏感数据保护对文本内容中的敏感数据进行去标识化,包括“遮盖”敏感数据、使用“令牌”字符串替换敏感数据,以及使用随机生成或预先确定的密钥加密和替换敏感数据,请参阅对文本内容中的敏感数据进行去标识化。