Mit einem benutzerdefinierten, auf einem regulären Ausdruck (Regex) basierenden infoType-Detektor können Sie eigene Detektoren erstellen, mit denen der Schutz vertraulicher Daten Übereinstimmungen anhand eines Regex-Musters erkennen kann. Nehmen wir beispielsweise an, Sie hätten Krankenaktennummern im Format ###-#-#####
. Sie könnten ein Regex-Muster wie das Folgende definieren:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Sensitive Data Protection prüft dann auf Übereinstimmungen mit Elementen wie diesem:
012-4-56789
Anatomie eines benutzerdefinierten Regex-infoType-Detektors
Wie in der API-Übersicht dargestellt, definieren Sie zum Erstellen eines benutzerdefinierten Regex-infoType-Detektors ein CustomInfoType
-Objekt, das Folgendes enthält:
- Der Name, den Sie dem benutzerdefinierten infoType-Detektor innerhalb eines
InfoType
-Objekts geben möchten. - Einen optionalen Wert
Likelihood
. Wenn Sie dieses Feld weglassen, wird bei Übereinstimmungen mit regulären Ausdrücken die StandardwahrscheinlichkeitVERY_LIKELY
zurückgegeben. Wenn Sie feststellen, dass ein benutzerdefinierter Regex-infoType-Detektor zu viele falsche positive Ergebnisse zurückgibt, versuchen Sie, die Basiswahrscheinlichkeit zu reduzieren, und verwenden Sie Erkennungsregeln, um die Wahrscheinlichkeit mithilfe von Kontextinformationen zu erhöhen. Weitere Informationen finden Sie unter Ergebnis-Wahrscheinlichkeit anpassen. - Optionale
DetectionRule
oder Hotword-Regeln. Diese Regeln passen die Wahrscheinlichkeit von Ergebnissen innerhalb einer gegebenen Nähe von angegebenen Hotwords an. Weitere Informationen zu Hotword-Regeln finden Sie unter Ergebnis-Wahrscheinlichkeit anpassen. Einen optionalen Wert
SensitivityScore
. Wenn Sie dieses Feld weglassen, wird bei Übereinstimmungen mit dem regulären Ausdruck die StandardempfindlichkeitsstufeHIGH
zurückgegeben.Sensibilitätsbewertungen werden in Datenprofilen verwendet. Beim Erstellen von Datenprofilen verwendet der Schutz sensibler Daten die Sensibilitätsbewertungen der infoTypes, um das Sensibilitätsniveau zu berechnen.
Ein
Regex
-Objekt, das aus einem einzelnen Muster besteht, das den regulären Ausdruck definiert.
Als JSON-Objekt sieht ein benutzerdefinierter Regex-infoType-Detektor, der alle optionalen Komponenten enthält, so aus:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Regex-Beispiel: Krankenaktennummern abgleichen
Das folgende JSON-Snippet und der folgende Code in mehreren Sprachen unten zeigen einen benutzerdefinierten infoType-Detektor mit regulärem Ausdruck, der den Schutz sensibler Daten anweist, eine Krankenaktennummer (Medical Record Number, MRN) im Eingabetext „Patient's MRN 444-5-22222“ zuzuordnen und jeder Übereinstimmung eine Wahrscheinlichkeit von POSSIBLE
zuzuweisen.
C#
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Go
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
PHP
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Sensitive Data Protection zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
REST
Weitere Informationen zur Verwendung der DLP API mit JSON finden Sie im JSON-Schnellstart.
JSON-Eingabe:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
JSON-Ausgabe:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
Die Ausgabe zeigt, dass der Schutz sensibler Daten mithilfe des benutzerdefinierten infoType-Detektors (den wir „C_MRN
“ genannt haben) und dem zugehörigen benutzerdefinierten regulären Ausdruck die Krankenaktennummer korrekt identifiziert und ihr eine Wahrscheinlichkeit von POSSIBLE
zugewiesen hat, wie von uns festgelegt.
Wenn Sie die Übereinstimmungswahrscheinlichkeit anpassen möchten, bauen Sie auf diesem Beispiel auf, um Kontextwörter einzubeziehen.