Mit einem benutzerdefinierten infoType-Detektor für reguläre Ausdrücke (Regex) können Sie eigene Detektoren erstellen, die den Schutz sensibler Daten ermöglichen, um Übereinstimmungen basierend auf einem Regex-Muster zu erkennen. Nehmen wir beispielsweise an, Sie hätten Krankenaktennummern im Format ###-#-#####
. Sie könnten ein Regex-Muster wie das Folgende definieren:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Beim Schutz sensibler Daten werden dann Elemente wie die folgenden abgeglichen:
012-4-56789
Anatomie eines benutzerdefinierten Regex-infoType-Detektors
Wie in der API-Übersicht dargestellt, definieren Sie zum Erstellen eines benutzerdefinierten Regex-infoType-Detektors ein CustomInfoType
-Objekt, das Folgendes enthält:
- Der Name, den Sie dem benutzerdefinierten infoType-Detektor innerhalb eines
InfoType
-Objekts geben möchten. - Einen optionalen Wert
Likelihood
. Wenn Sie dieses Feld weglassen, wird bei Übereinstimmungen mit regulären Ausdrücken die StandardwahrscheinlichkeitVERY_LIKELY
zurückgegeben. Wenn Sie feststellen, dass ein benutzerdefinierter Regex-infoType-Detektor zu viele falsche positive Ergebnisse zurückgibt, versuchen Sie, die Basiswahrscheinlichkeit zu reduzieren, und verwenden Sie Erkennungsregeln, um die Wahrscheinlichkeit mithilfe von Kontextinformationen zu erhöhen. Weitere Informationen finden Sie unter Ergebnis-Wahrscheinlichkeit anpassen. - Optionale
DetectionRule
oder Hotword-Regeln. Diese Regeln passen die Wahrscheinlichkeit von Ergebnissen innerhalb einer gegebenen Nähe von angegebenen Hotwords an. Weitere Informationen zu Hotword-Regeln finden Sie unter Ergebnis-Wahrscheinlichkeit anpassen. Einen optionalen Wert
SensitivityScore
. Wenn Sie dieses Feld weglassen, wird bei Übereinstimmungen mit dem regulären Ausdruck die standardmäßige EmpfindlichkeitsstufeHIGH
zurückgegeben.Empfindlichkeitswerte werden in Datenprofilen verwendet. Bei der Profilerstellung für Ihre Daten verwendet der Schutz sensibler Daten die Vertraulichkeitswerte der infoTypes, um die Vertraulichkeitsstufe zu berechnen.
Ein
Regex
-Objekt, das aus einem einzelnen Muster besteht, das den regulären Ausdruck definiert.
Als JSON-Objekt sieht ein benutzerdefinierter Regex-infoType-Detektor, der alle optionalen Komponenten enthält, so aus:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Regex-Beispiel: Krankenaktennummern abgleichen
Das folgende JSON-Snippet und der folgende Code in mehreren Sprachen unten zeigen einen benutzerdefinierten infoType-Detektor mit regulären Ausdrücken, der den Schutz sensibler Daten anweist, eine Krankenaktennummer (Krankenaktennummer) im Eingabetext „Patient's MRN 444-5-22222“ abzugleichen und jeder Übereinstimmung die Wahrscheinlichkeit POSSIBLE
zuzuweisen.
C#
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Go
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
PHP
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für den Schutz sensibler Daten finden Sie unter Clientbibliotheken für den Schutz sensibler Daten.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich beim Schutz sensibler Daten zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
REST
Weitere Informationen zur Verwendung der DLP API mit JSON finden Sie im JSON-Schnellstart.
JSON-Eingabe:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
JSON-Ausgabe:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
Die Ausgabe zeigt, dass der Schutz sensibler Daten mithilfe des benutzerdefinierten infoType-Detektors (den wir "C_MRN
" genannt haben) und dem zugehörigen benutzerdefinierten regulären Ausdruck die Krankenaktennummer korrekt identifiziert und ihr eine Wahrscheinlichkeit von POSSIBLE
zugewiesen hat, wie von uns festgelegt.
Wenn Sie die Übereinstimmungswahrscheinlichkeit anpassen möchten, bauen Sie auf diesem Beispiel auf, um Kontextwörter einzubeziehen.