Der Schutz sensibler Daten enthält zahlreiche integrierte infoType-Detektoren. Sie können aber auch Ihre eigenen erstellen. Sie können das Erkennungsverhalten anpassen. Definieren Sie dazu Sie Ihre eigenen benutzerdefinierten infoType-Detektoren, sodass der Schutz sensibler Daten sensible Daten, die mit von Ihnen angegebenen Mustern übereinstimmen, untersucht oder de-identifiziert. Es gibt folgende Arten von benutzerdefinierten infoType-Detektoren:
- Reguläre benutzerdefinierte Wörterbuchdetektoren sind einfache Wort- und Wortgruppenlisten, nach denen der Schutz sensibler Daten auf Übereinstimmungen prüft. Verwenden Sie normale benutzerdefinierte Wörterbuchdetektoren, wenn Ihre Wortzahl nicht mehr als mehrere hunderttausend Wörter beträgt.
- Große benutzerdefinierte Wörterbuchdetektoren werden vom Schutz vor sensiblen Daten unter Verwendung umfangreicher Listen von Wörtern oder Wortgruppen generiert, die entweder in Cloud Storage oder BigQuery gespeichert sind. Verwenden Sie große benutzerdefinierte Wörterbuchdetektoren, wenn Sie eine umfangreiche Liste von Wörtern oder Wortgruppen haben (bis zu mehreren zehn Millionen).
- Detektoren regulärer Ausdrücke (Regex-Detektoren) ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen anhand eines regulären Ausdrucksmusters zu erkennen.
- Surrogate-InfoType-Detektoren erkennen die Ausgabe der De-Identifikationstransformation für den Schutz sensibler Daten
CryptoReplaceFfxFpeConfig
. Dieser benutzerdefinierte infoType-Detektor wird ausschließlich mit der Methodecontent:reidentify
verwendet, um die De-Identifikation mit formatbewahrender Verschlüsselung (Format-Preserving Encryption, FPE) im FFX-Modus rückgängig zu machen. Aus diesem Grund werden Ersatzwerte in diesen Themen nicht ausführlich beschrieben. Weitere Informationen dazu, wie und wann benutzerdefinierte infoType-Ersatzdetektoren verwendet werden, finden Sie unter Pseudonymisierung.
Außerdem gilt in Sensitive Data Protection das Konzept der Prüfregeln, mit denen Sie die Scanergebnisse auf folgende Weise verfeinern können:
- Mit Ausschlussregeln können Sie falsche oder unerwünschte Ergebnisse ausschließen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.
- Mit Hotword-Regeln können Sie die Anzahl oder Genauigkeit von zurückgegebenen Ergebnissen erhöhen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.
Weitere Informationen zu benutzerdefinierten infoType-Detektoren finden Sie auf der Seite, auf der das Konzept InfoTypes und infoType-Detektoren erläutert wird. Einige Beispiele, die Sie nach Belieben verwenden oder ändern können, finden Sie unter Beispiele für benutzerdefinierte infoType-Detektoren. Im Rest dieses Themas wird beschrieben, wie Sie mit dem Schutz vor sensiblen Daten Ihre eigenen benutzerdefinierten InfoType-Detektoren erstellen.
Einsatzmöglichkeiten für benutzerdefinierte infoType-Detektoren
Benutzerdefinierte infoType-Detektoren werden im Objekt CustomInfoType
definiert. Sie geben im Objekt InspectConfig
einen CustomInfoType
an, wenn Sie Folgendes konfigurieren:
- Inspektion mit
projects.content.inspect
- Inspektionsjobs in
InspectJobConfig
- Inspektionsvorlagen in
InspectTemplate
- De-Identifikation mit
projects.content.deidentify
- De-Identifikationsvorlagen in
DeidentifyTemplate
- Re-Identifikation von Inhalten, die im FX-Modus mit FPE de-identifiziert wurden, mithilfe von
projects.content.reidentify
Dieses Szenario ist spezifisch für benutzerdefinierte infoType-Ersatzdetektoren.
API-Übersicht
Mit dem Objekt CustomInfoType
können Sie einen benutzerdefinierten infoType-Detektor für neuen Inhalt erstellen oder die Ergebnisse vordefinierter infoType-Detektoren optimieren.
Das Objekt CustomInfoType
besteht aus den folgenden Feldern, die wie beschrieben festgelegt werden:
"infotype"
: Name des benutzerdefinierten infoType-Detektors in einemInfoType
-Objekt"likelihood"
: StandardwertLikelihood
, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Sie können in"detectionRules"
alternativeLikelihood
-Werte angeben, die diese Basis-Likelihood
ersetzen, wenn das Ergebnis den Kriterien der Regel entspricht. Wenn Sie das Feld"likelihood"
nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig aufVERY_LIKELY
gesetzt. Weitere Informationen zur Wahrscheinlichkeit finden Sie auf der Konzeptseite Wahrscheinlichkeit."detectionRules"
: Eine Reihe von ObjektenDetectionRule
, die zusätzlich auf alle Ergebnisse dieses benutzerdefinierten infoType-Detektors angewendet werden sollen. Hier geben Sie Hotword-Regeln als ObjektHotwordRule
an. Regeln werden in der Reihenfolge angewendet, in der sie angegeben sind. Dieses Feld gilt nicht fürSurrogateType
-Objekte"sensitivityScore"
: Der WertSensitivityScore
, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Wenn Sie das Feld"sensitivityScore"
nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig aufVERY_LIKELY
gesetzt.Sensibilitätsbewertungen werden in Datenprofilen verwendet. Beim Erstellen von Datenprofilen verwendet der Schutz sensibler Daten die Sensibilitätsbewertungen der infoTypes, um das Sensibilitätsniveau zu berechnen.
Eines der folgenden Felder, abhängig von der Art des benutzerdefinierten infoType-Detektors, den Sie erstellen:
"dictionary"
: Ein ObjektDictionary
, das eine Liste von Wörtern oder Wortgruppen enthält, nach denen gesucht werden soll"regex"
: Ein ObjektRegex
mit einem einzelnen Muster, das den regulären Ausdruck definiert"surrogateType"
: Ein ObjektSurrogateType
gibt, falls vorhanden, an, dass der benutzerdefinierte infoType-Detektor ein Ersatzwert ist. Weitere Informationen zur Verwendung von benutzerdefinierten infoType-Ersatzdetektoren finden Sie unter Pseudonymisierung."storedType"
: Ein Verweis auf ein vorhandenesStoredInfoType
-Objekt. Dieses Feld ist erforderlich, wenn Sie einen großen benutzerdefinierten Wörterbuchdetektor erstellen. Sie können zwar Wörterbuch- oder regulären Ausdrucks-Detektoren erstellen, indem Sie dieses Feld definieren, es ist jedoch einfacher, sie über das Felddictionary
bzw.regex
zu erstellen.
Nächste Schritte
Weitere Informationen zum Erstellen von benutzerdefinierten infoTypes finden Sie in den folgenden Themen:
- Regulären benutzerdefinierten Wörterbuchdetektor erstellen: Erfahren Sie, wie Sie einen benutzerdefinierten infoType-Detektor erstellen, um Übereinstimmungen in einer Liste von Wörtern und Wortgruppen zu finden.
- Großen benutzerdefinierten Wörterbuchdetektor erstellen: Erfahren Sie, wie Sie Übereinstimmungen in einer sehr großen Liste von Wörtern und Wortgruppen finden. Gespeicherte benutzerdefinierte infoType-Detektoren können bis zu mehrere Millionen Wörter abgleichen.
- Benutzerdefinierten Regex-Detektor erstellen: Erfahren Sie, wie Sie einen benutzerdefinierten infoType-Detektor erstellen, um Übereinstimmungen mit einem regulären Ausdruck zu finden.
- InfoType-Detektoren zum Verfeinern von Scanergebnissen anpassen: Erfahren Sie, wie Sie Modifikatoren für integrierte und für benutzerdefinierte infoType-Detektoren erstellen, mit denen Sie Scanergebnisse verfeinern können.
- Übereinstimmungswahrscheinlichkeit anpassen: Erfahren Sie, wie Sie Erkennungsregeln und Hotwords verwenden, um die Wahrscheinlichkeitswerte anzupassen, die Übereinstimmungen mit benutzerdefinierten Detektoren zugeordnet sind.
- Beispiele für benutzerdefinierte infoType-Detektoren: Mehrere Definitionen benutzerdefinierter JSON-infoType-Detektoren, die Sie nach Belieben verwenden oder ändern können.