Benutzerdefinierte infoType-Detektoren

Der Schutz sensibler Daten enthält zahlreiche integrierte infoType-Detektoren. Sie können aber auch Ihre eigenen erstellen. Sie können das Erkennungsverhalten anpassen. Definieren Sie dazu Sie Ihre eigenen benutzerdefinierten infoType-Detektoren, sodass der Schutz sensibler Daten sensible Daten, die mit von Ihnen angegebenen Mustern übereinstimmen, untersucht oder de-identifiziert. Es gibt folgende Arten von benutzerdefinierten infoType-Detektoren:

  • Reguläre benutzerdefinierte Wörterbuchdetektoren sind einfache Wort- und Wortgruppenlisten, nach denen der Schutz sensibler Daten auf Übereinstimmungen prüft. Verwenden Sie normale benutzerdefinierte Wörterbuchdetektoren, wenn Ihre Wortzahl nicht mehr als mehrere hunderttausend Wörter beträgt.
  • Große benutzerdefinierte Wörterbuchdetektoren werden vom Schutz vor sensiblen Daten unter Verwendung umfangreicher Listen von Wörtern oder Wortgruppen generiert, die entweder in Cloud Storage oder BigQuery gespeichert sind. Verwenden Sie große benutzerdefinierte Wörterbuchdetektoren, wenn Sie eine umfangreiche Liste von Wörtern oder Wortgruppen haben (bis zu mehreren zehn Millionen).
  • Detektoren regulärer Ausdrücke (Regex-Detektoren) ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen anhand eines regulären Ausdrucksmusters zu erkennen.
  • Ersatzwert-InfoType-Detektoren erkennen die Ausgabe der De-Identifikationstransformation für den Schutz sensibler Daten CryptoReplaceFfxFpeConfig. Dieser benutzerdefinierte infoType-Detektor wird ausschließlich mit der Methode content:reidentify verwendet, um die De-Identifikation mit formatbewahrender Verschlüsselung (Format-Preserving Encryption, FPE) im FFX-Modus rückgängig zu machen. Aus diesem Grund werden Ersatzwerte in diesen Themen nicht ausführlich beschrieben. Weitere Informationen dazu, wie und wann benutzerdefinierte infoType-Ersatzdetektoren verwendet werden, finden Sie unter Pseudonymisierung.

Außerdem gilt in Sensitive Data Protection das Konzept der Prüfregeln, mit denen Sie die Scanergebnisse auf folgende Weise verfeinern können:

  • Mit Ausschlussregeln können Sie falsche oder unerwünschte Ergebnisse ausschließen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.
  • Mit Hotword-Regeln können Sie die Anzahl oder Genauigkeit von zurückgegebenen Ergebnissen erhöhen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.

Weitere Informationen zu benutzerdefinierten infoType-Detektoren finden Sie auf der Seite, auf der das Konzept InfoTypes und infoType-Detektoren erläutert wird. Einige Beispiele, die Sie nach Belieben verwenden oder ändern können, finden Sie unter Beispiele für benutzerdefinierte infoType-Detektoren. Im Rest dieses Themas wird beschrieben, wie Sie mit dem Schutz vor sensiblen Daten Ihre eigenen benutzerdefinierten InfoType-Detektoren erstellen.

Einsatzmöglichkeiten für benutzerdefinierte infoType-Detektoren

Benutzerdefinierte infoType-Detektoren werden im Objekt CustomInfoType definiert. Sie geben im Objekt InspectConfig einen CustomInfoType an, wenn Sie Folgendes konfigurieren:

API-Übersicht

Mit dem Objekt CustomInfoType können Sie einen benutzerdefinierten infoType-Detektor für neuen Inhalt erstellen oder die Ergebnisse vordefinierter infoType-Detektoren optimieren.

Das Objekt CustomInfoType besteht aus den folgenden Feldern, die wie beschrieben festgelegt werden:

  • "infotype": Name des benutzerdefinierten infoType-Detektors in einem InfoType-Objekt
  • "likelihood": Standardwert Likelihood, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Sie können in "detectionRules" alternative Likelihood-Werte angeben, die diese Basis-Likelihood ersetzen, wenn das Ergebnis den Kriterien der Regel entspricht. Wenn Sie das Feld "likelihood" nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt. Weitere Informationen zur Wahrscheinlichkeit finden Sie auf der Konzeptseite Wahrscheinlichkeit.
  • "detectionRules": Eine Reihe von Objekten DetectionRule, die zusätzlich auf alle Ergebnisse dieses benutzerdefinierten infoType-Detektors angewendet werden sollen. Hier geben Sie Hotword-Regeln als Objekt HotwordRule an. Regeln werden in der Reihenfolge angewendet, in der sie angegeben sind. Dieses Feld gilt nicht für SurrogateType-Objekte
  • "sensitivityScore": Der Wert SensitivityScore, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Wenn Sie das Feld "sensitivityScore" nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt.

    Sensibilitätsbewertungen werden in Datenprofilen verwendet. Beim Erstellen von Nutzerprofilen verwendet der Schutz sensibler Daten die Sensibilitätsbewertungen der infoTypes, um das Sensibilitätsniveau zu berechnen.

  • Eines der folgenden Felder, abhängig von der Art des benutzerdefinierten infoType-Detektors, den Sie erstellen:

    • "dictionary": Ein Objekt Dictionary, das eine Liste von Wörtern oder Wortgruppen enthält, nach denen gesucht werden soll
    • "regex": Ein Objekt Regex mit einem einzelnen Muster, das den regulären Ausdruck definiert
    • "surrogateType": Ein Objekt SurrogateType gibt, falls vorhanden, an, dass der benutzerdefinierte infoType-Detektor ein Ersatzwert ist. Weitere Informationen zur Verwendung von benutzerdefinierten infoType-Ersatzdetektoren finden Sie unter Pseudonymisierung.
    • "storedType": Ein Verweis auf ein vorhandenes StoredInfoType-Objekt. Dieses Feld ist erforderlich, wenn Sie einen großen benutzerdefinierten Wörterbuchdetektor erstellen. Sie können zwar Wörterbuch- oder regulären Ausdrucks-Detektoren erstellen, indem Sie dieses Feld definieren, es ist jedoch einfacher, sie über das Feld dictionary bzw. regex zu erstellen.

Nächste Schritte

Weitere Informationen zum Erstellen von benutzerdefinierten infoTypes finden Sie in den folgenden Themen: