Benutzerdefinierte infoType-Detektoren

Der Schutz sensibler Daten enthält viele integrierte infoType-Detektoren, Sie können aber auch Ihre eigenen erstellen. Sie können das Erkennungsverhalten dadurch anpassen, dass Sie Ihre eigenen benutzerdefinierten infoType-Detektoren definieren, sodass der Schutz sensibler Daten sensible Daten, die mit von Ihnen angegebenen Mustern übereinstimmen, prüft oder de-identifiziert. Im Folgenden sind die Typen von benutzerdefinierten infoType-Detektoren aufgeführt:

  • Reguläre benutzerdefinierte Wörterbuchdetektoren sind einfache Wort- und Wortgruppenlisten, nach denen beim Schutz sensibler Daten nach Übereinstimmungen gesucht wird. Verwenden Sie normale benutzerdefinierte Wörterbuchdetektoren, wenn Ihre Wortzahl nicht mehr als mehrere hunderttausend Wörter beträgt.
  • Große benutzerdefinierte Wörterbuchdetektoren werden vom Schutz sensibler Daten mithilfe umfangreicher Listen von Wörtern oder Wortgruppen generiert, die entweder in Cloud Storage oder BigQuery gespeichert sind. Verwenden Sie große benutzerdefinierte Wörterbuchdetektoren, wenn Sie eine umfangreiche Liste von Wörtern oder Wortgruppen haben (bis zu mehreren zehn Millionen).
  • Detektoren für reguläre Ausdrücke (Regex-Detektoren) ermöglichen dem Schutz sensibler Daten, Übereinstimmungen anhand eines regulären Ausdrucksmusters zu erkennen.
  • Ersatz-infoType-Detektoren erkennen Ausgaben der De-Identifikationstransformation CryptoReplaceFfxFpeConfig für den Schutz sensibler Daten. Dieser benutzerdefinierte infoType-Detektor wird nur mit der Methode content:reidentify verwendet, um die De-Identifikation mit formaterhaltender Verschlüsselung (FPE) im FFX-Modus rückgängig zu machen. Aus diesem Grund werden Ersatzwerte in diesen Themen nicht ausführlich beschrieben. Weitere Informationen dazu, wie und wann benutzerdefinierte infoType-Ersatzdetektoren verwendet werden, finden Sie unter Pseudonymisierung.

Darüber hinaus umfasst der Schutz sensibler Daten das Konzept der Prüfregeln, mit denen Sie die Scanergebnisse auf folgende Weise verfeinern können:

  • Mit Ausschlussregeln können Sie falsche oder unerwünschte Ergebnisse ausschließen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.
  • Mit Hotword-Regeln können Sie die Anzahl oder Genauigkeit von zurückgegebenen Ergebnissen erhöhen. Hierzu erweitern Sie einen integrierten oder benutzerdefinierten infoType-Detektor durch Regeln.

Weitere Informationen zu benutzerdefinierten infoType-Detektoren finden Sie auf der Seite, auf der das Konzept InfoTypes und infoType-Detektoren erläutert wird. Einige Beispiele, die Sie nach Belieben verwenden oder ändern können, finden Sie unter Beispiele für benutzerdefinierte infoType-Detektoren. Im weiteren Verlauf dieses Themas wird beschrieben, wie Sie mit dem Schutz sensibler Daten Ihre eigenen benutzerdefinierten infoType-Detektoren erstellen können.

Einsatzmöglichkeiten für benutzerdefinierte infoType-Detektoren

Benutzerdefinierte infoType-Detektoren werden im Objekt CustomInfoType definiert. Sie geben im Objekt InspectConfig einen CustomInfoType an, wenn Sie Folgendes konfigurieren:

API-Übersicht

Mit dem Objekt CustomInfoType können Sie einen benutzerdefinierten infoType-Detektor für neuen Inhalt erstellen oder die Ergebnisse vordefinierter infoType-Detektoren optimieren.

Das Objekt CustomInfoType besteht aus den folgenden Feldern, die wie beschrieben festgelegt werden:

  • "infotype": Name des benutzerdefinierten infoType-Detektors in einem InfoType-Objekt
  • "likelihood": Standardwert Likelihood, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Sie können in "detectionRules" alternative Likelihood-Werte angeben, die diese Basis-Likelihood ersetzen, wenn das Ergebnis den Kriterien der Regel entspricht. Wenn Sie das Feld "likelihood" nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt. Weitere Informationen zur Wahrscheinlichkeit finden Sie auf der Konzeptseite Wahrscheinlichkeit.
  • "detectionRules": Eine Reihe von Objekten DetectionRule, die zusätzlich auf alle Ergebnisse dieses benutzerdefinierten infoType-Detektors angewendet werden sollen. Hier geben Sie Hotword-Regeln als Objekt HotwordRule an. Regeln werden in der Reihenfolge angewendet, in der sie angegeben sind. Dieses Feld gilt nicht für SurrogateType-Objekte
  • "sensitivityScore": Der Wert SensitivityScore, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Wenn Sie das Feld "sensitivityScore" nicht angeben, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt.

    Empfindlichkeitswerte werden in Datenprofilen verwendet. Bei der Profilerstellung für Ihre Daten verwendet der Schutz sensibler Daten die Vertraulichkeitswerte der infoTypes, um die Vertraulichkeitsstufe zu berechnen.

  • Eines der folgenden Felder, abhängig von der Art des benutzerdefinierten infoType-Detektors, den Sie erstellen:

    • "dictionary": Ein Objekt Dictionary, das eine Liste von Wörtern oder Wortgruppen enthält, nach denen gesucht werden soll
    • "regex": Ein Objekt Regex mit einem einzelnen Muster, das den regulären Ausdruck definiert
    • "surrogateType": Ein Objekt SurrogateType gibt, falls vorhanden, an, dass der benutzerdefinierte infoType-Detektor ein Ersatzwert ist. Weitere Informationen zur Verwendung von benutzerdefinierten infoType-Ersatzdetektoren finden Sie unter Pseudonymisierung.
    • "storedType": ein Verweis auf ein vorhandenes StoredInfoType-Objekt. Dieses Feld ist erforderlich, wenn ein großer benutzerdefinierter Wörterbuchdetektor erstellt wird. Obwohl Sie reguläre Wörterbuchdetektoren oder Detektoren für reguläre Ausdrücke erstellen können, indem Sie dieses Feld definieren, ist es einfacher, sie zu erstellen, indem Sie das Feld dictionary bzw. regex definieren.

Nächste Schritte

Weitere Informationen zum Erstellen von benutzerdefinierten infoTypes finden Sie in den folgenden Themen: