Diese Reihe von Dokumenten enthält Strategien zur Bewertung und Minimierung von Datenrisiken in Ihrer Organisation. Außerdem werden zwei Dienste zum Schutz sensibler Daten beschrieben und verglichen, mit denen Sie mehr über Ihren aktuellen Datensicherheitsstatus erfahren.
Ziele des Risikomanagements für Daten
Das Risikomanagement für Daten umfasst das Speichern, Verarbeiten und Verwenden Ihrer Daten innerhalb der für Ihr Unternehmen geeigneten Risikoniveaus. Wenn Sie das Risikomanagement für Daten durchführen, sollten Sie die folgenden Ziele verfolgen:
- Ihre Daten werden korrekt erkannt und klassifiziert.
- Das Risiko einer Datenpanne wird richtig verstanden.
- Daten werden durch geeignete Kontrollmechanismen geschützt oder durch Verschleierung das Risiko minimiert.
Wenn Sie Ihre Datenarbeitslasten bewerten, können Sie sich zuerst die folgenden Fragen stellen:
- Welche Art von Daten werden bei dieser Arbeitslast verarbeitet und sind einige davon vertraulich?
- Sind diese Daten korrekt präsentiert? Ist der Zugriff auf die Daten beispielsweise auf die richtigen Nutzer, die richtige Umgebung und einen genehmigten Zweck beschränkt?
- Kann das Risiko dieser Daten durch Strategien zur Datenminimierung und Verschleierung reduziert werden?
Wenn Sie einen fundierten und risikobasierten Ansatz verfolgen, können Sie Ihre Daten optimal nutzen, ohne die Privatsphäre Ihrer Nutzer zu gefährden.
Beispielanalyse
Angenommen, Ihr Datenteam versucht, ein Modell für maschinelles Lernen auf der Grundlage von Kundenfeedback in Produktrezensionen zu erstellen.
Welche Art von Daten werden mit dieser Arbeitslast verarbeitet und sind einige davon sensibel?
Sie haben festgestellt, dass in der Datenlast die E-Mail-Adresse des Kunden als Primärschlüssel verwendet wird. E-Mail-Adressen von Kunden enthalten oft die Namen der Kunden. Außerdem enthalten die eigentlichen Produktrezensionen unstrukturierte Daten (oder Freiformdaten), die vom Kunden eingereicht wurden. Unstrukturierte Daten können gelegentlich sensible Daten wie Telefonnummern und Adressen enthalten.
Sind diese Daten korrekt präsentiert?
Sie stellen fest, dass nur das Produktteam auf die Daten zugreifen kann. Sie möchten die Daten jedoch für Ihr Data-Analytics-Team freigeben, damit es damit ein Modell für maschinelles Lernen erstellen kann. Wenn mehr Personen auf die Daten zugreifen können, bedeutet das auch, dass sie in mehr Entwicklungsumgebungen gespeichert und verarbeitet werden. Sie haben festgestellt, dass das Risiko der Exposition steigt.
Kann das Risiko dieser Daten durch Strategien zur Datenminimierung und Verschleierung reduziert werden?
Sie wissen, dass das Analyseteam keine der vertraulichen personenidentifizierbaren Informationen im Datensatz benötigt. Allerdings müssen die Daten pro Kunde zusammengefasst werden. Sie benötigen eine Möglichkeit, zu ermitteln, welche Rezensionen zu demselben Kunden gehören. Um diese Anforderung zu erfüllen, beschließen Sie, alle strukturierten personenidentifizierbaren Informationen (die E-Mail-Adressen der Kunden) zu tokenisieren, um die referenzielle Integrität Ihrer Daten beizubehalten. Sie beschließen außerdem, die unstrukturierten Daten (Rezensionen) zu prüfen und alle gelegentlich enthaltenen sensiblen Daten zu maskieren.
Nächste Schritte
- Dienste zum Schutz sensibler Daten vergleichen, mit denen Sie mehr über Ihre Daten erfahren (nächstes Dokument in dieser Reihe)