δ-Präsenz für ein Dataset berechnen

Die Delta-Präsenz (δ-Präsenz) ist ein Messwert zur Quantifizierung der Wahrscheinlichkeit, dass eine Person zu einem analysierten Dataset gehört. Wie mit k-Map können Sie auch Estimated-Präsenzwerte mit dem Schutz sensibler Daten schätzen. Dabei wird ein statistisches Modell zur Schätzung des Angriffs-Datasets verwendet.

Die δ-Präsenz unterscheidet sich von den anderen Methoden der Risikoanalyse, bei denen das Dataset mit Angriffspotenzial explizit bekannt ist. Je nach Art der Daten verwendet der Schutz sensibler Daten öffentlich verfügbare Datasets (z. B. aus der Volkszählung in den USA) oder ein benutzerdefiniertes statistisches Modell (z. B. eine oder mehrere von Ihnen angegebene BigQuery-Tabellen) oder leitet aus der Werteverteilung in Ihrem Eingabe-Dataset ab.

In diesem Thema wird gezeigt, wie estimated-Präsenzwerte für ein Dataset mit dem Schutz sensibler Daten berechnet werden. Weitere Informationenδ – Allgemeine Präsenz- und Risikoanalyse im Allgemeinen, Thema der Risikoanalyse bevor Sie fortfahren.

Hinweise

Bevor Sie fortfahren, führen Sie Folgendes aus:

  1. Melden Sie sich bei Ihrem Google-Konto an.
  2. Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
  3. Projektauswahl aufrufen
  4. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein. Weitere Informationen zur Abrechnung Ihres Projekts.
  5. Aktivieren Sie den Schutz sensibler Daten.
  6. Schutz sensibler Daten aktivieren

  7. Wählen Sie das zu analysierende BigQuery-Dataset aus. Der Schutz sensibler Daten schätzt den Estimated-Präsenzmesswert durch Scannen einer BigQuery-Tabelle.
  8. Bestimmen Sie die Dataset-Typen, die Sie zur Modellierung des Angriffs-Datasets verwenden möchten. Weitere Informationen finden Sie auf der Referenzseite für das Objekt DeltaPresenceEstimationConfig sowie in den Begriffen und Techniken der Risikoanalyse.

δ-Präsenzmesswerte berechnen

Senden Sie zum Berechnen einer estimated-Präsenzschätzung unter Verwendung des Schutzes sensibler Daten eine Anfrage an die folgende URL, wobei PROJECT_ID Ihre Projekt-ID angibt:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

Die Anfrage enthält ein RiskAnalysisJobConfig-Objekt, das Folgendes umfasst:

  • Ein PrivacyMetric-Objekt. Hier geben Sie an, dass Sie die δ-Präsenz berechnen möchten. Geben Sie dazu ein DeltaPresenceEstimationConfig-Objekt an, das Folgendes enthält:

    • quasiIds[]: erforderlich. Felder (QuasiId-Objekte), die als Quasi-Identifikatoren betrachtet werden, die durchsucht und zur Berechnung der δ-Präsenz verwendet werden. Zwei Spalten dürfen nicht dasselbe Tag haben. Dies gilt für jedes der folgenden Tags:

      • infoType: Dies bewirkt, dass der Schutz sensibler Daten das relevante öffentliche Dataset als statistisches Bevölkerungsmodell verwendet, einschließlich US-Postleitzahlen, Regionscodes, Altersgruppen und Geschlecht.
      • Benutzerdefinierter infoType: benutzerdefiniertes Tag zur Angabe einer Hilfstabelle (eines AuxiliaryTable-Objekts), die statistische Informationen zu den möglichen Werten dieser Spalte enthält.
      • Tag inferred: Wenn kein semantisches Tag angegeben ist, geben Sie inferred an. Der Schutz sensibler Daten leitet das statistische Modell von der Werteverteilung in den Eingabedaten ab.
    • regionCode: Ein Regionscode gemäß ISO 3166-1 Alpha-2 für den Schutz sensibler Daten zur Verwendung bei der statistischen Modellierung. Dieser Wert ist erforderlich, wenn keine Spalte mit einem regionsspezifischen infoType (z. B. einer US-Postleitzahl) oder einem Regionscode gekennzeichnet ist.

    • auxiliaryTables[]: Hilfstabellen (StatisticalTable-Objekte), die in der Analyse verwendet werden sollen. Jedes benutzerdefinierte Tag, mit dem eine Spalte von Quasi-Identifikatoren gekennzeichnet wird (aus quasiIds[]), darf jeweils nur in einer Zeile der Hilfstabelle enthalten sein.

  • Ein BigQueryTable-Objekt. Geben Sie die zu untersuchende BigQuery-Tabelle an. Dazu beziehen Sie die folgenden Parameter ein:

    • projectId: die Projekt-ID des Projekts, das die Tabelle enthält
    • datasetId: die Dataset-ID der Tabelle
    • tableId: der Name der Tabelle
  • Ein oder mehrere Action-Objekte für Aktionen, die nach Abschluss des Jobs in der angegebenen Reihenfolge ausgeführt werden sollen. Jedes Action-Objekt kann eine der folgenden Aktionen enthalten:

δ-Präsenz-Jobergebnisse ansehen

Senden Sie die folgende GET-Anfrage an die projects.dlpJobs-Ressource, um die Ergebnisse des δ-Präsenz-Risikoanalysejobs mit der REST API abzurufen. Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID und JOB_ID durch die ID des Jobs, für den Sie Ergebnisse erhalten möchten. Die Job-ID wurde beim Start des Jobs zurückgegeben und kann auch durch Auflisten aller Jobs abgerufen werden.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

Die Anfrage gibt ein JSON-Objekt zurück, das eine Instanz des Jobs enthält. Die Ergebnisse der Analyse befinden sich im Schlüssel "riskDetails" in einem AnalyzeDataSourceRiskDetails-Objekt. Weitere Informationen finden Sie in der API-Referenz zur Ressource DlpJob.

Nächste Schritte