δ-Präsenz für ein Dataset berechnen

Die Delta-Präsenz (δ-Präsenz) ist ein Messwert zur Quantifizierung der Wahrscheinlichkeit, dass eine Person zu einem analysierten Dataset gehört. Wie bei k-Map können Sie δ-Präsenzwerte mithilfe des Schutzes sensibler Daten schätzen. Dabei wird ein statistisches Modell zur Schätzung des Datasets mit Angriffspotenzial verwendet.

Die δ-Präsenz unterscheidet sich von den anderen Methoden der Risikoanalyse, bei denen das Dataset mit Angriffspotenzial explizit bekannt ist. Je nach Datentyp verwendet der Schutz sensibler Daten öffentlich verfügbare Datasets (z. B. aus der US-Volkszählung) oder ein benutzerdefiniertes statistisches Modell (z. B. eine oder mehrere von Ihnen angegebene BigQuery-Tabellen) oder leitet die Daten aus der Werteverteilung in Ihrem Eingabedataset ab.

In diesem Thema wird gezeigt, wie δ-Präsenzwerte für ein Dataset mithilfe des Schutzes sensibler Daten berechnet werden. Weitere Informationenδ – Allgemeine Präsenz- und Risikoanalyse im Allgemeinen, Thema der Risikoanalyse bevor Sie fortfahren.

Hinweise

Führen Sie folgende Schritte aus, bevor Sie fortfahren:

  1. Melden Sie sich bei Ihrem Google-Konto an.
  2. Wählen Sie in der Google Cloud Console auf der Seite zur Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
  3. Projektauswahl aufrufen
  4. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein. Weitere Informationen zur Abrechnung Ihres Projekts.
  5. Aktivieren Sie den Schutz sensibler Daten.
  6. Schutz sensibler Daten aktivieren

  7. Wählen Sie das zu analysierende BigQuery-Dataset aus. Der Schutz sensibler Daten schätzt den Messwert δ-Präsenz, indem eine BigQuery-Tabelle gescannt wird.
  8. Bestimmen Sie die Dataset-Typen, die Sie zur Modellierung des Angriffs-Datasets verwenden möchten. Weitere Informationen finden Sie auf der Referenzseite für das Objekt DeltaPresenceEstimationConfig sowie in den Begriffen und Techniken der Risikoanalyse.

δ-Präsenzmesswerte berechnen

Zum Berechnen einer δ-Präsenzschätzung mit dem Schutz sensibler Daten senden Sie eine Anfrage an die folgende URL, wobei PROJECT_ID Ihre Projekt-ID angibt:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

Die Anfrage enthält ein RiskAnalysisJobConfig-Objekt, das Folgendes umfasst:

  • Ein PrivacyMetric-Objekt. Hier geben Sie an, dass Sie die δ-Präsenz berechnen möchten. Geben Sie dazu ein DeltaPresenceEstimationConfig-Objekt an, das Folgendes enthält:

    • quasiIds[]: erforderlich. Felder (QuasiId-Objekte), die als Quasi-Identifikatoren betrachtet werden, die durchsucht und zur Berechnung der δ-Präsenz verwendet werden. Zwei Spalten dürfen nicht dasselbe Tag haben. Dies gilt für jedes der folgenden Tags:

      • infoType: Dies bewirkt, dass der Schutz sensibler Daten das relevante öffentliche Dataset als statistisches Bevölkerungsmodell verwendet, einschließlich US-Postleitzahlen, Regionscodes, Altersgruppen und Geschlecht.
      • Benutzerdefinierter infoType: benutzerdefiniertes Tag zur Angabe einer Hilfstabelle (eines AuxiliaryTable-Objekts), die statistische Informationen zu den möglichen Werten dieser Spalte enthält.
      • Tag inferred: Wenn kein semantisches Tag angegeben ist, geben Sie inferred an. Sensitive Data Protection leitet das statistische Modell von der Werteverteilung in den Eingabedaten ab.
    • regionCode: Ein Regionscode gemäß ISO 3166-1 Alpha-2, den der Sensitive Data Protection für die statistische Modellierung verwendet. Dieser Wert ist erforderlich, wenn keine Spalte mit einem regionsspezifischen infoType (z. B. einer US-Postleitzahl) oder einem Regionscode gekennzeichnet ist.

    • auxiliaryTables[]: Hilfstabellen (StatisticalTable-Objekte), die in der Analyse verwendet werden sollen. Jedes benutzerdefinierte Tag, mit dem eine Spalte von Quasi-Identifikatoren gekennzeichnet wird (aus quasiIds[]), darf jeweils nur in einer Zeile der Hilfstabelle enthalten sein.

  • Ein BigQueryTable-Objekt. Geben Sie die zu untersuchende BigQuery-Tabelle an. Dazu beziehen Sie die folgenden Parameter ein:

    • projectId: die Projekt-ID des Projekts, das die Tabelle enthält
    • datasetId: die Dataset-ID der Tabelle
    • tableId: der Name der Tabelle
  • Ein oder mehrere Action-Objekte für Aktionen, die nach Abschluss des Jobs in der angegebenen Reihenfolge ausgeführt werden sollen. Jedes Action-Objekt kann eine der folgenden Aktionen enthalten:

δ-Präsenz-Jobergebnisse ansehen

Senden Sie die folgende GET-Anfrage an die projects.dlpJobs-Ressource, um die Ergebnisse des δ-Präsenz-Risikoanalysejobs mit der REST API abzurufen. Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID und JOB_ID durch die ID des Jobs, für den Sie Ergebnisse erhalten möchten. Die Job-ID wurde beim Start des Jobs zurückgegeben und kann auch durch Auflisten aller Jobs abgerufen werden.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

Die Anfrage gibt ein JSON-Objekt zurück, das eine Instanz des Jobs enthält. Die Ergebnisse der Analyse befinden sich im Schlüssel "riskDetails" in einem AnalyzeDataSourceRiskDetails-Objekt. Weitere Informationen finden Sie in der API-Referenz zur Ressource DlpJob.

Nächste Schritte