Vertex AI-Daten in einer Organisation oder einem Ordner profilieren

Auf dieser Seite wird beschrieben, wie Sie die Vertex AI-Datenermittlung auf Organisations- oder Ordnerebene konfigurieren. Wenn Sie ein Projekt profilieren möchten, lesen Sie den Hilfeartikel Vertex AI-Daten in einem einzelnen Projekt profilieren.

Weitere Informationen zum Discovery-Dienst finden Sie unter Datenprofile.

Hinweise

  1. Prüfen Sie, ob Sie die IAM-Berechtigungen haben, die zum Konfigurieren von Datenprofilen auf Organisationsebene erforderlich sind.

    Auch wenn Sie nicht die Rolle „Organisationsadministrator“ (roles/resourcemanager.organizationAdmin) oder „Sicherheitsadministrator“ (roles/iam.securityAdmin) haben, können Sie eine Scankonfiguration erstellen. Nachdem Sie die Scankonfiguration erstellt haben, muss eine Person mit einer dieser Rollen Ihrem Dienst-Agent Zugriff auf die Datenprofilerstellung gewähren.

  2. Sie benötigen eine Inspektionsvorlage in jeder Region, in der Sie Daten haben, für die ein Profil erstellt werden soll. Wenn Sie eine einzelne Vorlage für mehrere Regionen verwenden möchten, können Sie eine Vorlage verwenden, die in der Region global gespeichert ist. Wenn Sie aufgrund von organisatorischen Richtlinien keine Inspektionsvorlage in der Region global erstellen können, müssen Sie für jede Region eine eigene Inspektionsvorlage festlegen. Weitere Informationen finden Sie unter Überlegungen zum Datenstandort.

    Mit dieser Aufgabe können Sie eine Inspektionsvorlage nur in der Region global erstellen. Wenn Sie spezielle Inspektionsvorlagen für eine oder mehrere Regionen benötigen, müssen Sie diese vor der Ausführung dieser Aufgabe erstellen.

  3. Wenn Sie Pub/Sub-Benachrichtigungen an ein Thema senden möchten, wenn bestimmte Ereignisse auftreten, z. B. wenn der Schutz sensibler Daten ein neues Datenpool-Profil erstellt, erstellen Sie ein Pub/Sub-Thema, bevor Sie diese Aufgabe ausführen.

Zum Generieren von Datenprofilen benötigen Sie einen Dienst-Agent-Container und einen Dienst-Agent. Mit dieser Aufgabe können Sie sie automatisch erstellen.

Scankonfiguration erstellen

  1. Rufen Sie die Seite Scankonfiguration erstellen auf.

    Zur Seite „Scankonfiguration erstellen”

  2. Rufen Sie Ihre Organisation auf. Klicken Sie in der Symbolleiste auf die Projektauswahl und wählen Sie Ihre Organisation aus.

In den folgenden Abschnitten finden Sie weitere Informationen zu den Schritten auf der Seite Scankonfiguration erstellen. Klicken Sie am Ende jedes Abschnitts auf Weiter.

Erkennungstyp auswählen

Wählen Sie Vertex AI aus.

Bereich auswählen

Führen Sie einen der folgenden Schritte aus:

  • Wenn Sie das Profiling auf Organisationsebene konfigurieren möchten, wählen Sie Ganze Organisation scannen aus.
  • Wenn Sie das Profiling auf Ordnerebene konfigurieren möchten, wählen Sie Ausgewählten Ordner scannen aus. Klicken Sie auf Durchsuchen und wählen Sie den Ordner aus.

Pläne verwalten

Wenn die Standardprofilierungshäufigkeit Ihren Anforderungen entspricht, können Sie diesen Abschnitt der Seite Scankonfiguration erstellen überspringen.

Konfigurieren Sie diesen Abschnitt aus folgenden Gründen:

  • Sie können die Häufigkeit der Profilerstellung für alle Ihre Daten oder bestimmte Teilmengen Ihrer Daten feinanpassen.
  • Hier können Sie die Datensätze angeben, für die kein Profil erstellt werden soll.
  • Hier können Sie die Datensätze angeben, die nicht mehrmals profiliert werden sollen.

So nehmen Sie detaillierte Anpassungen an der Profilierungshäufigkeit vor:

  1. Klicken Sie auf Zeitplan hinzufügen.
  2. Im Bereich Filter definieren Sie einen oder mehrere Filter, mit denen Sie angeben, welche Datensätze in den Zeitplan aufgenommen werden sollen.

    Geben Sie eine Projekt-ID oder einen regulären Ausdruck an, der ein oder mehrere Projekte angibt. Reguläre Ausdrücke müssen der RE2-Syntax folgen.

    Wenn Sie beispielsweise alle Datensätze in einem Projekt in den Filter aufnehmen möchten, geben Sie die Projekt-ID in das Feld Projekt-ID ein.

    Wenn Sie weitere Filter hinzufügen möchten, klicken Sie auf Filter hinzufügen und wiederholen Sie diesen Schritt.

  3. Klicken Sie auf Häufigkeit.

  4. Geben Sie im Bereich Häufigkeit an, ob der Discovery-Dienst die von Ihnen ausgewählten Datensätze profilieren soll und, falls ja, wie oft:

    • Wenn die Datasets nie profiliert werden sollen, deaktivieren Sie Diese Daten profilieren.

    • Wenn die Datasets mindestens einmal profiliert werden sollen, lassen Sie Diese Daten profilieren aktiviert.

      In den folgenden Feldern in diesem Abschnitt geben Sie an, ob das System Ihre Daten neu profilieren soll und welche Ereignisse einen Neuprofilierungsvorgang auslösen sollen. Weitere Informationen finden Sie unter Häufigkeit der Generierung von Datenprofilen.

      1. Geben Sie unter Nach Zeitplan an, wie oft die Datensätze neu profiliert werden sollen. Die Datasets werden unabhängig davon neu profiliert, ob sie sich geändert haben.
      2. Geben Sie unter Wenn sich die Prüfungsvorlage ändert an, ob ein neues Profil für Ihre Daten erstellt werden soll, wenn die zugehörige Prüfungsvorlage aktualisiert wird, und falls ja, wie oft.

        Eine Änderung an der Inspektionsvorlage wird erkannt, wenn eines der folgenden Ereignisse eintritt:

        • Der Name einer Inspektionsvorlage wird in Ihrer Scankonfiguration geändert.
        • Die updateTime einer Inspektionsvorlage ändert sich.

      3. Wenn Sie beispielsweise eine Inspektionsvorlage für die Region us-west1 festlegen und diese Inspektionsvorlage aktualisieren, wird nur ein neues Profil für Daten in der Region us-west1 erstellt.

  5. Optional: Klicken Sie auf Bedingungen.

    Im Abschnitt Bedingungen geben Sie alle Bedingungen an, die die in Ihren Filtern definierten Datensätze erfüllen müssen, bevor sie vom Schutz sensibler Daten profiliert werden.

    Legen Sie bei Bedarf Folgendes fest:

    • Mindestbedingung: Wenn die Profilerstellung für ein Dataset bis zu einem bestimmten Alter verzögert werden soll, aktivieren Sie diese Option. Geben Sie dann die Mindestdauer ein.

    • Zeitliche Bedingung: Wenn Sie nicht möchten, dass alte Datensätze jemals profiliert werden, aktivieren Sie diese Option. Wählen Sie dann mit der Datumsauswahl ein Datum und eine Uhrzeit aus. Alle Datensätze, die am oder vor dem ausgewählten Zeitstempel erstellt wurden, werden vom Profiling ausgeschlossen.

    Beispielbedingungen

    Angenommen, Sie haben folgende Konfiguration:

    • Mindestbedingungen

      • Mindestdauer: 24 Stunden
    • Zeitbedingung

      • Zeitstempel: 04.05.22, 23:59 Uhr

    In diesem Fall werden alle Datensätze ausgeschlossen, die bis zum 4. Mai 2022 um 23:59 Uhr erstellt wurden. Unter den Datasets, die nach diesem Datum und dieser Uhrzeit erstellt wurden, werden nur die Datasets mit einem Alter von mindestens 24 Stunden vom Schutz sensibler Daten erfasst.

  6. Klicken Sie auf Fertig.

  7. Wenn Sie weitere Zeitpläne hinzufügen möchten, klicken Sie auf Zeitplan hinzufügen und wiederholen Sie die vorherigen Schritte.

  8. Wenn Sie die Priorität zwischen den Zeitplänen festlegen möchten, ordnen Sie sie mit den Pfeilen nach oben  und nach unten  neu an.

    Die Reihenfolge der Zeitpläne gibt an, wie Konflikte zwischen Zeitplänen gelöst werden. Wenn ein Datensatz den Filtern zweier verschiedener Zeitpläne entspricht, wird die Profilierungshäufigkeit für diesen Datensatz durch den Zeitplan bestimmt, der in der Liste der Zeitpläne weiter oben steht.

    Der letzte Zeitplan in der Liste ist immer der mit der Bezeichnung Standardzeitplan. Dieser Standardzeitplan deckt die Datasets im ausgewählten Umfang ab, die keinem der von Ihnen erstellten Zeitpläne entsprechen. Dieser Standardzeitplan folgt der Standardhäufigkeit der Profilerstellung.

  9. Wenn Sie den Standardzeitplan anpassen möchten, klicken Sie auf  Zeitplan bearbeiten und passen Sie die Einstellungen nach Bedarf an.

Inspektionsvorlage auswählen

Wählen Sie je nachdem, wie Sie eine Inspektionskonfiguration bereitstellen möchten, eine der folgenden Optionen aus. Unabhängig von der ausgewählten Option werden Ihre Daten beim Schutz sensibler Daten in der Region gescannt, in der sie gespeichert sind. Das heißt, Ihre Daten verlassen nicht ihre Region.

Option 1: Inspektionsvorlage erstellen

Wählen Sie diese Option aus, wenn Sie eine neue Inspektionsvorlage in der Region global erstellen möchten.

  1. Klicken Sie auf Neue Inspektionsvorlage erstellen.
  2. Optional: Klicken Sie auf InfoTypes verwalten, um die Standardauswahl der InfoTypes zu ändern.

    Weitere Informationen zum Verwalten integrierter und benutzerdefinierter infoTypes finden Sie unter infoTypes über die Google Cloud Console verwalten.

    Sie müssen mindestens einen „infoType“ ausgewählt haben, um fortzufahren.

  3. Optional: Konfigurieren Sie die Inspektionsvorlage weiter, indem Sie Regelsätze hinzufügen und einen Konfidenzschwellenwert festlegen. Weitere Informationen finden Sie unter Erkennung konfigurieren.

Wenn der Schutz sensibler Daten die Scankonfiguration erstellt, wird diese neue Inspektionsvorlage in der Region global gespeichert.

Option 2: Vorhandene Inspektionsvorlage verwenden

Wählen Sie diese Option aus, wenn Sie vorhandene Inspektionsvorlagen verwenden möchten.

  1. Klicken Sie auf Vorhandene Inspektionsvorlage wählen.
  2. Geben Sie den vollständigen Ressourcennamen der Inspektionsvorlage ein, die Sie verwenden möchten. Das Feld Region wird automatisch mit dem Namen der Region ausgefüllt, in der sich Ihre Inspektionsvorlage befindet.

    Die von Ihnen eingegebene Inspektionsvorlage muss sich in derselben Region wie die Daten befinden, für die ein Profil erstellt werden soll.

    Gemäß dem Grundsatz des Datenstandorts wird bei Sensitive Data Protection keine Inspektionsvorlage außerhalb der Region verwendet, in der sie gespeichert ist.

    So ermitteln Sie den vollständigen Ressourcennamen einer Inspektionsvorlage:

    1. Rufen Sie die Liste der Inspektionsvorlagen auf. Diese Seite wird in einem separaten Tab geöffnet.

      Inspektionsvorlagen aufrufen

    2. Wechseln Sie zu dem Projekt, das die zu verwendende Inspektionsvorlage enthält.
    3. Klicken Sie auf dem Tab Vorlagen auf die Vorlagen-ID der Vorlage, die Sie verwenden möchten.
    4. Kopieren Sie auf der daraufhin angezeigten Seite den vollständigen Ressourcennamen der Vorlage. Der vollständige Ressourcenname hat folgendes Format:
      projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
    5. Fügen Sie auf der Seite Scankonfiguration erstellen im Feld Vorlagenname den vollständigen Ressourcennamen der Vorlage ein.
  3. Wenn Sie eine Inspektionsvorlage für eine andere Region hinzufügen möchten, klicken Sie auf Inspektionsvorlage hinzufügen und geben Sie den vollständigen Ressourcennamen der Vorlage ein. Wiederholen Sie diesen Vorgang für jede Region, für die Sie eine spezielle Inspektionsvorlage haben.
  4. Optional: Fügen Sie eine Inspektionsvorlage hinzu, die in der Region global gespeichert ist. Diese Vorlage wird vom Schutz sensibler Daten automatisch für Daten in Regionen verwendet, in denen Sie keine spezielle Inspektionsvorlage haben.

Aktionen hinzufügen

In den folgenden Abschnitten geben Sie Aktionen an, die der Schutz sensibler Daten ausführen soll, nachdem die Datenprofile generiert wurden.

Informationen dazu, wie andere Google Cloud Dienste die Konfiguration von Aktionen in Rechnung stellen, finden Sie unter Preise für den Export von Datenprofilen.

In Google Security Operations veröffentlichen

Messwerte aus Datenprofilen können den Ergebnissen von Google Security Operations Kontext verleihen. Anhand des zusätzlichen Kontexts können Sie die wichtigsten Sicherheitsprobleme ermitteln, die angegangen werden müssen.

Wenn Sie beispielsweise einen bestimmten Kundenservicemitarbeiter untersuchen, kann Google Security Operations ermitteln, auf welche Ressourcen der Kundenservicemitarbeiter zugegriffen hat und ob es sich bei einer dieser Ressourcen um hochsensible Daten handelt.

Wenn Sie Ihre Datenprofile an Ihre Google Security Operations-Instanz senden möchten, aktivieren Sie Google Security Operations.

Wenn für Ihre Organisation keine Google Security Operations-Instanz über das eigenständige Produkt oder über das Security Command Center Enterprise aktiviert ist, hat die Aktivierung dieser Option keine Auswirkungen.

In Security Command Center veröffentlichen

Die Ergebnisse aus Datenprofilen liefern Kontext, wenn Sie Sicherheitslücken und Bedrohungen im Security Command Center priorisieren und Reaktionspläne entwickeln.

Bevor Sie diese Aktion verwenden können, muss Security Command Center auf Organisationsebene aktiviert sein. Wenn Sie Security Command Center auf Organisationsebene aktivieren, können Ergebnisse aus integrierten Diensten wie dem Schutz sensibler Daten abgerufen werden. Der Schutz sensibler Daten funktioniert mit allen Dienststufen von Security Command Center.

Wenn Security Command Center nicht auf Organisationsebene aktiviert ist, werden keine Ergebnisse zum Schutz sensibler Daten im Security Command Center angezeigt. Weitere Informationen finden Sie unter Aktivierungsstufe von Security Command Center prüfen.

Damit die Ergebnisse Ihrer Datenprofile an Security Command Center gesendet werden, muss die Option In Security Command Center veröffentlichen aktiviert sein.

Weitere Informationen finden Sie unter Datenprofile im Security Command Center veröffentlichen.

Datenprofilkopien in BigQuery speichern

Der Schutz sensibler Daten speichert eine Kopie jedes generierten Datenprofils in einer BigQuery-Tabelle. Wenn Sie die Details der gewünschten Tabelle nicht angeben, erstellt der Schutz sensibler Daten ein Dataset und eine Tabelle im Service-Agent-Container. Standardmäßig heißt das Dataset sensitive_data_protection_discovery und die Tabelle discovery_profiles.

Mit dieser Aktion können Sie einen Verlauf aller generierten Profile speichern. Dieser Verlauf kann nützlich sein, um Prüfberichte zu erstellen und Datenprofile zu visualisieren. Sie können diese Informationen auch in andere Systeme laden.

Außerdem können Sie mit dieser Option alle Ihre Datenprofile in einer einzigen Ansicht ansehen, unabhängig davon, in welcher Region sich Ihre Daten befinden. Sie können sich die Datenprofile auch über die Google Cloud Console ansehen. In der Console werden die Profile jedoch jeweils nur für eine Region angezeigt.

Sobald Sie diese Option aktivieren, beginnt Sensitive Data Protection mit dem Exportieren von Profilen. Profile, die generiert wurden, bevor Sie den Export aktiviert haben, werden nicht in BigQuery gespeichert.

In Pub/Sub veröffentlichen

Wenn Sie In Pub/Sub veröffentlichen aktivieren, können Sie programmatische Aktionen auf der Grundlage von Profilierungsergebnissen ausführen. Mit Pub/Sub-Benachrichtigungen können Sie einen Workflow entwickeln, um Ergebnisse mit erheblichen Datenrisiken oder sensiblen Daten zu erkennen und zu beheben.

So senden Sie Benachrichtigungen an ein Pub/Sub-Thema:

  1. Aktivieren Sie In Pub/Sub veröffentlichen.

    Eine Liste mit Optionen wird angezeigt. Jede Option beschreibt ein Ereignis, bei dem der Schutz sensibler Daten eine Benachrichtigung an Pub/Sub sendet.

  2. Wählen Sie die Ereignisse aus, die eine Pub/Sub-Benachrichtigung auslösen sollen.

    Wenn Sie Bei jeder Aktualisierung eines Profils eine Pub/Sub-Benachrichtigung senden auswählen, sendet der Dienst „Sensible Daten schützen“ eine Benachrichtigung, wenn sich die Empfindlichkeitsstufe, die Datenrisikostufe, die erkannten infoTypes, der öffentliche Zugriff und andere wichtige Messwerte im Profil ändern.

  3. Gehen Sie für jedes ausgewählte Ereignis so vor:

    1. Geben Sie den Namen des Themas ein. Der Name muss folgendes Format haben:

      projects/PROJECT_ID/topics/TOPIC_ID
      

      Ersetzen Sie Folgendes:

      • PROJECT_ID: die ID des Projekts, das mit dem Pub/Sub-Thema verknüpft ist.
      • TOPIC_ID: die ID des Pub/Sub-Themas.
    2. Geben Sie an, ob das vollständige Dataset-Profil oder nur der vollständige Ressourcenname des Datasets, für das ein Profil erstellt wurde, in der Benachrichtigung enthalten sein soll.

    3. Legen Sie die Mindestwerte für Datenrisiko und Vertraulichkeit fest, die erfüllt sein müssen, damit Sensitive Data Protection eine Benachrichtigung sendet.

    4. Geben Sie an, ob nur eine oder beide Bedingungen für Datenrisiken und Datensensibilität erfüllt sein müssen. Wenn Sie beispielsweise AND auswählen, müssen sowohl die Bedingungen für das Datenrisiko als auch die Bedingungen für die Datensensibilität erfüllt sein, bevor Sensitive Data Protection eine Benachrichtigung sendet.

Dienst-Agent-Container und Abrechnung verwalten

In diesem Abschnitt geben Sie das Projekt an, das als Dienst-Agent-Container verwendet werden soll. Sie können entweder den Schutz sensibler Daten automatisch ein neues Projekt erstellen lassen oder ein vorhandenes auswählen.

Unabhängig davon, ob Sie einen neu erstellten Dienst-Agenten verwenden oder einen vorhandenen wiederverwenden, muss er Lesezugriff auf die zu profilierenden Daten haben.

Projekt automatisch erstellen

Wenn Sie nicht die erforderlichen Berechtigungen zum Erstellen eines Projekts in der Organisation haben, müssen Sie stattdessen ein vorhandenes Projekt auswählen oder die erforderlichen Berechtigungen erhalten. Informationen zu den erforderlichen Berechtigungen finden Sie unter Rollen, die für die Arbeit mit Datenprofilen auf Organisations- oder Ordnerebene erforderlich sind.

So erstellen Sie automatisch ein Projekt, das als Dienst-Agent-Container verwendet werden soll:

  1. Prüfen Sie im Feld Service-Agent-Container die vorgeschlagene Projekt-ID und bearbeiten Sie sie bei Bedarf.
  2. Klicken Sie auf Erstellen.
  3. Optional: Aktualisieren Sie den Standardprojektnamen.
  4. Wählen Sie das Konto aus, das für alle abrechenbaren Vorgänge in Rechnung gestellt werden soll, die sich auf dieses neue Projekt beziehen, einschließlich Vorgängen, die nicht mit der Datenerhebung zusammenhängen.

  5. Klicken Sie auf Erstellen.

Sensitive Data Protection erstellt das neue Projekt. Der Dienst-Agent in diesem Projekt wird verwendet, um sich beim Sensitive Data Protection und bei anderen APIs zu authentifizieren.

Vorhandenes Projekt auswählen

Wenn Sie ein vorhandenes Projekt als Dienst-Agent-Container auswählen möchten, klicken Sie auf das Feld Dienst-Agent-Container und wählen Sie das Projekt aus.

Fallback-Verarbeitungsstandorte für Bilder festlegen

Im Allgemeinen werden Ihre Daten beim Schutz vertraulicher Daten an dem Ort verarbeitet, an dem sie gespeichert sind. Bilder können jedoch nur in einer Mehrfachregion oder in der Region global verarbeitet werden. Wenn Sie einen Fallback-Speicherort festlegen, werden mit dem Sensitive Data Protection-Tool Bilder, die sich nicht in einer Multi-Region oder in der Region global befinden, an diesem Fallback-Speicherort verarbeitet. Wenn Sie diesen Abschnitt überspringen, werden diese Bilder nicht verarbeitet.

Wenn Sie Fallback-Standorte für die Bildverarbeitung festlegen möchten, wählen Sie eine oder beide der folgenden Optionen aus:

  • Zurückgreifen auf die Multiregion: Wenn ein Image nicht an seinem ursprünglichen Speicherort verarbeitet werden kann, wird es in der Multiregion verarbeitet, die dem ursprünglichen Speicherort des Images entspricht. Wenn der ursprüngliche Speicherort des Bilds keine entsprechende Multiregion hat, wird das Bild übersprungen.
  • Zu globaler Verarbeitung wechseln: Wenn ein Bild an seinem ursprünglichen Speicherort nicht verarbeitet werden kann, wird es in der Region global verarbeitet.

Wenn Sie beide Optionen auswählen, wird von Sensitive Data Protection entschieden, welcher Speicherort als Fallback-Speicherort verwendet werden soll.

Speicherort für Konfiguration festlegen

Klicken Sie auf die Liste Ressourcenspeicherort und wählen Sie die Region aus, in der Sie diese Scankonfiguration speichern möchten. Alle Scankonfigurationen, die Sie später erstellen, werden ebenfalls an diesem Speicherort gespeichert.

Der Speicherort, an dem Sie die Scankonfiguration speichern, hat keinen Einfluss auf die zu scannenden Daten. Ihre Daten werden in derselben Region gescannt, in der sie gespeichert sind. Weitere Informationen finden Sie unter Überlegungen zum Datenstandort.

Überprüfen und erstellen

  1. Wenn Sie verhindern möchten, dass das Profiling automatisch nach dem Erstellen der Scankonfiguration gestartet wird, wählen Sie Scan im pausierten Modus erstellen aus.

    Diese Option ist in den folgenden Fällen nützlich:

    • Ihr Google Cloud Administrator muss dem Dienst-Agent noch Zugriff auf die Datenprofilerstellung gewähren.
    • Sie möchten mehrere Scankonfigurationen erstellen und manche andere überschreiben lassen.
    • Sie haben sich entschieden, Datenprofile in BigQuery zu speichern, und möchten dafür sorgen, dass der Kundenservicemitarbeiter Schreibzugriff auf Ihre Ausgabetabelle hat.
    • Sie haben Pub/Sub-Benachrichtigungen konfiguriert und möchten dem Kundenservicemitarbeiter Veröffentlichungszugriff gewähren.
  2. Prüfen Sie Ihre Einstellungen und klicken Sie auf Erstellen.

    Sensitive Data Protection erstellt die Scankonfiguration und fügt sie der Liste der Konfigurationen für die Erkennung hinzu.

Informationen zum Aufrufen oder Verwalten Ihrer Scankonfigurationen finden Sie unter Scankonfigurationen verwalten.

Nächste Schritte