Auffinden sensibler Daten für Vertex AI

Auf dieser Seite wird die Erkennung sensibler Daten für die Verwendung mit Vertex AI beschrieben.

Mit der Funktion „Sensitive Data Protection Discovery“ können Sie mehr über die Trainingsdaten erfahren, die in Ihren Vertex AI-Datasets enthalten sind. Bei der Datenerhebung werden Datenprofile generiert, die Statistiken wie die erkannten Informationstypen (infoTypes) und die Empfindlichkeitsstufe Ihrer Trainingsdaten enthalten.

Wenn Sie an der Vorabversion teilnehmen möchten, senden Sie eine E-Mail an cloud-dlp-feedback@google.com.

Vorteile

Diese Funktion bietet folgende Vorteile:

  • Sie können Ihre Vertex AI-Datasets auf Organisations-, Ordner- oder Projektebene auf sensible Daten prüfen und Berichte zu den Ergebnissen erstellen.
  • Sie können Ergebnisse der Suche an Security Command Center senden, damit Ihre Arbeitslasten mit potenziell sensiblen Daten bei der Bewertung der Sicherheitslage Ihrer Organisation berücksichtigt werden.
  • Wenn bei der Suche vertrauliche Trainingsdaten gefunden werden, können Sie anhand der Datenprofile ermitteln, welche Ressourcen genauer untersucht werden müssen. Sie können eine eingehende Prüfung durchführen und alle sensiblen Instanzen in einer Ressource finden.

Unterstützte Datenquelle

Mit dieser Funktion können die folgenden Arten von Trainingsdaten profiliert werden, auf die in Ihren Vertex AI-Datasets verwiesen wird:

  • Trainingsdaten in Cloud Storage-Buckets Informationen zu den unterstützten Dateitypen finden Sie unter Dateicluster.
  • Trainingsdaten in BigQuery-Tabellen

Funktionsweise

Wenn Sie ein Vertex AI-Dataset profilieren, generiert der Dienst „Schutz sensibler Daten“ je nachdem, wo die Trainingsdaten gespeichert sind, ein Datenprofil für Dateispeicher oder ein Datenprofil für Tabellen: in einem Cloud Storage-Bucket oder in einer BigQuery-Tabelle. Ein Datenprofil enthält Statistiken und Metadaten zu den Trainingsdaten, die mit Ihrem Dataset verknüpft sind. Das generierte Datenprofil enthält für jedes Vertex AI-Dataset die folgenden Informationen.

  • Die Vertraulichkeits- und Datenrisikostufen der Trainingsdaten
  • Die Arten vertraulicher Informationen, die in den Trainingsdaten gefunden wurden, z. B. Führerscheinnummern und E-Mail-Adressen

Eine vollständige Liste der Statistiken und Metadaten in jedem Datenprofil für Dateispeicher finden Sie unter Datenprofile für Dateispeicher.

Eine vollständige Liste der Statistiken und Metadaten in jedem Tabellendatenprofil finden Sie unter Datenprofile für Tabellen.

Weitere Informationen zum Discovery-Dienst finden Sie unter Datenprofile.

Preise

Wenn Sie Vertex AI-Daten profilieren, fallen gemäß dem von Ihnen ausgewählten Preismodell für die Erkennung Gebühren für den Schutz sensibler Daten an.

Wenn sich Ihre Trainingsdaten in einem Cloud Storage-Bucket befinden, werden Ihnen außerdem die Kosten für Anfragen in Rechnung gestellt, die vom Sensitive Data Protection-Dienst zum Erstellen von Profilen für die Trainingsdaten gestellt werden. In den folgenden Abschnitten werden die zugehörigen Cloud Storage-Gebühren beschrieben, die Ihnen in Rechnung gestellt werden.

Vorgänge der Klasse B

Ihnen werden die Vorgänge der Klasse B (storage.buckets.get) in Rechnung gestellt, die der Schutz sensibler Daten beim Profilieren von Trainingsdaten in Ihren Cloud Storage-Buckets ausführt.

Informationen zu den Kosten für Cloud Storage-Vorgänge der Klasse B finden Sie in der Cloud Storage-Dokumentation unter Kosten für Vorgänge.

Abrufgebühren

Für Objekte mit einer anderen Speicherklasse als der Standardspeicherklasse werden Abrufgebühren berechnet. Informationen zu den Kosten für das Abrufen von Daten mit Cloud Storage finden Sie in der Cloud Storage-Dokumentation unter Abrufgebühren.

Nächste Schritte