Sensitive Data Protection verfügt über viele leistungsstarke Funktionen. Allerdings können die Kosten, je nachdem, wie viele Informationen Sensitive Data Protection scannen soll, aus dem Ruder laufen. In diesem Thema werden verschiedene Methoden beschrieben, mit denen Sie die Kosten niedrig halten und gleichzeitig gewährleisten können, dass mit Sensitive Data Protection genau die Daten gescannt werden, die Sie scannen lassen möchten.
Prüfung
Google empfiehlt die folgenden Praktiken, um die Kosten für die Überprüfung zu kontrollieren.
Mit Stichproben die Anzahl der überprüften Byte einschränken
Im Fall von BigQuery-Tabellen oder Cloud Storage-Buckets kann der Schutz sensibler Daten einen kleinen Teil der Datenmenge scannen. Dies kann eine Stichprobe von Scanergebnissen liefern, ohne die potenziellen Kosten für das Scannen eines gesamten Datasets zu verursachen.
Wenn Sie vertrauliche Daten gefunden haben, können Sie einen zweiten, gründlicheren Scan dieses Datasets planen, um die gesamte Liste der Ergebnisse zu ermitteln.
Weitere Informationen finden Sie unter Menge des zu prüfenden Inhalts begrenzen in Speicher und Datenbanken auf sensible Daten untersuchen.
Nur geänderte Daten scannen
Sie können den Schutz sensibler Daten anweisen, Daten, die seit der letzten Überprüfung nicht geändert wurden, nicht zu scannen. Mit dem Festlegen einer Zeitspanne können Sie anhand des Zeitpunkts der letzten Änderung steuern, welche Daten gescannt werden sollen.
Wenn Sie Jobtrigger verwenden, können Sie in TimespanConfig
das Flag enable_auto_population_of_timespan_config
festlegen, um Inhalte zu überspringen, die beim letzten geplanten Job gescannt wurden.
Weitere Informationen finden Sie unter Scans ausschließlich auf neuen Inhalt beschränken in Inspektionsjobs für den Schutz sensibler Daten erstellen und planen.
Dateiscans in Cloud Storage auf ausschließlich relevante Dateien beschränken
Durch Angabe von CloudStorageRegexFileSet
können Sie über reguläre Ausdrucksfilter genauer steuern, welche Dateien oder Ordner in Buckets einbezogen oder ausgeschlossen werden sollen.
Dies ist dann nützlich, wenn Sie das Scannen von Dateien überspringen möchten, von denen Sie wissen, dass sie keine vertraulichen Daten enthalten, z. B. Sicherungen, TMP-Dateien, statische Webinhalte usw.
Discovery
Mit den folgenden Best Practices können Sie die Kosten für das Datenprofiling im Blick behalten.
Schätzung ausführen
Bevor Sie mit dem Erstellen eines Datenprofils beginnen, sollten Sie zuerst eine Schätzung durchführen. Anhand einer Schätzung können Sie die Größe und Form der zu profilierenden BigQuery-Daten ermitteln. Jede Schätzung enthält die ungefähre Tabellenanzahl, die Datengröße und die Profilierungskosten. Außerdem wird eine Prognose des monatlichen Wachstums Ihrer BigQuery-Daten angezeigt.
Weitere Informationen zum Ausführen einer Schätzung finden Sie hier:
- Kosten für die Datenprofilerstellung für eine Organisation oder einen Ordner schätzen
- Kosten für die Datenprofilerstellung für ein einzelnes Projekt schätzen
Zeitpläne zu Scankonfigurationen hinzufügen
Um die Kosten für die Datenprofilerstellung zu kontrollieren, können Sie einen Zeitplan erstellen, in dem Sie Filter und Bedingungen festlegen. Hier einige Beispiele:
- Wenn Sie bestimmte Tabellen nicht profilieren müssen, können Sie angeben, dass Tabellen, die Ihren Filtern entsprechen, niemals profiliert werden dürfen.
- Wenn Sie nur bestimmte Tabellen profilieren möchten, können Sie das Profiling für alle Tabellen deaktivieren, mit Ausnahme derjenigen, die Ihrem Filter entsprechen.
- Wenn bestimmte Tabellen nur einmal und nie wieder profiliert werden sollen, können Sie angeben, dass für diese Tabellen kein neues Profil erstellt werden darf.
- Wenn Sie keine alten Tabellen profilieren müssen, können Sie eine Bedingung festlegen, damit nur die Tabellen profiliert werden, die nach einem bestimmten Datum erstellt wurden.
- Wenn Sie keine neuen Tabellen profilieren müssen, können Sie eine Bedingung festlegen, damit Tabellen nur dann profiliert werden, wenn sie ein bestimmtes Alter oder eine Mindestzeilenanzahl erreicht haben.
Kosten in einem Dashboard einsehen und Audit-Logs abfragen
Erstellen Sie ein Dashboard, um Ihre Abrechnungsdaten einzusehen und die Nutzung des Schutzes sensibler Daten anzupassen. Darüber hinaus können Sie Ihre Audit-Logs in den Schutz sensibler Daten streamen, um die Nutzungsmuster zu analysieren.
Sie können Ihre Abrechnungsdaten nach BigQuery exportieren und sie in einem Tool wie Looker Studio visualisieren. Eine Anleitung zum Erstellen eines Abrechnungsdashboards finden Sie unter Google Cloud-Abrechnung mit BigQuery und Looker Studio visualisieren.
Außerdem haben Sie die Möglichkeit, Ihre Audit-Logs in BigQuery zu streamen und sie auf Muster wie die Abfragekosten nach Nutzer zu analysieren.
Budgetbenachrichtigungen festlegen
Wenn Sie einen Budgetalarm festlegen, können Sie verfolgen, wie Ihre Ausgaben sich einem festgelegten Betrag nähern. Durch das Festlegen eines Budgets wird die API-Nutzung nicht begrenzt. Sie werden nur benachrichtigt, wenn der Ausgabebetrag den angegebenen Betrag erreicht.