Auf dieser Seite wird beschrieben, wie Sie die Kosten für das Profiling von BigQuery-Daten in einem Projekt schätzen. Wenn Sie eine Schätzung für eine Organisation oder einen Ordner erstellen möchten, lesen Sie den Hilfeartikel Kosten für die Datenprofilerstellung für eine Organisation oder einen Ordner schätzen.
Weitere Informationen zum Erstellen von BigQuery-Datenprofilen finden Sie unter Datenprofile für BigQuery-Daten.
Übersicht
Bevor Sie mit dem Generieren von Datenprofilen beginnen, können Sie eine Schätzung durchführen. So erfahren Sie, wie viele BigQuery-Daten Sie haben und wie viel es kosten könnte, ein Profil dieser Daten zu erstellen. Um eine Schätzung durchzuführen, erstellen Sie eine Schätzung.
Wenn Sie eine Schätzung erstellen, geben Sie die Ressource (Organisation, Ordner oder Projekt) an, die die Daten enthält, die Sie profilieren möchten. Sie können Filter festlegen, um die Datenauswahl zu optimieren. Sie können auch Bedingungen festlegen, die erfüllt sein müssen, bevor der Schutz sensibler Daten ein Profil für eine Tabelle erstellt. Der Schutz sensibler Daten basiert bei der Schätzung auf der Form, Größe und dem Typ der Daten zum Zeitpunkt der Erstellung der Schätzung.
Jede Schätzung enthält Details wie die Anzahl der übereinstimmenden Tabellen in der Ressource, die Gesamtgröße aller dieser Tabellen und die geschätzten Kosten für das einmalige und monatliche Erstellen eines Ressourcenprofils.
Weitere Informationen zur Berechnung der Preise finden Sie unter Preise für das Datenprofiling.
Preisschätzung
Das Erstellen eines Kostenvoranschlags ist kostenlos.
Aufbewahrung
Jede Schätzung wird nach 28 Tagen automatisch gelöscht.
Hinweise
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle DLP Administrator (roles/dlp.admin
) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Verwalten von Kostenschätzungen für das Datenprofiling benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Achten Sie darauf, dass die Cloud Data Loss Prevention API für Ihr Projekt aktiviert ist:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle DLP Administrator (
roles/dlp.admin
) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Verwalten von Kostenschätzungen für das Datenprofiling benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Kostenvoranschlag erstellen
Rufen Sie die Seite Datenprofilschätzung erstellen auf.
Wählen Sie Ihr Projekt aus.
In den folgenden Abschnitten finden Sie weitere Informationen zu den Schritten auf der Seite Schätzung für Datenprofil erstellen. Klicken Sie am Ende jedes Abschnitts auf Weiter.
Zu scannende Ressource auswählen
Achten Sie darauf, dass Gesamtes Projekt scannen ausgewählt ist.Eingabefilter und Bedingungen
Sie können diesen Abschnitt überspringen, wenn Sie alle BigQuery-Tabellen im Projekt in Ihre Schätzung einbeziehen möchten.In diesem Abschnitt erstellen Sie Filter, um bestimmte Teilmengen Ihrer Daten anzugeben, die in die Schätzung ein- oder von dieser ausgeschlossen werden sollen. Für Teilmengen, die Sie in die Schätzung einbeziehen, geben Sie auch alle Bedingungen an, die eine Tabelle in der Teilmenge erfüllen muss, um in die Schätzung aufgenommen zu werden.
So legen Sie Filter und Bedingungen fest:
- Klicken Sie auf Filter und Bedingungen hinzufügen.
Im Abschnitt Filter definieren Sie einen oder mehrere Filter, mit denen Sie angeben, welche Tabellen in die Schätzung einbezogen werden sollen.
Geben Sie mindestens eine der folgenden Angaben an:
- Eine Projekt-ID oder ein regulärer Ausdruck, der ein oder mehrere Projekte angibt.
- Eine Dataset-ID oder ein regulärer Ausdruck, der ein oder mehrere Datasets angibt.
- Eine Tabellen-ID oder ein regulärer Ausdruck, der eine oder mehrere Tabellen angibt.
Reguläre Ausdrücke müssen der RE2-Syntax folgen.
Wenn Sie beispielsweise alle Tabellen in einem Datensatz in den Filter aufnehmen möchten, geben Sie die ID dieses Datensatzes an und lassen Sie die beiden anderen Felder leer.
Wenn Sie weitere Filter hinzufügen möchten, klicken Sie auf Filter hinzufügen und wiederholen Sie diesen Schritt.
Wenn die durch Ihre Filter definierten Datenmengen aus der Schätzung ausgeschlossen werden sollen, deaktivieren Sie die Option Übereinstimmende Tabellen in die Schätzung einbeziehen. Wenn Sie diese Option deaktivieren, werden die im Rest dieses Abschnitts beschriebenen Bedingungen ausgeblendet.
Optional: Geben Sie im Abschnitt Bedingungen alle Bedingungen an, die die übereinstimmenden Tabellen erfüllen müssen, um in die Schätzung aufgenommen zu werden. Wenn Sie diesen Schritt überspringen, werden beim Schutz sensibler Daten alle unterstützten Tabellen berücksichtigt, die Ihren Filtern entsprechen, unabhängig von ihrer Größe und ihrem Alter.
Konfigurieren Sie die folgenden Optionen:
Mindestbedingungen: Wenn Sie kleine oder neue Tabellen von der Schätzung ausschließen möchten, legen Sie eine Mindestzeilenanzahl oder ein Mindestalter für die Tabelle fest.
Zeitbedingung: Wenn Sie alte Tabellen ausschließen möchten, aktivieren Sie die Zeitbedingung. Wählen Sie dann ein Datum und eine Uhrzeit aus. Alle Tabellen, die an oder vor diesem Datum erstellt wurden, werden von der Schätzung ausgeschlossen.
Wenn Sie beispielsweise die Zeitbedingung auf 4. Mai 2022, 23:59 Uhr festlegen, werden bei der Schätzung durch den Schutz sensibler Daten alle Tabellen ausgeschlossen, die am oder vor dem 4. Mai 2022 um 23:59 Uhr erstellt wurden.
Tabellen für die Profilerstellung: Wenn Sie angeben möchten, welche Tabellentypen in die Schätzung einbezogen werden sollen, wählen Sie Nur Tabellen eines bestimmten Typs oder bestimmter Typen einschließen aus. Wählen Sie dann die Tabellentypen aus, die Sie einschließen möchten.
Wenn Sie diese Bedingung nicht aktivieren oder keine Tabellentypen auswählen, werden bei der Schätzung alle unterstützten Tabellen in den Schutz sensibler Daten einbezogen.
Angenommen, Sie haben folgende Konfiguration:
Mindestbedingungen
- Mindestanzahl von Zeilen: 10 Zeilen
- Mindestdauer: 24 Stunden
Zeitbedingung
- Zeitstempel: 4. Mai 2022, 23:59 Uhr
Tabellen, für die ein Profil erstellt werden soll
Die Option Nur Tabellen eines bestimmten Typs oder bestimmter Typen einschließen ist ausgewählt. In der Liste der Tabellentypen ist nur BigLake-Tabellen profilieren ausgewählt.
In diesem Fall werden alle Tabellen, die am oder vor dem 4. Mai 2022 um 23:59 Uhr erstellt wurden, vom Sensitive Data Protection-Filter ausgeschlossen. Unter den nach diesem Datum und dieser Uhrzeit erstellten Tabellen werden vom Schutz sensibler Daten nur die BigLake-Tabellen profiliert, die entweder 10 Zeilen haben oder mindestens 24 Stunden alt sind.
Klicken Sie auf Fertig.
Wenn Sie weitere Filter und Bedingungen hinzufügen möchten, klicken Sie auf Filter und Bedingungen hinzufügen und wiederholen Sie die vorherigen Schritte.
Das letzte Element in der Liste der Filter und Bedingungen ist immer das Element mit der Kennzeichnung Standardfilter und ‑bedingungen. Diese Standardeinstellung wird auf Tabellen in Ihrem Projekt angewendet, die keinem der von Ihnen erstellten Filter und Bedingungen entsprechen.
Wenn Sie die Standardfilter und -bedingungen anpassen möchten, klicken Sie auf
Filter und Bedingungen bearbeiten und passen Sie die Einstellungen nach Bedarf an.
Standort zum Speichern der Schätzung festlegen
Wählen Sie in der Liste Ressourcenspeicherort die Region aus, in der Sie diese Schätzung speichern möchten.
Der Speicherort, an dem Sie die Schätzung speichern, hat keinen Einfluss auf die zu scannenden Daten. Außerdem wirkt sich dies nicht darauf aus, wo die Datenprofile später gespeichert werden. Die Daten werden in derselben Region gescannt, in der sie gespeichert sind (wie in BigQuery festgelegt). Weitere Informationen finden Sie unter Überlegungen zum Datenstandort.
Prüfen Sie Ihre Einstellungen und klicken Sie auf Erstellen.
Sensitive Data Protection erstellt die Schätzung und fügt sie der Liste der Schätzungen hinzu. Anschließend wird die Schätzung ausgeführt.
Je nach Datenmenge kann die Erstellung einer Schätzung bis zu 24 Stunden dauern. In der Zwischenzeit können Sie die Seite zum Schutz sensibler Daten schließen und später wieder aufrufen. Sobald der Kostenvoranschlag fertig ist, wird eine Benachrichtigung in der Google Cloud Console angezeigt.
Schätzung ansehen
Rufen Sie die Liste der Schätzungen auf.
Klicken Sie auf die Schätzung, die Sie sich ansehen möchten. Die Schätzung enthält Folgendes:
- Die Anzahl der Tabellen in der Ressource abzüglich der Tabellen, die Sie durch Filter und Bedingungen ausgeschlossen haben.
- Die Gesamtmenge der Daten, die den Tabellen entsprechen.
- Die Anzahl der Aboeinheiten, die erforderlich sind, um diese Datenmenge jeden Monat zu profilieren.
- Die Kosten der ersten Erkennung, also die ungefähren Kosten für das Profiling der gefundenen Tabellen. Diese Schätzung basiert nur auf einem Snapshot der aktuellen Daten und berücksichtigt nicht, wie stark Ihre Daten in einem bestimmten Zeitraum wachsen.
- Zusätzliche Kostenschätzungen für das Erstellen von Profilen nur für Tabellen, die jünger als 6, 12 oder 24 Monate sind. Diese zusätzlichen Schätzungen sollen Ihnen zeigen, wie Sie die Kosten für das Datenprofiling senken können, wenn Sie die Datenabdeckung weiter einschränken.
- Die geschätzten monatlichen Kosten für das Erstellen von Datenprofilen, vorausgesetzt, dass Ihre BigQuery-Nutzung jeden Monat der Nutzung in diesem Monat entspricht.
- Ein Diagramm, das das Wachstum Ihrer BigQuery-Daten im Zeitverlauf zeigt.
- Die von Ihnen festgelegten Konfigurationsdetails.
Schätzungsgrafik
Jede Schätzung enthält ein Diagramm, das das bisherige Wachstum Ihrer BigQuery-Daten zeigt. Anhand dieser Informationen lassen sich die monatlichen Kosten für das Datenprofiling schätzen.
Nächste Schritte
- Weitere Informationen zu den Preisen für die Datenprofilerstellung
- Weitere Informationen zu Datenprofilen für BigQuery-Daten
- Informationen zum Erstellen von Profildaten für eine Organisation oder einen Ordner
- Weitere Informationen zum Erstellen von Datenprofilen in einem einzelnen Projekt