Sensitive Data Protection offre molte funzionalità efficaci, ma a seconda della quantità di informazioni da scansionare tramite Sensitive Data Protection, è possibile che i costi diventino eccessivamente elevati. Questo argomento descrive diversi metodi che puoi utilizzare per mantenere bassi i costi e assicurarti al contempo di utilizzare Sensitive Data Protection per scansionare i dati esatti che intendi.
Ispezione
Google consiglia le seguenti pratiche per aiutarti a controllare i costi di ispezione.
Utilizza il campionamento per limitare il numero di byte ispezionati
Se stai analizzando tabelle BigQuery o bucket Cloud Storage, Sensitive Data Protection può analizzare un piccolo sottoinsieme del set di dati. In questo modo è possibile ottenere un campione dei risultati della scansione senza incorrere nei potenziali costi della scansione di un intero set di dati.
Una volta trovato un campione con dati sensibili, puoi pianificare una seconda scansione più completa del set di dati per scoprire l'intero elenco dei risultati.
Per ulteriori informazioni, consulta Limitare la quantità di contenuti esaminati in Ispezione dello spazio di archiviazione e dei database per l'individuazione di dati sensibili.
Scansiona solo i dati che sono stati modificati
Puoi chiedere a Sensitive Data Protection di evitare di eseguire la scansione dei dati che non sono stati modificati dall'ultima ispezione. L'impostazione di un intervallo di tempo consente di controllare quali dati scansionare in base all'ultima modifica.
Se utilizzi gli attivatori dei job, puoi impostare il enable_auto_population_of_timespan_config
in TimespanConfig
per saltare automaticamente i contenuti sottoposti a scansione durante l'ultimo job pianificato.
Per ulteriori informazioni, consulta Limitare le scansioni solo ai nuovi contenuti in Creare e pianificare i job di ispezione di Sensitive Data Protection.
Limita le scansioni dei file in Cloud Storage solo ai file pertinenti
Se specifichi il messaggio
CloudStorageRegexFileSet
, puoi utilizzare i filtri tramite espressioni regolari per un controllo più preciso su quali
file o cartelle nei bucket includere o escludere.
Questa opzione è utile quando vuoi saltare la scansione dei file di cui sai che non contengono dati sensibili, ad esempio backup, file TMP, contenuti web statici e così via.
Discovery
Ti consigliamo le seguenti pratiche per aiutarti a controllare i costi del profiling dei dati.
Esegui una stima
Prima di iniziare un'operazione di profilazione dei dati, ti consigliamo di eseguire prima una stima. L'esecuzione di una stima ti consente di comprendere le dimensioni e la forma dei dati BigQuery da profilare. Ogni stima fornisce il conto approssimativo delle tabelle, le dimensioni dei dati e il costo della profilazione. Mostra anche una proiezione della crescita mensile dei dati BigQuery.
Per ulteriori informazioni sull'esecuzione di una stima, consulta quanto segue:
- Stima i costi di profilazione dei dati per un'organizzazione o una cartella
- Stima i costi di profilazione dei dati per un singolo progetto
Aggiungere pianificazioni nelle configurazioni di scansione
Per contribuire a controllare il costo della profilazione dei dati, ti consigliamo di creare una programmazione in cui impostare filtri e condizioni. Ecco alcuni esempi di ciò che puoi fare:
- Se non hai bisogno di profilare determinate tabelle, puoi specificare che le tabelle che corrispondono ai tuoi filtri non devono mai essere profilate.
- Se vuoi creare il profilo solo di alcune tabelle, puoi disattivare il profiling per tutte le tabelle, tranne per quelle che corrispondono al filtro.
- Se vuoi che il profilo di determinate tabelle venga creato una sola volta e non più, puoi specificare che non devono mai essere riprofilate.
- Se non devi profilare le tabelle precedenti, puoi impostare una condizione per profilare solo le tabelle create dopo una determinata data.
- Se non devi profilare le tabelle nuove, puoi impostare una condizione per profilare le tabelle solo quando raggiungono una determinata età o un conteggio minimo di righe.
Visualizzare i costi utilizzando una dashboard ed eseguire query sui log di controllo
Crea una dashboard per visualizzare i dati di fatturazione in modo da poter apportare modifiche all'utilizzo della protezione dei dati sensibili. Valuta anche la possibilità di eseguire lo streaming dei log di controllo in Protezione dei dati sensibili per analizzare i pattern di utilizzo.
Puoi esportare i dati di fatturazione in BigQuery e visualizzarli in uno strumento come Looker Studio. Per un tutorial sulla creazione di una dashboard di fatturazione, consulta Visualizzare la fatturazione di Google Cloud utilizzando BigQuery e Looker Studio.
Puoi anche trasmettere in streaming i tuoi audit log in BigQuery e analizzarli per individuare modelli di utilizzo, ad esempio i costi delle query per utente.
Imposta avvisi per il budget
Imposta un avviso relativo al budget per monitorare l'aumento della spesa rispetto a un determinato importo. L'impostazione di un budget non pone un limite all'utilizzo dell'API, ma ti avvisa solo quando l'importo della spesa si avvicina a quello specificato.