Maîtriser les coûts

Sensitive Data Protection comporte de nombreuses fonctionnalités puissantes. Cependant, selon la quantité d'informations que vous demandez à Sensitive Data Protection d'analyser, les coûts peuvent être extrêmement élevés. Vous trouverez dans cette section la description de plusieurs méthodes dont vous pouvez tirer parti pour réduire les coûts tout en garantissant que vous vous servez de Sensitive Data Protection pour analyser exactement les données que vous souhaitez.

Inspection

Google recommande les pratiques suivantes pour vous aider à contrôler vos coûts d'inspection.

Restreindre le nombre d'octets inspectés à l'aide de l'échantillonnage

Si vous analysez des tables BigQuery ou des buckets Cloud Storage, la protection des données sensibles peut analyser un petit sous-ensemble de l'ensemble de données. Cela permet d'obtenir un échantillon des résultats d'analyse sans toutefois générer les coûts potentiels d'une analyse sur l'ensemble de données complet.

Lorsque vous trouvez un échantillon contenant des données sensibles, vous pouvez planifier une seconde analyse plus exhaustive sur cet échantillon afin d'obtenir la liste complète des résultats.

Pour en savoir plus, consultez la section Limiter la quantité de contenu inspecté dans la section Inspecter le stockage et les bases de données pour identifier les données sensibles.

Analyser uniquement les données qui ont changé

Vous pouvez indiquer à la protection des données sensibles d'éviter d'analyser les données qui n'ont pas été modifiées depuis la dernière inspection. La définition d'un délai vous permet de contrôler les données à analyser en fonction de la date de dernière modification.

Si vous utilisez des déclencheurs de tâche, vous pouvez définir l'option enable_auto_population_of_timespan_config dans TimespanConfig pour ignorer automatiquement le contenu analysé lors de la dernière tâche planifiée.

Pour en savoir plus, consultez la section Limiter les analyses au nouveau contenu dans la section Créer et planifier des tâches d'inspection de la protection des données sensibles.

Restreindre les analyses dans Cloud Storage aux seuls fichiers pertinents

Si vous spécifiez le message CloudStorageRegexFileSet, vous pouvez utiliser des filtres d'expressions régulières afin de contrôler plus précisément les fichiers ou dossiers des buckets à inclure ou exclure.

Cette méthode est utile lorsque vous souhaitez ignorer l'analyse des fichiers dont vous savez qu'ils ne contiennent aucune donnée sensible (par exemple les sauvegardes, les fichiers TMP, du contenu Web statique, etc.).

Discovery

Nous vous recommandons de suivre les bonnes pratiques suivantes pour vous aider à contrôler les coûts de profilage des données.

Exécuter une estimation

Avant de commencer une opération de profilage des données, envisagez d'exécuter d'abord une estimation. Exécuter une estimation vous permet de comprendre la taille et la forme des données BigQuery à profiler. Chaque estimation fournit le nombre approximatif de tables, la taille des données et le coût de profilage. Il affiche également une projection de la croissance mensuelle de vos données BigQuery.

Pour en savoir plus sur l'exécution d'une estimation, consultez les pages suivantes:

Ajouter des planifications dans vos configurations d'analyse

Pour contrôler le coût du profilage des données, envisagez de créer un calendrier dans lequel vous définirez des filtres et des conditions. Voici quelques exemples de ce que vous pouvez faire:

  • Si vous n'avez pas besoin de profiler certaines tables, vous pouvez spécifier que les tables correspondant à vos filtres ne doivent jamais être profilées.
  • Si vous ne souhaitez profiler que certaines tables, vous pouvez désactiver le profilage pour toutes les tables, à l'exception de celles qui correspondent à votre filtre.
  • Si vous ne souhaitez que certaines tables soient profilées une seule fois, vous pouvez spécifier qu'elles ne doivent jamais être reprofilées.
  • Si vous n'avez pas besoin de profiler d'anciennes tables, vous pouvez définir une condition pour ne profiler que les tables créées après une certaine date.
  • Si vous n'avez pas besoin de profiler les tables nouvelles, vous pouvez définir une condition pour ne les profiler que lorsqu'elles atteignent un certain âge ou un nombre minimal de lignes.

Afficher les coûts à l'aide d'un tableau de bord et interroger les journaux d'audit

Créez un tableau de bord pour afficher vos données de facturation afin de pouvoir ajuster votre utilisation de la protection des données sensibles. Pensez également à diffuser vos journaux d'audit vers la protection des données sensibles afin d'analyser les modèles d'utilisation.

Vous pouvez exporter vos données de facturation dans BigQuery et les visualiser dans un outil comme Looker Studio. Pour consulter un tutoriel sur la création d'un tableau de bord de facturation, consultez la page Visualiser la facturation Google Cloud à l'aide de BigQuery et Looker Studio.

Vous pouvez également diffuser vos journaux d'audit vers BigQuery et les analyser pour rechercher des motifs d'utilisation, par exemple les coûts des requêtes par utilisateur.

Définir des alertes de budget

Définissez une alerte budgétaire pour suivre l'évolution de vos dépenses par rapport à un montant donné. Définir un budget ne limite pas l'utilisation de l'API. Cela vous avertit seulement lorsque le montant de vos dépenses s'approche du montant spécifié.