Cette page explique comment estimer le coût du profilage des données BigQuery dans un projet. Si vous souhaitez créer une estimation pour une organisation ou un dossier, consultez Estimer le coût du profilage des données pour une organisation ou un dossier.
Pour en savoir plus sur le profilage des données BigQuery, consultez la page Profils de données pour les données BigQuery.
Présentation
Avant de commencer à générer des profils de données, vous pouvez effectuer une estimation afin de déterminer le volume de données BigQuery dont vous disposez et le coût de leur profilage. Pour effectuer une estimation, vous devez en créer une.
Lorsque vous créez une estimation, vous spécifiez la ressource (organisation, dossier ou projet) contenant les données que vous souhaitez profiler. Vous pouvez définir des filtres pour affiner la sélection des données. Vous pouvez également définir des conditions qui doivent être remplies pour que la protection des données sensibles profile une table. La protection des données sensibles base l'estimation sur la forme, la taille et le type des données au moment de la création de l'estimation.
Chaque estimation comprend des informations telles que le nombre de tables correspondantes trouvées dans la ressource, la taille totale de toutes ces tables et le coût estimé du profilage de la ressource une fois et sur une base mensuelle.
Pour en savoir plus sur le calcul des tarifs, consultez la page Tarifs du profilage de données.
Tarifs d'estimation
La création d'une estimation est gratuite.
Fidélisation
Chaque estimation est automatiquement supprimée au bout de 28 jours.
Avant de commencer
Pour obtenir les autorisations nécessaires pour créer et gérer des estimations de coûts de profilage des données, demandez à votre administrateur de vous accorder le rôle IAM Administrateur de la protection des données (roles/dlp.admin
) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Assurez-vous que l'API Cloud Data Loss Prevention est activée dans votre projet:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
Pour obtenir les autorisations nécessaires pour créer et gérer des estimations de coûts de profilage des données, demandez à votre administrateur de vous accorder le rôle IAM Administrateur de la protection des données (
roles/dlp.admin
) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une estimation
Accédez à la page Créer une estimation de profil de données.
Sélectionnez votre projet.
Les sections suivantes fournissent plus d'informations sur les étapes de la page Créer une estimation de profil de données. À la fin de chaque section, cliquez sur Continuer.
Sélectionner la ressource à analyser
Assurez-vous que l'option Analyser l'intégralité du projet est sélectionnée.Renseigner les filtres et conditions
Vous pouvez ignorer cette section si vous souhaitez inclure toutes les tables BigQuery du projet dans votre estimation.Dans cette section, vous allez créer des filtres pour spécifier certains sous-ensembles de vos données que vous souhaitez inclure ou exclure de l'estimation. Pour les sous-ensembles que vous incluez dans l'estimation, vous devez également spécifier les conditions qu'un tableau du sous-ensemble doit remplir pour être inclus dans l'estimation.
Pour définir des filtres et des conditions, procédez comme suit:
- Cliquez sur Ajouter des filtres et des conditions.
Dans la section Filtres, vous définissez un ou plusieurs filtres qui spécifient les tables incluses dans l'estimation.
Indiquez au moins l'un des éléments suivants:
- ID de projet ou expression régulière spécifiant un ou plusieurs projets.
- ID d'un ensemble de données ou expression régulière spécifiant un ou plusieurs ensembles de données.
- ID de table ou expression régulière spécifiant une ou plusieurs tables.
Les expressions régulières doivent suivre la syntaxe RE2.
Par exemple, si vous souhaitez que toutes les tables d'un ensemble de données soient incluses dans le filtre, spécifiez l'ID de cet ensemble de données et laissez les deux autres champs vides.
Pour ajouter d'autres filtres, cliquez sur Ajouter un filtre et répétez cette étape.
Si les sous-ensembles de données définis par vos filtres doivent être exclus de l'estimation, désactivez l'option Inclure les tables correspondantes dans mon estimation. Si vous désactivez cette option, les conditions décrites dans le reste de cette section sont masquées.
Facultatif: dans la section Conditions, spécifiez les conditions que les tableaux correspondants doivent remplir pour être inclus dans l'estimation. Si vous ignorez cette étape, la protection des données sensibles inclut toutes les tables compatibles qui correspondent à vos filtres, quelle que soit leur taille et leur ancienneté.
Configurez les options suivantes:
Conditions minimales: pour exclure les tables de petite taille ou nouvelles de l'estimation, définissez un nombre minimal de lignes ou un âge minimal de la table.
Condition temporelle: pour exclure les anciennes tables, activez la condition temporelle. Choisissez ensuite une date et une heure. Toute table créée à cette date ou avant est exclue de l'estimation.
Par exemple, si vous définissez la condition temporelle sur 4/5/22, 23:59, la protection des données sensibles exclut de l'estimation toutes les tables créées avant le 4 mai 2022 à 23h59.
Tables à profiler: pour spécifier les types de tables à inclure dans l'estimation, sélectionnez Inclure uniquement les tables d'un ou de plusieurs types spécifiés. Sélectionnez ensuite les types de tableaux que vous souhaitez inclure.
Si vous n'activez pas cette condition ou si vous ne sélectionnez aucun type de table, la protection des données sensibles inclut toutes les tables compatibles dans l'estimation.
Supposons que vous ayez la configuration suivante:
Conditions minimales
- Nombre minimal de lignes: 10 lignes
- Durée minimale: 24 heures
Condition temporelle
- Code temporel: 4/5/22, 23:59
Tables à profiler
L'option Inclure uniquement les tables d'un ou de plusieurs types spécifiés est sélectionnée. Dans la liste des types de tables, seul Profile BigLake tables (Profiler les tables BigLake) est sélectionné.
Dans ce cas, la protection des données sensibles exclut toutes les tables créées le 4 mai 2022 à 23h59 ou avant. Parmi les tables créées après cette date et cette heure, la protection des données sensibles ne profile que les tables BigLake qui comptent 10 lignes ou qui ont au moins 24 heures.
Cliquez sur OK.
Si vous souhaitez ajouter d'autres filtres et conditions, cliquez sur Ajouter des filtres et des conditions, puis répétez les étapes précédentes.
Le dernier élément de la liste des filtres et conditions est toujours celui intitulé Filtres et conditions par défaut. Ce paramètre par défaut est appliqué aux tables de votre projet qui ne correspondent à aucun des filtres et conditions que vous avez créés.
Si vous souhaitez ajuster les filtres et les conditions par défaut, cliquez sur
Modifier les filtres et les conditions, puis modifiez les paramètres si nécessaire.
Définir l'emplacement de stockage de l'estimation
Dans la liste Emplacement de la ressource, sélectionnez la région dans laquelle vous souhaitez stocker cette estimation.
L'emplacement où vous choisissez de stocker votre estimation n'affecte pas les données à analyser. De plus, l'emplacement de stockage des profils de données n'est pas affecté. Vos données sont analysées dans la région dans laquelle elles sont stockées (telles que définies dans BigQuery). Pour en savoir plus, consultez la section Considérations relatives à la résidence des données.
Vérifiez vos paramètres, puis cliquez sur Créer.
Sensitive Data Protection crée l'estimation et l'ajoute à la liste des estimations. Ensuite, il exécute l'estimation.
Selon la quantité de données de la ressource, l'estimation peut prendre jusqu'à 24 heures. En attendant, vous pouvez fermer la page "Protection des données sensibles" et y revenir plus tard. Une notification s'affiche dans la console Google Cloud lorsque l'estimation est prête.
Afficher une estimation
Accédez à la liste des estimations.
Cliquez sur l'estimation que vous souhaitez consulter. L'estimation contient les éléments suivants:
- Nombre de tables de la ressource, moins celles que vous avez exclues à l'aide de filtres et de conditions.
- Quantité totale de données correspondant aux tables.
- Nombre d'unités d'abonnement requises pour profiler cette quantité de données chaque mois.
- Coût de la découverte initiale, qui correspond au coût approximatif du profilage des tables trouvées. Cette estimation ne repose que sur un instantané des données actuelles et ne tient pas compte de l'évolution de vos données sur une période donnée.
- Estimations de coûts supplémentaires pour le profilage uniquement des tables datant de moins de 6, 12 ou 24 mois. Ces estimations supplémentaires vous montrent comment limiter davantage la couverture de vos données peut vous aider à contrôler le coût de votre profilage de données.
- Coût mensuel estimé du profilage de vos données, en supposant que votre utilisation de BigQuery chaque mois est identique à celle de ce mois.
- Graphique illustrant la croissance de votre BigQuery au fil du temps.
- Les détails de configuration que vous définissez.
Graphique des estimations
Chaque estimation comprend un graphique qui représente l'historique de la croissance de vos données BigQuery. Vous pouvez utiliser ces informations pour estimer votre coût de profilage de données mensuel.
Étape suivante
- En savoir plus sur la tarification du profilage de données
- En savoir plus sur les profils de données pour les données BigQuery
- Découvrez comment profiler les données d'une organisation ou d'un dossier.
- Découvrez comment profiler des données dans un seul projet.