Tâches et déclencheurs de tâches

Une tâche est une action exécutée par le service de protection des données sensibles pour analyser le contenu à la recherche de données sensibles ou pour calculer le risque de restauration de l'identification. Le service de protection des données sensibles crée et exécute une ressource de tâche chaque fois que vous lui demandez d'inspecter vos données.

Il existe actuellement deux types de tâches liées à la protection des données sensibles:

  • Les tâches d'inspection analysent le contenu à la recherche de données sensibles selon vos critères et génèrent des rapports récapitulatifs sur l'emplacement et le type de données sensibles.
  • Les tâches d'analyse des risques analysent les données anonymisées et renvoient des métriques sur la probabilité de restauration de l'identification des données.

Vous pouvez planifier l'exécution des tâches par la protection des données sensibles en créant des déclencheurs de tâches. Un déclencheur de tâche est un événement qui automatise la création de tâches de protection des données sensibles pour analyser les dépôts Google Cloud Storage, y compris les buckets Cloud Storage, les tables BigQuery et les genres Datastore.

Les déclencheurs de tâche vous permettent de planifier des tâches d'analyse en définissant des intervalles de déclenchement pour chaque déclencheur. Vous pouvez les configurer afin d'effectuer une nouvelle recherche depuis la dernière analyse, de surveiller les modifications ou les ajouts de contenu et de générer des rapports de résultats à jour. Les déclencheurs programmés s'exécutent par intervalles que vous définissez, de 1 à 60 jours.

Étapes suivantes

Les rubriques suivantes expliquent comment créer, modifier et exécuter des tâches, ainsi que des déclencheurs de tâches :

Le guide de démarrage rapide ci-dessous est également disponible :

L'objet JobTrigger

Un déclencheur de tâche est représenté dans l'API DLP par l'objet JobTrigger.

Champs de configuration d'un déclencheur de tâche

Chaque objet JobTrigger contient plusieurs champs de configuration, tels que :

  • le nom du déclencheur, le nom à afficher pour le déclencheur, ainsi qu'une description ;
  • une collection d'objets Trigger, chacun contenant un objet Schedule, qui définit la récurrence de l'analyse exprimée en secondes ;
  • un objet InspectJobConfig contenant les informations de configuration de la tâche déclenchée ;
  • une énumération Status, qui indique si le déclencheur est actuellement actif ;
  • des champs d'horodatage pour les dates/heures de création, de mise à jour et de dernière exécution ;
  • une collection d'objets Error, si des erreurs se sont produites lorsque le déclencheur a été activé.

Méthodes de déclenchement de tâches

Chaque objet JobTrigger comporte également plusieurs méthodes intégrées. Avec ces méthodes, vous pouvez effectuer les opérations suivantes :

Latence du job

Aucun objectif de niveau de service (SLO) n'est garanti pour les tâches et les déclencheurs de tâche. La latence dépend de plusieurs facteurs, y compris la quantité de données à analyser, le dépôt de stockage analysé, le type et le nombre d'infoTypes que vous analysez, la région dans laquelle la tâche est traitée et les ressources informatiques disponibles dans cette région. Par conséquent, la latence des tâches d'inspection ne peut pas être déterminée à l'avance.

Pour réduire la latence des tâches, essayez les solutions suivantes :

  • Si l'échantillonnage est disponible pour votre tâche ou votre déclencheur de tâche, activez-le.
  • Évitez d'activer les infoTypes dont vous n'avez pas besoin. Bien que les éléments suivants soient utiles dans certains scénarios, ces infoTypes peuvent rendre les requêtes beaucoup plus lentes que celles qui ne les incluent pas:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Spécifiez toujours les infoTypes explicitement. N'utilisez pas de liste d'infoTypes vide.

  • Si possible, utilisez une autre région de traitement.

Si vous rencontrez toujours des problèmes de latence avec les tâches après avoir essayé ces techniques, envisagez d'utiliser des requêtes content.inspect ou content.deidentify au lieu de tâches. Ces méthodes sont couvertes par le Contrat de niveau de service. Pour en savoir plus, consultez la page Contrat de niveau de service relatif à la protection des données sensibles.

Limiter les analyses au nouveau contenu

Vous pouvez configurer votre déclencheur de tâche pour définir automatiquement l'intervalle de temps pour les fichiers stockés dans Cloud Storage ou BigQuery. Lorsque vous définissez l'objet TimespanConfig pour qu'il soit renseigné automatiquement, la protection des données sensibles n'analyse que les données qui ont été ajoutées ou modifiées depuis la dernière exécution du déclencheur:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Déclencher des tâches en cas d'importation de fichiers

En plus de la compatibilité avec les déclencheurs de tâches, qui est intégrée à la protection des données sensibles, Google Cloud propose divers autres composants que vous pouvez utiliser pour intégrer ou déclencher des tâches de protection des données sensibles. Par exemple, vous pouvez utiliser Cloud Functions pour déclencher une analyse de protection des données sensibles chaque fois qu'un fichier est importé dans Cloud Storage.

Pour en savoir plus sur la configuration de cette opération, consultez la page Automatiser la classification des données importées dans Cloud Storage.