Tareas y activadores de tareas

Un trabajo es una acción que ejecuta Protección de Datos Sensibles para analizar contenido en busca de datos sensibles o para calcular el riesgo de reidentificación. Protección de Datos Sensibles crea y ejecuta un recurso de tarea cuando le indicas que inspeccione tus datos.

Actualmente, hay dos tipos de tareas de Protección de Datos Sensibles:

  • Los trabajos de inspección analizan su contenido para detectar datos sensibles según sus criterios y generan informes de resumen sobre dónde y qué tipo de datos sensibles hay.
  • Los trabajos de análisis de riesgos analizan los datos anonimizados y devuelven métricas sobre la probabilidad de que se puedan reidentificar.

Puedes programar cuándo se ejecutan las tareas de Protección de Datos Sensibles creando activadores de tareas. Un activador de tareas es un evento que automatiza la creación de tareas de Protección de Datos Sensibles para analizar repositorios de almacenamiento, incluidos segmentos de Cloud Storage, tablas de BigQuery y tipos de Datastore. Google Cloud

Los activadores de trabajos te permiten programar trabajos de análisis configurando intervalos en los que se activará cada activador. Se pueden configurar para buscar nuevos resultados desde la última ejecución del análisis y, de esta forma, monitorizar los cambios o las adiciones al contenido, o bien para generar informes de resultados actualizados. Los activadores programados se ejecutan en un intervalo que usted define, de 1 a 60 días.

Pasos siguientes

Para obtener más información sobre cómo crear, editar y ejecutar tareas y activadores de tareas, consulte los siguientes temas:

Además, está disponible la siguiente guía de inicio rápido:

Objeto JobTrigger

En la API DLP, un activador de tareas se representa mediante el objeto JobTrigger.

Campos de configuración de activadores de tareas

Cada JobTrigger contiene varios campos de configuración, entre los que se incluyen los siguientes:

  • El nombre y el nombre visible del activador, así como una descripción.
  • Conjunto de objetos Trigger, cada uno de los cuales contiene un objeto Schedule que define la recurrencia del análisis en segundos.
  • Un objeto InspectJobConfig que contiene la información de configuración del trabajo activado.
  • Una enumeración Status que indica si el activador está activo en ese momento.
  • Campos de marca de tiempo que representan las horas de creación, actualización y última ejecución.
  • Colección de objetos Error, si se ha encontrado alguno, cuando se ha activado el activador.

Métodos de activadores de tareas

Cada objeto JobTrigger también incluye varios métodos integrados. Con estos métodos, puedes hacer lo siguiente:

Latencia de las tareas

No se garantiza ningún objetivo de nivel de servicio para los trabajos ni los activadores de trabajos. La latencia se ve afectada por varios factores, como la cantidad de datos que se van a analizar, el repositorio de almacenamiento que se va a analizar, el tipo y el número de infoTypes que se van a buscar, la región en la que se procesa el trabajo y los recursos de computación disponibles en esa región. Por lo tanto, la latencia de las tareas de inspección no se puede determinar de antemano.

Para reducir la latencia de los trabajos, puedes probar lo siguiente:

  • Si el muestreo está disponible para tu tarea o activador de tareas, habilítalo.
  • Evita habilitar infoTypes que no necesites. Aunque los siguientes tipos de información son útiles en determinados casos, pueden hacer que las solicitudes se ejecuten mucho más lentamente que las que no los incluyen:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Especifica siempre los infoTypes de forma explícita. No utilices una lista infoTypes vacía.

  • Si es posible, usa otra región de procesamiento.

Si sigues teniendo problemas de latencia con los trabajos después de probar estas técnicas, considera la posibilidad de usar solicitudes content.inspect o content.deidentify en lugar de trabajos. Estos métodos se rigen por el Acuerdo de Nivel de Servicio. Para obtener más información, consulta el acuerdo de nivel de servicio de Protección de Datos Sensibles.

Limitar el análisis solo al contenido nuevo

Puedes configurar el activador de la tarea para que defina automáticamente la fecha del periodo de los archivos almacenados en Cloud Storage o BigQuery. Cuando asignas el valor de autocompletar al objeto TimespanConfig, Protección de Datos Sensibles solo analiza los datos que se han añadido o modificado desde la última vez que se activó el activador:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

En el caso de la inspección de BigQuery, solo se incluyen en el análisis las filas que tengan al menos tres horas. Consulta el problema conocido relacionado con esta operación.

Activar tareas al subir archivos

Además de la compatibilidad con los activadores de tareas, que está integrada en Protección de Datos Sensibles,Google Cloud también tiene otros componentes que puedes usar para integrar o activar tareas de Protección de Datos Sensibles. Por ejemplo, puedes usar Cloud Run Functions para activar un análisis de Protección de Datos Sensibles cada vez que se suba un archivo a Cloud Storage.

Para obtener información sobre cómo configurar esta operación, consulta el artículo Automatizar la clasificación de datos subidos a Cloud Storage.