Trabajos y activadores de trabajos

Un trabajo es una acción que la protección de datos sensibles ejecuta para analizar el contenido en busca de datos sensibles o calcular el riesgo de reidentificación. La protección de datos sensibles crea y ejecuta un recurso de trabajo cada vez que le solicitas que inspeccione tus datos.

Actualmente, existen dos tipos de trabajos de protección de datos sensibles:

  • Los trabajos de inspección inspeccionan el contenido en busca de datos sensibles según tus criterios y generan informes de resumen sobre qué tipo de datos sensibles existen y dónde se encuentran.
  • Los trabajos de análisis de riesgos analizan los datos desidentificados y muestran métricas sobre la probabilidad de que los datos se puedan reidentificar.

Puedes programar cuándo la protección de datos sensibles ejecuta trabajos mediante la creación de activadores de trabajo. Un activador de trabajo es un evento que automatiza la creación de trabajos de protección de datos sensibles para analizar los repositorios de almacenamiento de Google Cloud, incluidos los buckets de Cloud Storage, las tablas de BigQuery y los tipos de Datastore.

Los activadores de trabajo te permiten programar trabajos de análisis mediante la configuración de intervalos en los que se inicia cada activador. Puedes configurarlos para buscar resultados nuevos desde el último análisis ejecutado a fin de supervisar los cambios o las adiciones al contenido o generar informes de resultados actualizados. Los activadores programados se ejecutan en un intervalo que estableces, desde 1 día hasta 60 días.

Próximos pasos

Obtén más información sobre cómo crear, editar y ejecutar trabajos y activadores de trabajo en los siguientes temas:

Además, está disponible la siguiente guía de inicio rápido:

El objeto JobTrigger

Un activador de trabajo se representa en la API de DLP con el objeto JobTrigger.

Campos de configuración del activador de trabajos

Cada JobTrigger contiene varios campos de configuración, incluidos los siguientes:

  • El nombre del activador, su nombre visible y una descripción
  • Una colección de objetos Trigger, cada uno de los cuales contiene un objeto Schedule, que define la recurrencia del análisis en segundos
  • Un objeto InspectJobConfig, que contiene la información de configuración para el trabajo activado
  • Una enumeración Status, que indica si el activador se encuentra activo
  • Campos de marca de tiempo que representan los tiempos de creación, actualización y última ejecución
  • Una colección de objetos Error, si se encontró alguno cuando se inició el activador

Métodos del activador de trabajos

Cada objeto JobTrigger también incluye varios métodos integrados. Con estos métodos, puedes hacer lo siguiente:

Latencia del trabajo

No hay objetivos de nivel de servicio (SLO) garantizados para trabajos y activadores de trabajos. La latencia se ve afectada por varios factores, como la cantidad de datos que se analizarán, el repositorio de almacenamiento que se analiza, el tipo y la cantidad de infotipos que buscas, la región en la que se procesa el trabajo y los recursos de procesamiento disponibles en esa región. Por lo tanto, la latencia de los trabajos de inspección no se puede determinar con anticipación.

Para ayudar a reducir la latencia del trabajo, puedes probar con las siguientes opciones:

  • Si el muestreo está disponible para tu trabajo o activador de trabajo, habilítalo.
  • Evita habilitar Infotipos que no necesitas. Aunque los siguientes son útiles en ciertas situaciones, estos Infotipos pueden hacer que las solicitudes se ejecuten mucho más lento que las solicitudes que no las incluyen:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Especifica siempre los Infotipos de forma explícita. No uses una lista de Infotipos vacía.

  • Si es posible, usa una región de procesamiento diferente.

Si aún tienes problemas de latencia con los trabajos después de probar estas técnicas, considera usar solicitudes content.inspect o content.deidentify en lugar de trabajos. Estos métodos están cubiertos por el Acuerdo de Nivel de Servicio. Para obtener más información, consulta el Acuerdo de Nivel de Servicio de Protección de Datos Sensibles.

Analiza solo el contenido nuevo

Puedes configurar el activador de trabajo para establecer de forma automática la fecha del período de los archivos almacenados en Cloud Storage o BigQuery. Cuando configuras el objeto TimespanConfig para que se propague automáticamente, la Protección de datos sensibles solo analiza los datos que se agregaron o modificaron desde la última vez que se ejecutó el activador:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Activa trabajos en la carga de archivos

Además de la compatibilidad con activadores de trabajo, que está integrada en la Protección de datos sensibles, Google Cloud también cuenta con una variedad de otros componentes que puedes usar para integrar o activar trabajos de protección de datos sensibles. Por ejemplo, puedes usar Cloud Functions para activar un análisis de protección de datos sensibles cada vez que se suba un archivo a Cloud Storage.

Para obtener información sobre cómo configurar esta operación, consulta Automatiza la clasificación de los datos subidos a Cloud Storage.