Un trabajo es una acción que ejecuta Protección de Datos Sensibles para analizar contenido en busca de datos sensibles o para calcular el riesgo de reidentificación. Protección de Datos Sensibles crea y ejecuta un recurso de tarea cuando le indicas que inspeccione tus datos.
Actualmente, hay dos tipos de tareas de Protección de Datos Sensibles:
- Los trabajos de inspección analizan su contenido para detectar datos sensibles según sus criterios y generan informes de resumen sobre dónde y qué tipo de datos sensibles hay.
- Los trabajos de análisis de riesgos analizan los datos anonimizados y devuelven métricas sobre la probabilidad de que se puedan reidentificar.
Puedes programar cuándo se ejecutan las tareas de Protección de Datos Sensibles creando activadores de tareas. Un activador de tareas es un evento que automatiza la creación de tareas de Protección de Datos Sensibles para analizar repositorios de almacenamiento, incluidos segmentos de Cloud Storage, tablas de BigQuery y tipos de Datastore. Google Cloud
Los activadores de trabajos te permiten programar trabajos de análisis configurando intervalos en los que se activará cada activador. Se pueden configurar para buscar nuevos resultados desde la última ejecución del análisis y, de esta forma, monitorizar los cambios o las adiciones al contenido, o bien para generar informes de resultados actualizados. Los activadores programados se ejecutan en un intervalo que usted define, de 1 a 60 días.
Pasos siguientes
Para obtener más información sobre cómo crear, editar y ejecutar tareas y activadores de tareas, consulte los siguientes temas:
- Crear tareas de inspección y activadores de tareas de Protección de Datos Sensibles
- Medir la reidentificación y el riesgo de divulgación (Se aplica a las tareas de análisis de riesgos).
Además, está disponible la siguiente guía de inicio rápido:
Objeto JobTrigger
En la API DLP, un activador de tareas se representa mediante el objeto JobTrigger
.
Campos de configuración de activadores de tareas
Cada JobTrigger
contiene varios campos de configuración, entre los que se incluyen los siguientes:
- El nombre y el nombre visible del activador, así como una descripción.
- Conjunto de objetos
Trigger
, cada uno de los cuales contiene un objetoSchedule
que define la recurrencia del análisis en segundos. - Un objeto
InspectJobConfig
que contiene la información de configuración del trabajo activado. - Una enumeración
Status
que indica si el activador está activo en ese momento. - Campos de marca de tiempo que representan las horas de creación, actualización y última ejecución.
- Colección de objetos
Error
, si se ha encontrado alguno, cuando se ha activado el activador.
Métodos de activadores de tareas
Cada objeto JobTrigger
también incluye varios métodos integrados. Con estos métodos, puedes hacer lo siguiente:
- Crea un activador de tarea:
projects.jobTriggers.create
- Para actualizar un activador de tarea:
projects.jobTriggers.patch
- Para eliminar un activador de tareas:
projects.jobTriggers.delete
- Recupera un activador de tareas, incluida su configuración y su estado:
projects.jobTriggers.get
- Lista de todos los activadores de trabajos:
projects.jobTriggers.list
Latencia de las tareas
No se garantiza ningún objetivo de nivel de servicio para los trabajos ni los activadores de trabajos. La latencia se ve afectada por varios factores, como la cantidad de datos que se van a analizar, el repositorio de almacenamiento que se va a analizar, el tipo y el número de infoTypes que se van a buscar, la región en la que se procesa el trabajo y los recursos de computación disponibles en esa región. Por lo tanto, la latencia de las tareas de inspección no se puede determinar de antemano.
Para reducir la latencia de los trabajos, puedes probar lo siguiente:
- Si el muestreo está disponible para tu tarea o activador de tareas, habilítalo.
Evita habilitar infoTypes que no necesites. Aunque los siguientes tipos de información son útiles en determinados casos, pueden hacer que las solicitudes se ejecuten mucho más lentamente que las que no los incluyen:
PERSON_NAME
FEMALE_NAME
MALE_NAME
FIRST_NAME
LAST_NAME
DATE_OF_BIRTH
LOCATION
STREET_ADDRESS
ORGANIZATION_NAME
Especifica siempre los infoTypes de forma explícita. No utilices una lista infoTypes vacía.
Si es posible, usa otra región de procesamiento.
Si sigues teniendo problemas de latencia con los trabajos después de probar estas técnicas, considera la posibilidad de usar solicitudes content.inspect
o content.deidentify
en lugar de trabajos. Estos métodos se rigen por el Acuerdo de Nivel de Servicio. Para obtener más información, consulta el acuerdo de nivel de servicio de Protección de Datos Sensibles.
Limitar el análisis solo al contenido nuevo
Puedes configurar el activador de la tarea para que defina automáticamente la fecha del periodo de los archivos almacenados en Cloud Storage o BigQuery. Cuando asignas el valor de autocompletar al objeto TimespanConfig
, Protección de Datos Sensibles solo analiza los datos que se han añadido o modificado desde la última vez que se activó el activador:
...
timespan_config {
enable_auto_population_of_timespan_config: true
}
...
En el caso de la inspección de BigQuery, solo se incluyen en el análisis las filas que tengan al menos tres horas. Consulta el problema conocido relacionado con esta operación.
Activar tareas al subir archivos
Además de la compatibilidad con los activadores de tareas, que está integrada en Protección de Datos Sensibles,Google Cloud también tiene otros componentes que puedes usar para integrar o activar tareas de Protección de Datos Sensibles. Por ejemplo, puedes usar Cloud Run Functions para activar un análisis de Protección de Datos Sensibles cada vez que se suba un archivo a Cloud Storage.
Para obtener información sobre cómo configurar esta operación, consulta el artículo Automatizar la clasificación de datos subidos a Cloud Storage.