Job e trigger di job

Un job è un'azione eseguita da Sensitive Data Protection per analizzare i contenuti alla ricerca di dati sensibili o calcolare il rischio di reidentificazione. Sensitive Data Protection crea ed esegue una risorsa job ogni volta che gli chiedi di controllare i tuoi dati.

Attualmente esistono due tipi di job di Sensitive Data Protection:

  • I job di ispezione esaminano i tuoi contenuti per individuare dati sensibili in base ai tuoi criteri e generano report di riepilogo sulla posizione e sul tipo di dati sensibili esistenti.
  • I job di analisi del rischio analizzano dati anonimizzati e restituiscono metriche sulla probabilità che i dati possano essere reidentificati.

Puoi pianificare l'esecuzione dei job da parte di Sensitive Data Protection creando attivatori di job. Un trigger di job è un evento che automatizza la creazione di job di Sensitive Data Protection per la scansione dei repository di Google Cloud Storage, inclusi bucket Cloud Storage, tabelle BigQuery e tipi di datastore.

I trigger di job consentono di pianificare job di scansione impostando gli intervalli di attivazione di ogni trigger. Possono essere configurati in modo da cercare nuovi risultati dall'esecuzione dell'ultima scansione per monitorare le modifiche o le aggiunte ai contenuti o per generare report aggiornati sui risultati. I trigger pianificati vengono eseguiti in base a un intervallo impostato, da 1 giorno a 60 giorni.

Passaggi successivi

Ulteriori informazioni su come creare, modificare ed eseguire job e trigger di job nei seguenti argomenti:

È inoltre disponibile la seguente guida rapida:

L'oggetto JobTrigger

Un trigger di job è rappresentato nell'API DLP dall'oggetto JobTrigger.

Campi di configurazione dell'attivatore di job

Ogni JobTrigger contiene diversi campi di configurazione, tra cui:

  • Il nome e il nome visualizzato dell'attivatore, nonché una descrizione.
  • Una raccolta di oggetti Trigger, ognuno dei quali contiene un oggetto Schedule, che definisce la ricorrenza della scansione in secondi.
  • Un oggetto InspectJobConfig contenente le informazioni di configurazione per il job attivato.
  • Un'enumerazione Status, che indica se il trigger è attualmente attivo.
  • Campi timestamp che rappresentano gli orari di creazione, aggiornamento e ultima esecuzione.
  • Una raccolta di oggetti Error, se presenti al momento dell'attivazione del trigger.

Metodi di trigger di job

Ogni oggetto JobTrigger include anche diversi metodi integrati. Con questi metodi puoi:

Latenza job

Non sono garantiti obiettivi del livello di servizio (SLO) per job e trigger di job. La latenza è influenzata da diversi fattori, tra cui la quantità di dati da scansionare, il repository di archiviazione analizzato, il tipo e il numero di infoType in fase di scansione, la regione in cui viene elaborato il job e le risorse di calcolo disponibili in quella regione. Pertanto, la latenza dei job di ispezione non può essere determinata in anticipo.

Per ridurre la latenza del job, puoi provare quanto segue:

  • Se il campionamento è disponibile per il job o il trigger di job, abilitalo.
  • Evita di attivare gli infoType che non ti servono. Sebbene quanto segue sia utile in determinati scenari, questi infoType possono eseguire le richieste molto più lentamente rispetto a quelle che non le includono:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Specifica sempre gli infoType in modo esplicito. Non utilizzare un elenco infoType vuoto.

  • Se possibile, utilizza una regione di elaborazione diversa.

Se continui ad avere problemi di latenza con i job dopo aver provato queste tecniche, valuta la possibilità di utilizzare le richieste content.inspect o content.deidentify anziché i job. Questi metodi sono coperti dal Contratto sul livello del servizio. Per maggiori informazioni, consulta l'Accordo sul livello del servizio di Sensitive Data Protection.

Limita le scansioni ai nuovi contenuti

Puoi configurare il trigger di job in modo che imposti automaticamente la data dell'intervallo di tempo per i file archiviati in Cloud Storage o BigQuery. Quando imposti il completamento automatico dell'oggetto TimespanConfig, Sensitive Data Protection analizza solo i dati aggiunti o modificati dall'ultima esecuzione dell'attivatore:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Attiva job al caricamento file

Oltre al supporto per i trigger di job, integrati in Sensitive Data Protection, Google Cloud offre anche una varietà di altri componenti che puoi utilizzare per integrare o attivare job di Sensitive Data Protection. Ad esempio, puoi utilizzare Cloud Functions per attivare una scansione di Sensitive Data Protection ogni volta che un file viene caricato in Cloud Storage.

Per informazioni su come configurare questa operazione, consulta Automazione della classificazione dei dati caricati in Cloud Storage.