Rilevatori infoType personalizzati

Sensitive Data Protection contiene molti rilevatori di infoType integrati, ma puoi anche crearne di nuovi. Puoi personalizzare il comportamento di rilevamento definendo i tuoi rilevatori infoType personalizzati, in modo che Sensitive Data Protection esamini o anonimizzi i dati sensibili che corrispondono ai pattern da te specificati. Di seguito sono riportati i tipi di rilevatori di infoType personalizzati:

  • I rilevatori di dizionari personalizzati normali sono semplici elenchi di parole e frasi in cui vengono trovate corrispondenze con la protezione dei dati sensibili. Usa rilevatori di dizionari personalizzati normali quando hai al massimo diverse centinaia di migliaia di parole.
  • I rilevatori di dizionari personalizzati di grandi dimensioni vengono generati da Sensitive Data Protection utilizzando lunghi elenchi di parole o frasi archiviate in Cloud Storage o BigQuery. Usa rilevatori di dizionari personalizzati di grandi dimensioni quando hai un lungo elenco di parole o frasi, fino a decine di milioni.
  • I rilevatori di espressioni regolari (regex) consentono a Sensitive Data Protection di rilevare le corrispondenze in base a un modello di espressioni regolari.
  • I rilevatori di infoType surrogati rilevano l'output della trasformazione di anonimizzazione di Sensitive Data Protection CryptoReplaceFfxFpeConfig. Questo rilevatore di infoType personalizzato viene utilizzato solo con il metodo content:reidentify per annullare l'anonimizzazione mediante la crittografia con protezione del formato (FPE) in modalità FFX. Per questo motivo, i surrogati non sono descritti in modo dettagliato in questi argomenti. Per ulteriori informazioni su come e quando utilizzare rilevatori di infoType personalizzati, consulta la sezione Assegnazione di pseudonimi.

Inoltre, Sensitive Data Protection include il concetto di regole di ispezione, che consentono di ottimizzare i risultati della scansione utilizzando quanto segue:

  • Le regole di esclusione consentono di escludere risultati falsi o indesiderati aggiungendo regole a un rilevatore infoType integrato o personalizzato.
  • Le regole hotword consentono di aumentare la quantità o la precisione dei risultati restituiti aggiungendo regole a un rilevatore infoType integrato o personalizzato.

Per ulteriori informazioni sui rilevatori di infoType personalizzati, consulta la pagina concettuale InfoType e rilevatori infoType. Per alcuni esempi che puoi utilizzare o modificare a tuo piacimento, vedi Esempi di rilevatori infoType personalizzati. Il resto di questo argomento descrive come utilizzare Sensitive Data Protection per creare rilevatori infoType personalizzati.

Dove utilizzare i rilevatori infoType personalizzati

I rilevatori infoType personalizzati sono definiti nell'oggetto CustomInfoType. Puoi specificare un valore CustomInfoType nell'oggetto InspectConfig durante la configurazione di quanto segue:

Panoramica dell'API

L'oggetto CustomInfoType ti consente di creare un rilevatore infoType personalizzato per i nuovi contenuti o di perfezionare i risultati restituiti dai rilevatori infoType predefiniti.

L'oggetto CustomInfoType è composto dai seguenti campi, impostati come descritto:

  • "infotype": il nome del rilevatore infoType personalizzato, contenuto in un oggetto InfoType.
  • "likelihood": il valore predefinito di Likelihood da restituire per questo rilevatore infoType personalizzato. Puoi specificare valori alternativi Likelihood in "detectionRules" che sostituiranno questa base Likelihood se il risultato soddisfa i criteri specificati dalla regola. Se non includi il campo "likelihood", per impostazione predefinita il rilevatore infoType personalizzato è VERY_LIKELY. Per ulteriori informazioni sulla probabilità, consulta la pagina del concetto di Probabilità.
  • "detectionRules": un insieme di oggetti DetectionRule da applicare in aggiunta a tutti i risultati di questo rilevatore infoType personalizzato. Qui puoi specificare le regole per le hotword, come oggetti HotwordRule. Le regole vengono applicate nell'ordine in cui sono specificate. Questo campo non si applica a SurrogateType oggetti.
  • "sensitivityScore": il valore SensitivityScore da restituire per questo rilevatore infoType personalizzato. Se non includi il campo "sensitivityScore", il rilevatore di infoType personalizzato è impostato su VERY_LIKELY per impostazione predefinita.

    I punteggi di sensibilità vengono utilizzati nei profili di dati. Durante la profilazione dei dati, Sensitive Data Protection utilizza i punteggi di sensibilità degli infoType per calcolare il livello di sensibilità.

  • Uno dei campi seguenti, a seconda del tipo di rilevatore di infoType personalizzato che stai creando:

    • "dictionary": un oggetto Dictionary che contiene un elenco di parole o frasi da cercare.
    • "regex": un oggetto Regex contenente un singolo pattern che definisce l'espressione regolare.
    • "surrogateType": un oggetto SurrogateType se presente, indica che il rilevatore infoType personalizzato è un surrogato. Per ulteriori informazioni su come utilizzare rilevatori di infoType personalizzati, consulta Assegnazione di pseudonimi.
    • "storedType": un riferimento a un oggetto StoredInfoType esistente. Questo campo è obbligatorio durante la creazione di un rilevatore di dizionari personalizzato di grandi dimensioni. Sebbene sia possibile creare rilevatori di dizionari regolari o rilevatori di espressioni regolari definendo questo campo, è più semplice crearli definendo rispettivamente il campo dictionary o il campo regex.

Passaggi successivi

Scopri di più sulla creazione di infoType personalizzati dai seguenti argomenti: