Rilevatori di infoType personalizzati

Sensitive Data Protection contiene molti detector di infoType integrati, ma puoi anche crearne di personalizzati. Puoi personalizzare il comportamento di rilevamento definendo i tuoi rilevatori di infoType personalizzati, in modo che Sensitive Data Protection ispezioni o anonimizzi i dati sensibili che corrispondono ai pattern specificati. Di seguito sono riportati i tipi di rivelatori di infoType personalizzati:

  • I rilevatori di dizionari personalizzati regolari sono semplici elenchi di parole e frasi che Sensitive Data Protection confronta. Utilizza i rilevatori di dizionari personalizzati regolari quando hai al massimo diverse centinaia di migliaia di parole.
  • I rilevatori di dizionari personalizzati di grandi dimensioni vengono generati da Sensitive Data Protection utilizzando elenchi di parole o frasi di grandi dimensioni archiviati in Cloud Storage o BigQuery. Utilizza i rilevatori di dizionari personalizzati di grandi dimensioni quando hai un elenco di parole o frasi di grandi dimensioni, fino a decine di milioni.
  • I rilevatori di espressioni regolari (regex) consentono a Sensitive Data Protection di rilevare le corrispondenze in base a un pattern di espressione regolare.
  • I rilevatori di infoType surrogati rilevano l'output della trasformazione di deidentificazione di Sensitive Data Protection CryptoReplaceFfxFpeConfig. Questo rilevatore di infoType personalizzato viene utilizzato solo con il metodo content:reidentify per invertire l'anonimizzazione utilizzando la crittografia con protezione del formato (FPE) in modalità FFX. Per questo motivo, i surrogati non sono descritti in modo esaustivo in questi argomenti. Per ulteriori informazioni su come e quando utilizzare i rilevatori di infoType personalizzati surrogati, consulta Pseudonimizzazione.

Inoltre, Sensitive Data Protection include il concetto di regole di ispezione, che ti consentono di perfezionare i risultati della scansione utilizzando quanto segue:

  • Le regole di esclusione ti consentono di escludere risultati falsi o indesiderati aggiungendo regole a un rilevatore infoType integrato o personalizzato.
  • Le regole per hotword ti consentono di aumentare la quantità o l'accuratezza dei risultati restituiti aggiungendo regole a un rilevatore infoType integrato o personalizzato.

Per saperne di più sui rilevatori di infoType personalizzati, consulta la pagina dei concetti InfoType e rilevatori di infoType. Per diversi esempi che puoi utilizzare o modificare come preferisci, consulta Esempi di rilevatori di infoType personalizzati. Il resto di questo argomento descrive come utilizzare Sensitive Data Protection per creare rilevatori di infoType personalizzati.

Dove utilizzare i rilevatori di infoType personalizzati

I rilevatori di infoType personalizzati sono definiti nell'oggetto CustomInfoType. Quando configuri quanto segue, devi specificare un CustomInfoType nell'oggetto InspectConfig:

Panoramica dell'API

L'oggetto CustomInfoType ti consente di creare un rilevatore di infoType personalizzato per nuovi contenuti o di ottimizzare i risultati restituiti dai rilevatori di infoType predefiniti.

L'oggetto CustomInfoType è composto dai seguenti campi, impostati come descritto:

  • "infotype": il nome del rilevatore di InfoType personalizzato, contenuto in un oggetto InfoType.
  • "likelihood": il valore Likelihood predefinito da restituire per questo rilevatore di InfoType personalizzato. Puoi specificare valori Likelihood alternativi in "detectionRules" che sostituiranno questo valore Likelihood di base se il risultato soddisfa i criteri specificati dalla regola. Se non includi il campo "likelihood", il rilevatore di infoType personalizzato utilizza VERY_LIKELY come valore predefinito. Per saperne di più sulla probabilità, consulta la pagina dei concetti relativi alla probabilità.
  • "detectionRules": un insieme di oggetti DetectionRule da applicare anche a tutti i risultati di questo rilevatore di tipo di infoType personalizzato. È qui che specifichi le regole per le hotword, come oggetti HotwordRule. Le regole vengono applicate nell'ordine in cui vengono specificate. Questo campo non si applica agli oggetti SurrogateType.
  • "sensitivityScore": Il valore SensitivityScore da restituire per questo rilevatore di InfoType personalizzato. Se non includi il campo "sensitivityScore", il rilevatore di infoType personalizzato viene impostato per impostazione predefinita su VERY_LIKELY.

    I punteggi di sensibilità vengono utilizzati nei profili dei dati. Durante la profilazione dei dati, Sensitive Data Protection utilizza i punteggi di sensibilità degli infoType per calcolare il livello di sensibilità.

  • Uno dei seguenti campi, a seconda del tipo di rilevatore di infoType personalizzato che stai creando:

    • "dictionary": un oggetto Dictionary, che contiene un elenco di parole o frasi da cercare.
    • "regex": un oggetto Regex che contiene un singolo pattern che definisce l'espressione regolare.
    • "surrogateType": un oggetto SurrogateType, se presente, indica che il rilevatore di InfoType personalizzato è un surrogato. Per ulteriori informazioni su come utilizzare i rilevatori di infoType personalizzati surrogati, consulta la sezione Pseudonimizzazione.
    • "storedType": un riferimento a un oggetto StoredInfoType esistente. Questo campo è obbligatorio quando si crea un rilevatore di dizionari personalizzato di grandi dimensioni. Anche se puoi creare rilevatori di dizionari regolari o espressioni regolari definendo questo campo, è più semplice crearli definendo rispettivamente il campo dictionary o il campo regex.

Passaggi successivi

Scopri di più sulla creazione di infoType personalizzati nei seguenti argomenti: