Utilizzare Sensitive Data Protection con Cloud Data Fusion

Questa guida spiega come utilizzare Sensitive Data Protection con Cloud Data Fusion.

Cloud Data Fusion fornisce un plug-in Sensitive Data Protection che fornisce tre trasformazioni che possono filtrare, oscurare o decriptare i dati sensibili:

  • La trasformazione Filtro PII ti consente di filtrare i record sensibili da un flusso di dati di input.

  • La trasformazione Oscura ti consente di trasformare i dati sensibili, ad esempio mascherandoli o criptandoli.

  • La trasformazione Decripta consente di decriptare i dati sensibili precedentemente criptati utilizzando la trasformazione Annulla dati sensibili.

Costi

In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:

Per generare una stima dei costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.

I nuovi utenti di Google Cloud potrebbero avere diritto a una prova senza costi.

Prima di iniziare

  1. Nella console Google Cloud , vai alla pagina di selezione del progetto e seleziona o crea un progetto.

    Vai al selettore dei progetti

  2. Attiva l'API Cloud Data Fusion per il tuo progetto.

    Abilita l'API Cloud Data Fusion

  3. Abilita l'API DLP (parte di Sensitive Data Protection) per il tuo progetto.

    Abilita l'API DLP

  4. Crea un'istanza Cloud Data Fusion.

Concedere le autorizzazioni Sensitive Data Protection

  1. Nella console Google Cloud , vai alla pagina IAM.

    Vai a IAM

  2. Nella tabella delle autorizzazioni, seleziona uno dei seguenti service account nella colonna Entità:

    1. Per l'autorizzazione alle risorse in fase di runtime, seleziona il account di servizio utilizzato dal cluster Dataproc. Il valore predefinito è il account di servizio Compute Engine, che non è consigliato per motivi di sicurezza

    2. Per l'autorizzazione alle risorse quando utilizzi Wrangler o Anteprima in Cloud Data Fusion (non in fase di runtime), seleziona invece il service account che corrisponde al formato: service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Fai clic sull'icona a forma di matita a destra del account di servizio.

  4. Fai clic su Aggiungi un altro ruolo.

  5. Fai clic sul menu a discesa visualizzato.

  6. Utilizza la barra di ricerca per cercare e selezionare Amministratore DLP.

  7. Fai clic su Salva. Verifica che Amministratore DLP venga visualizzato nella colonna Ruolo.

Esegui il deployment del plug-in Sensitive Data Protection

  1. Vai all'istanza:

    1. Nella Google Cloud console, vai alla pagina Cloud Data Fusion.

    2. Per aprire l'istanza in Cloud Data Fusion Studio, fai clic su Istanze e poi su Visualizza istanza.

      Vai a Istanze

  2. Nella UI web di Cloud Data Fusion, fai clic su Hub in alto a destra.

  3. Fai clic sul plug-in Prevenzione della perdita di dati.

  4. Fai clic su Esegui il deployment.

  5. Fai clic su Fine.

  6. Fai clic su Crea una pipeline.

Utilizzare la trasformazione Filtro PII

Questa trasformazione separa i record sensibili da quelli non sensibili. Un record è considerato sensibile se corrisponde ai criteri definiti in un modello Sensitive Data Protection. Ad esempio, quando crei il modello, puoi definire i dati sensibili come informazioni della carta di credito o codici fiscali.

  1. Crea un modello di ispezione di Sensitive Data Protection.

  2. Apri la pipeline in Cloud Data Fusion e fai clic su Studio > Trasforma.

  3. Fai clic sulla trasformazione Filtro PII.

  4. Tieni il puntatore sul nodo PII Filter (Filtro PII) e fai clic su Properties (Proprietà).

  5. In Filtra in base a, scegli se vuoi filtrare i record o i campi.

    In conformità con i limiti di Sensitive Data Protection, se un record supera 0,5 MB, la pipeline Cloud Data Fusion non andrà a buon fine. Per evitare questo errore, filtra per campo anziché per record.

  6. In ID modello, inserisci l'ID modello del modello Sensitive Data Protection che hai creato.

  7. In Gestione degli errori, definisci come procedere quando la pipeline rileva dati sensibili. Scegli una delle seguenti opzioni di gestione degli errori:

    • Arresta pipeline: arresta la pipeline non appena viene rilevato un errore.
    • Salta record: salta il record che ha causato l'errore. La pipeline continua a essere eseguita e non viene segnalato alcun errore.
    • Invia a errore: invia gli errori alla porta degli errori. La pipeline continua a essere eseguita.
  8. Fai clic sul pulsante X.

Utilizzare la trasformazione Oscura

Questa trasformazione identifica i record sensibili nel flusso di input e applica le trasformazioni che definisci a questi record. Un record è considerato sensibile se corrisponde ai filtri Sensitive Data Protection predefiniti che hai scelto o a un modello personalizzato che hai definito.

  1. Nella pagina Studio della UI web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.

  2. Fai clic sulla trasformazione Oscura.

  3. Tieni il puntatore sul nodo Redact (Oscura) e fai clic su Properties (Proprietà).

  4. Scegli se applicare le trasformazioni ai filtri predefiniti o se vuoi crearne di tuoi.

    Non puoi combinare queste due opzioni. Puoi utilizzare filtri predefiniti OPPURE creare un modello personalizzato.

    Filtri predefiniti

    Per applicare trasformazioni ai filtri predefiniti, lascia Modello personalizzato impostato su No e definisci una regola in Corrispondenza:

    1. Dopo aver fatto clic su Applica, fai clic sul menu a discesa e scegli una trasformazione. Scopri di più sulle trasformazioni disponibili nella sezione Descrizione della scheda Documentazione del plug-in.

    2. In Su, fai clic sul menu a discesa e scegli una categoria, ovvero un insieme di filtri di protezione dei dati sensibili predefiniti raggruppati per tipo. Per l'elenco completo delle categorie fornite e dei filtri che contengono, consulta la sezione Mappatura dei filtri DLP nella scheda Documentazione del plug-in.

    Per impostare più regole di corrispondenza, fai clic sul pulsante +.

    Modello personalizzato

    Per applicare le trasformazioni in base a un modello personalizzato, imposta Modello personalizzato su .

    1. Crea un modello Sensitive Data Protection personalizzato.

    2. Nella UI web di Cloud Data Fusion, nel menu Oscura proprietà, in ID modello, inserisci l'ID modello del modello personalizzato che hai creato.

  5. Fai clic sul pulsante X.

Utilizzare la trasformazione Decrittografa

Questa trasformazione identifica i record criptati utilizzando Sensitive Data Protection nel flusso di input e applica la decriptazione. Possono essere decriptati solo i record criptati utilizzando un algoritmo reversibile come la crittografia con protezione del formato (FPE) o la crittografia deterministica.

  1. Nella pagina Studio della UI web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.

  2. Fai clic sulla trasformazione Decrittografa.

  3. Tieni il puntatore sul nodo Decrypt (Decrittografa) e fai clic su Properties (Proprietà).

  4. Inserisci gli stessi valori utilizzati per configurare il plug-in Redact che ha criptato questi dati. Le proprietà di questo plug-in sono identiche a quelle del plug-in Redact.

  5. Fai clic sul pulsante X.

Passaggi successivi