Utilizzare Sensitive Data Protection con Cloud Data Fusion

Questa guida spiega come utilizzare Sensitive Data Protection con Cloud Data Fusion.

Cloud Data Fusion fornisce un plug-in Sensitive Data Protection che offre tre trasformazioni che possono filtrare, oscurare o decriptare i dati sensibili:

  • La trasformazione Filtro PII consente di filtrare i record sensibili da uno stream di dati di input.

  • La trasformazione Oscura consente di trasformare i dati sensibili, ad esempio nascondendoli o criptandoli.

  • La trasformazione Decripta ti consente di decriptare i dati sensibili precedentemente criptati utilizzando la trasformazione Oscura.

Costi

In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:

Per generare una stima dei costi in base all'utilizzo previsto, utilizza il Calcolatore prezzi. I nuovi Google Cloud utenti potrebbero avere diritto a una prova gratuita.

Prima di iniziare

  1. Nella console Google Cloud, vai alla pagina di selezione del progetto e seleziona o crea un progetto.

    Vai al selettore dei progetti

  2. Abilita l'API Cloud Data Fusion per il tuo progetto.

    Attiva l'API Cloud Data Fusion

  3. Abilita l'API DLP (parte di Sensitive Data Protection) per il tuo progetto.

    Attiva l'API DLP

  4. Crea un'istanza Cloud Data Fusion.

Concedi le autorizzazioni Sensitive Data Protection

  1. Nella console Google Cloud, vai alla pagina IAM.

    Vai a IAM

  2. Nella tabella delle autorizzazioni, seleziona uno dei seguenti account di servizio nella colonna Principale:

    1. Per l'autorizzazione alle risorse in fase di esecuzione, seleziona l'account di servizio utilizzato dal tuo cluster Dataproc. Il valore predefinito è l'account di servizio Compute Engine, che non è consigliato per motivi di sicurezza

    2. Per l'autorizzazione alle risorse quando utilizzi Wrangler o Preview in Cloud Data Fusion (non in fase di esecuzione), seleziona invece l'account di servizio corrispondente al formato:service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Fai clic sull'icona a forma di matita a destra del service account.

  4. Fai clic su Aggiungi un altro ruolo.

  5. Fai clic sul menu a discesa visualizzato.

  6. Utilizza la barra di ricerca per eseguire una ricerca, quindi seleziona Amministratore DLP.

  7. Fai clic su Salva. Verifica che Amministratore DLP sia visualizzato nella colonna Ruolo.

Esegui il deployment del plug-in Sensitive Data Protection

  1. Vai all'istanza:

    1. Nella console Google Cloud, vai alla pagina Cloud Data Fusion.

    2. Per aprire l'istanza in Cloud Data Fusion Studio, fai clic su Istanze e poi su Visualizza istanza.

      Vai a Istanze

  2. Nell'interfaccia utente web di Cloud Data Fusion, fai clic su Hub in alto a destra.

  3. Fai clic sul plug-in Prevenzione della perdita di dati.

  4. Fai clic su Esegui il deployment.

  5. Fai clic su Fine.

  6. Fai clic su Crea una pipeline.

Utilizzare la trasformazione Filtro PII

Questa trasformazione separa i record sensibili da quelli non sensibili. Un record è considerato sensibile se corrisponde ai criteri che definisci in un modello di Sensitive Data Protection. Ad esempio, quando crei il modello, puoi definire i dati sensibili come dati della carta di credito o codici fiscali.

  1. Crea un modello di ispezione di Sensitive Data Protection.

  2. Apri la pipeline in Cloud Data Fusion e fai clic su Studio > Trasforma.

  3. Fai clic sulla trasformazione Filtro PII.

  4. Tieni il puntatore sul nodo Filtro PII e fai clic su Proprietà.

  5. In Filtra per, scegli se filtrare i record o i campi.

    In conformità con i limiti di Sensitive Data Protection, se un record supera 0,5 MB, la pipeline Cloud Data Fusion non andrà a buon fine. Per evitare questo errore, filtra per campo anziché per record.

  6. In ID modello, inserisci l'ID del modello di Sensitive Data Protection che hai creato.

  7. In Gestione degli errori, definisci la procedura da seguire quando la pipeline rileva dati sensibili. Scegli una delle seguenti opzioni di gestione degli errori:

    • Interrompi pipeline: arresta la pipeline non appena viene rilevato un errore.
    • Salta record: salta il record che ha causato l'errore. La pipeline continua a funzionare e non viene segnalato alcun errore.
    • Invia a errore: invia gli errori alla porta di errore. La pipeline continua a eseguire.
  8. Fai clic sul pulsante X.

Utilizzare la trasformazione Oscuramento

Questa trasformazione identifica i record sensibili nello stream di input e applica a questi record le trasformazioni che definisci. Un record è considerato sensibile se corrisponde ai filtri di Sensitive Data Protection predefiniti che hai scelto o a un modello personalizzato che hai definito.

  1. Nella pagina Studio dell'interfaccia utente web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.

  2. Fai clic sulla trasformazione Oscuramento.

  3. Tieni il puntatore sul nodo Oscuramento e fai clic su Proprietà.

  4. Scegli se applicare le trasformazioni ai filtri predefiniti o se vuoi crearne uno tuo.

    Non puoi combinare queste due opzioni. Puoi utilizzare i filtri predefiniti OPPURE creare un modello personalizzato.

    Per applicare le trasformazioni ai filtri predefiniti, lascia Modello personalizzato impostato su No e definisci una regola in Corrispondenza:

    1. Dopo Applica, fai clic sul menu a discesa e scegli una trasformazione. Scopri di più sulle trasformazioni disponibili nella sezione Descrizione della scheda Documentazione del plug-in.

    2. Dopo aver selezionato On, fai clic sul menu a discesa e scegli una categoria, ovvero un insieme di filtri di protezione dei dati sensibili predefiniti raggruppati per tipo. Per l'elenco completo delle categorie fornite e dei filtri che contengono, consulta la sezione Mappatura dei filtri DLP nella scheda Documentazione del plug-in.

    Per impostare più regole di corrispondenza, fai clic sul pulsante +.

    Per applicare le trasformazioni in base a un modello personalizzato, imposta Modello personalizzato su .

    1. Crea un modello Sensitive Data Protection personalizzato.

    2. Torna all'interfaccia utente web di Cloud Data Fusion, nel menu Oscura proprietà, in ID modello, inserisci l'ID del modello personalizzato che hai creato.

  5. Fai clic sul pulsante X.

Utilizzare la trasformazione Decripta

Questa trasformazione identifica i record criptati utilizzando Sensitive Data Protection nello stream di input e applica la decrittografia. Solo i record criptati con un algoritmo reversibile come la crittografia con protezione del formato o la crittografia deterministica possono essere decriptati.

  1. Nella pagina Studio dell'interfaccia utente web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.

  2. Fai clic sulla trasformazione Decripta.

  3. Tieni il puntatore sul nodo Decripta e fai clic su Proprietà.

  4. Inserisci gli stessi valori utilizzati per configurare il plug-in Oscuramento che ha criptato questi dati. Le proprietà di questo plug-in sono identiche a quelle del plug-in Oscuramento.

  5. Fai clic sul pulsante X.

Passaggi successivi