Questa guida spiega come utilizzare Sensitive Data Protection con Cloud Data Fusion.
Cloud Data Fusion fornisce un plug-in Sensitive Data Protection che offre tre trasformazioni che possono filtrare, oscurare o decriptare i dati sensibili:
La trasformazione Filtro PII ti consente di filtrare i record sensibili da un un flusso di dati di input.
La trasformazione Oscura ti consente di trasformare i dati sensibili, ad esempio il mascheramento o la crittografia dei dati.
La trasformazione Decripta ti consente di decriptare i dati sensibili precedentemente criptati utilizzando la trasformazione Oscura.
Costi
In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:
Per generare una stima dei costi basata sull'utilizzo previsto,
utilizza il Calcolatore prezzi.
Prima di iniziare
Nella console Google Cloud, vai alla pagina del selettore progetti e seleziona o per creare un progetto.
Abilitare l'API Cloud Data Fusion per il tuo progetto.
Abilita l'API DLP (parte di Sensitive Data Protection) per il tuo progetto.
Concedi le autorizzazioni di Sensitive Data Protection
Nella console Google Cloud, vai alla pagina IAM.
Nella tabella delle autorizzazioni, seleziona uno dei seguenti account di servizio nella colonna Entità:
Per l'autorizzazione alle risorse in fase di runtime, seleziona l'account di servizio utilizzate dal cluster Dataproc. L'impostazione predefinita è Compute Engine, account di servizio, sconsigliato per motivi di sicurezza
Per l'autorizzazione alle risorse quando utilizzi Wrangler o Preview in Cloud Data Fusion (non in fase di esecuzione), seleziona l'account di servizio corrispondente al formato:
service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com
.
Fai clic sull'icona a forma di matita a destra dell'account di servizio.
Fai clic su Aggiungi un altro ruolo.
Fai clic sul menu a discesa visualizzato.
Utilizza la barra di ricerca per eseguire una ricerca, quindi seleziona Amministratore DLP.
Fai clic su Salva. Verifica che nella colonna Ruolo sia visualizzato Amministratore DLP.
Esegui il deployment del plug-in Sensitive Data Protection
Vai all'istanza:
Nella console Google Cloud, vai alla pagina di Cloud Data Fusion.
Per aprire l'istanza in Cloud Data Fusion Studio: Fai clic su Istanze e poi su Visualizza istanza.
Nell'interfaccia utente web di Cloud Data Fusion, fai clic su Hub in alto a destra.
Fai clic sul plug-in Prevenzione della perdita di dati.
Fai clic su Esegui il deployment.
Fai clic su Fine.
Fai clic su Crea una pipeline.
Utilizza la trasformazione del filtro PII
Questa trasformazione separa i record sensibili da quelli non sensibili. Un record è considerato sensibile se corrisponde ai criteri che definisci in un modello di Sensitive Data Protection. Ad esempio, quando crei il modello, puoi definire i dati sensibili come dati della carta di credito o codici fiscali.
Apri la pipeline in Cloud Data Fusion e fai clic su Studio > Trasforma.
Fai clic sulla trasformazione Filtro PII.
Tieni il puntatore sopra il nodo Filtro PII e fai clic su Proprietà.
In Filtra in base a, scegli se filtrare record o campi.
In conformità con i limiti di Sensitive Data Protection, Se un record supera 0,5 MB, la pipeline Cloud Data Fusion avrà esito negativo. Per evitare questo errore, filtra per campo anziché "record".
In ID modello, inserisci l'ID del modello di Sensitive Data Protection che hai creato.
In Gestione degli errori, definisci come procedere quando la pipeline incontra e i dati sensibili. Scegli una delle seguenti opzioni di gestione degli errori:
- Arresta pipeline: arresta la pipeline non appena si verifica un errore.
- Salta record: salta il record che ha causato l'errore. La pipeline continua a funzionare e non viene segnalato alcun errore.
- Invia all'errore: invia gli errori alla porta di errore. La pipeline continua vengono eseguiti tutti i test delle unità.
Fai clic sul pulsante X.
Utilizza la trasformazione Oscura
Questa trasformazione identifica i record sensibili nello stream di input e applica a questi record le trasformazioni che definisci. Un record viene considerato sensibile se corrisponde ai filtri predefiniti di Sensitive Data Protection che hai scelto o un modello personalizzato da te definito.
Nella pagina Studio dell'interfaccia utente web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.
Fai clic sulla trasformazione Oscuramento.
Tieni il puntatore sopra il nodo Oscura e fai clic su Proprietà.
Scegli se applicare le trasformazioni ai filtri predefiniti o se vuoi crearne uno personalizzato.
Non puoi combinare queste due opzioni. Puoi utilizzare i filtri predefiniti OPPURE creare un modello personalizzato.
Filtri predefiniti
Per applicare le trasformazioni ai filtri predefiniti, lascia la casella Modello impostato su No e, in Corrispondenza, definisci una regola:
In Applica, fai clic sul menu a discesa e scegli una trasformazione. Scopri di più sulle trasformazioni disponibili nella sezione Descrizione della scheda Documentazione del plug-in.
Dopo aver selezionato On, fai clic sul menu a discesa e scegli una categoria, ovvero un insieme di filtri di protezione dei dati sensibili predefiniti raggruppati per tipo. Per l'elenco completo delle categorie fornite e dei filtri che contengono, consulta la sezione Mappatura dei filtri DLP nella scheda Documentazione del plug-in.
Per impostare più regole di corrispondenza, fai clic sul pulsante +.
Modello personalizzato
Per applicare le trasformazioni in base a un modello personalizzato, imposta Modello personalizzato su Sì.
Crea un modello personalizzato di Sensitive Data Protection.
Torna alla UI web di Cloud Data Fusion, nelle proprietà Oscura nel menu ID modello, inserisci l'ID modello dell'elemento che hai creato.
Fai clic sul pulsante X.
Utilizza la trasformazione Decrypt
Questa trasformazione identifica i record criptati utilizzando Sensitive Data Protection nel flusso di input e applica la decriptazione. Solo i record criptati utilizzando un algoritmo reversibile come Crittografia con protezione del formato o La crittografia deterministica può essere decriptata.
Nella pagina Studio dell'interfaccia utente web di Cloud Data Fusion, fai clic per espandere il menu Trasforma.
Fai clic sulla trasformazione Decripta.
Tieni il puntatore sopra il nodo Decripta e fai clic su Proprietà.
Inserisci gli stessi valori utilizzati per configurare il plug-in Oscura ha criptato questi dati. Le proprietà di questo plug-in sono identiche a quelle del plug-in Oscuramento.
Fai clic sul pulsante X.
Passaggi successivi
- Segui un tutorial per oscurare i dati utente sensibili.
- Scopri di più su Sensitive Data Protection.