Profila i dati di Vertex AI in un unico progetto

Questa pagina descrive come configurare la scoperta dei dati di Vertex AI a livello di progetto. Se vuoi creare il profilo di un'organizzazione o di una cartella, consulta Creare il profilo dei dati di Vertex AI in un'organizzazione o in una cartella.

Per partecipare a questa anteprima, invia un'email all'indirizzo cloud-dlp-feedback@google.com.

Per ulteriori informazioni sul servizio di rilevamento, consulta Profili di dati.

Prima di iniziare

  1. Assicurati che l'API Cloud Data Loss Prevention sia abilitata nel tuo progetto:

    1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    3. Make sure that billing is enabled for your Google Cloud project.

    4. Enable the required API.

      Enable the API

    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    6. Make sure that billing is enabled for your Google Cloud project.

    7. Enable the required API.

      Enable the API

  2. Verifica di disporre delle autorizzazioni IAM necessarie per configurare i profili di dati a livello di progetto.

  3. Devi avere un modello di ispezione in ogni regione in cui sono presenti i dati da profilare. Se vuoi utilizzare un unico modello per più regioni, puoi utilizzare un modello archiviato nella regione global. Se i criteri organizzativi ti impediscono di creare un modello di ispezione nella regione global, devi impostare un modello di ispezione dedicato per ogni regione. Per ulteriori informazioni, consulta Considerazioni sulla residenza dei dati.

    Questa attività ti consente di creare un modello di ispezione solo nella regione global. Se hai bisogno di modelli di ispezione dedicati per una o più regioni, devi crearli prima di eseguire questa operazione.

  4. Puoi configurare Sensitive Data Protection in modo che invii notifiche a Pub/Sub quando si verificano determinati eventi, ad esempio quando Sensitive Data Protection profila un nuovo set di dati. Se vuoi utilizzare questa funzionalità, devi prima creare un argomento Pub/Sub.

Creazione di una configurazione di scansione

  1. Vai alla pagina Crea configurazione scansione.

    Vai a Crea configurazione di scansione

  2. Vai al progetto. Nella barra degli strumenti, fai clic sul selettore dei progetti e seleziona il tuo progetto.

Le sezioni seguenti forniscono ulteriori informazioni sui passaggi nella pagina Crea configurazione di scansione. Al termine di ogni sezione, fai clic su Continua.

Seleziona un tipo di rilevamento

Seleziona Vertex AI.

Seleziona ambito

Esegui una di queste operazioni:

  • Se vuoi eseguire la scansione di un singolo set di dati, seleziona Esegui la scansione di un set di dati.

    Per ogni set di dati, puoi avere una sola configurazione di scansione di una singola risorsa. Per ulteriori informazioni, consulta Creare il profilo di una singola risorsa di dati.

    Inserisci i dettagli del set di dati di cui vuoi creare il profilo.

  • Se vuoi eseguire il profiling standard a livello di progetto, seleziona Scandina il progetto selezionato.

Gestisci pianificazioni

Se la frequenza di analisi predefinita soddisfa le tue esigenze, puoi saltare questa sezione della pagina Crea configurazione di analisi.

Configura questa sezione per i seguenti motivi:

  • Per apportare aggiustamenti granulari alla frequenza di profilazione di tutti i dati o di determinati sottoinsiemi di dati.
  • Per specificare i set di dati di cui non vuoi creare il profilo.
  • Per specificare i set di dati di cui non vuoi creare il profilo più di una volta.

Per apportare modifiche precise alla frequenza di profilazione:

  1. Fai clic su Aggiungi pianificazione.
  2. Nella sezione Filtri, definisci uno o più filtri che specificano quali set di dati rientrano nell'ambito della pianificazione.

    Specifica un ID progetto o un'espressione regolare che specifichi uno o più progetti. Le espressioni regolari devono seguire la sintassi RE2.

    Ad esempio, se vuoi che tutti i set di dati di un progetto vengano inclusi nel filtro, inserisci l'ID progetto nel campo Project ID (ID progetto).

    Se vuoi aggiungere altri filtri, fai clic su Aggiungi filtro e ripeti questo passaggio.

  3. Fai clic su Frequenza.

  4. Nella sezione Frequenza, specifica se il servizio di discovery deve creare il profilo dei set di dati selezionati e, in caso affermativo, con quale frequenza:

    • Se non vuoi mai che i set di dati vengano profilati, disattiva Esegui il profilo di questi dati.

    • Se vuoi che i set di dati vengano profilati almeno una volta, lascia attiva l'opzione Esegui il profilo di questi dati.

      Nei campi successivi di questa sezione, specifica se il sistema deve eseguire il nuovo profilo dei dati e quali eventi devono attivare un'operazione di nuovo profilo. Per ulteriori informazioni, consulta la sezione Frequenza di generazione del profilo dei dati.

      1. Per In base a una pianificazione, specifica la frequenza con cui vuoi eseguire il nuovo profilo dei set di dati. I set di dati vengono sottoposti a nuova profilazione indipendentemente dal fatto che siano stati modificati.
      2. Per Quando si esaminano le modifiche al modello, specifica se vuoi che i dati vengano riprofilati quando il modello di ispezione associato viene aggiornato e, in questo caso, con quale frequenza.

        Una modifica al modello di ispezione viene rilevata quando si verifica una delle seguenti condizioni:

        • Il nome di un modello di ispezione cambia nella configurazione della scansione.
        • Il valore updateTime di un modello di ispezione cambia.

      3. Ad esempio, se imposti un modello di ispezione per la regione us-west1 e lo aggiorni, verrà eseguita la nuova profilazione solo dei dati nella regione us-west1.

  5. (Facoltativo) Fai clic su Condizioni.

    Nella sezione Condizioni, specifica le condizioni che i set di dati, definiti nei filtri, devono soddisfare prima che Sensitive Data Protection li profili.

    Se necessario, imposta quanto segue:

    • Condizione minima: se vuoi ritardare la profilazione di un set di dati fino a quando non raggiunge una determinata età, attiva questa opzione. Poi, inserisci la durata minima.

    • Condizione temporale: se non vuoi che i set di dati precedenti vengano mai profilati, attiva questa opzione. Quindi, utilizza il selettore della data per selezionare una data e un'ora. Qualsiasi set di dati creato entro il timestamp selezionato viene escluso dal profiling.

    Condizioni di esempio

    Supponiamo che tu abbia la seguente configurazione:

    • Condizioni minime

      • Durata minima: 24 ore
    • Condizione temporale

      • Timestamp: 05/04/22, 23:59

    In questo caso, Sensitive Data Protection esclude tutti i set di dati creati prima del 4 maggio 2022 alle 23:59. Tra i set di dati creati dopo questa data e ora, Sensitive Data Protection profila solo quelli risalenti a almeno 24 ore prima.

  6. Fai clic su Fine.

  7. Se vuoi aggiungere altre pianificazioni, fai clic su Aggiungi pianificazione e ripeti i passaggi precedenti.

  8. Per specificare la precedenza tra le pianificazioni, riordinale utilizzando le frecce su e giù.

    L'ordine dei programmi specifica in che modo vengono risolti i conflitti tra i programmi. Se un set di dati corrisponde ai filtri di due pianificazioni diverse, la pianificazione più in alto nell'elenco delle pianificazioni determina la frequenza di profilazione per quel set di dati.

    L'ultima pianificazione nell'elenco è sempre quella etichettata come Pianificazione predefinita. Questa pianificazione predefinita copre i set di dati nell'ambito selezionato che non corrispondono a nessuna delle pianificazioni che hai creato. Questa pianificazione predefinita segue la frequenza di profilazione predefinita del sistema.

  9. Se vuoi modificare la pianificazione predefinita, fai clic su Modifica pianificazione e modifica le impostazioni in base alle esigenze.

Seleziona modello di ispezione

A seconda di come vuoi fornire una configurazione di ispezione, scegli una delle seguenti opzioni. Indipendentemente dall'opzione scelta, Sensitive Data Protection analizza i dati nella regione in cui sono archiviati. Ciò significa che i dati non vengono trasferiti dalla regione di origine.

Opzione 1: crea un modello di ispezione

Scegli questa opzione se vuoi creare un nuovo modello di ispezione nella regione global.

  1. Fai clic su Crea nuovo modello di ispezione.
  2. (Facoltativo) Per modificare la selezione predefinita degli infoType, fai clic su Gestisci infoType.

    Per ulteriori informazioni su come gestire gli infoType integrati e personalizzati, consulta Gestire gli infoType tramite la console Google Cloud.

    Per continuare, devi avere selezionato almeno un infoType.

  3. (Facoltativo) Configura ulteriormente il modello di ispezione aggiungendo set di regole e impostando una soglia di confidenza. Per ulteriori informazioni, consulta Configurare il rilevamento.

Quando Sensitive Data Protection crea la configurazione di scansione, archivia questo nuovo modello di ispezione nella regione global.

Opzione 2: utilizza un modello di ispezione esistente

Scegli questa opzione se hai modelli di ispezione esistenti che vuoi utilizzare.

  1. Fai clic su Seleziona un modello di ispezione esistente.

  2. Inserisci il nome completo della risorsa del modello di ispezione che vuoi utilizzare. Il campo Regione viene compilato automaticamente con il nome della regione dove è archiviato il modello di ispezione.

    Il modello di ispezione inserito deve trovarsi nella stessa regione dei dati da profilare.

    Per rispettare la residenza dei dati, Sensitive Data Protection non utilizza un modello di ispezione al di fuori della regione in cui è archiviato.

    Per trovare il nome completo della risorsa di un modello di ispezione, segui questi passaggi:

    1. Vai all'elenco dei modelli di ispezione. Questa pagina si apre in una scheda separata.

      Vai ai modelli di ispezione

    2. Passa al progetto che contiene il modello di ispezione che vuoi utilizzare.

    3. Nella scheda Modelli, fai clic sull'ID del modello che vuoi utilizzare.

    4. Nella pagina visualizzata, copia il nome completo della risorsa del modello. Il nome completo della risorsa segue questo formato:

      projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
    5. Nella pagina Crea configurazione di scansione, incolla il nome completo della risorsa del modello nel campo Nome modello.

  3. Per aggiungere un modello di ispezione per un'altra regione, fai clic su Aggiungi modello di ispezione e inserisci il nome completo della risorsa del modello. Ripeti questa operazione per ogni regione in cui hai un modello di ispezione dedicato.

  4. (Facoltativo) Aggiungi un modello di ispezione archiviato nella regione global. Sensitive Data Protection utilizza automaticamente questo modello per i dati nelle regioni in cui non hai un modello di ispezione dedicato.

Aggiungi azioni

Nelle sezioni seguenti, specifica le azioni che vuoi che Sensitive Data Protection esegua dopo aver generato i profili dei dati.

Per informazioni su come altri servizi Google Cloud potrebbero addebitarti la configurazione delle azioni, consulta Prezzi per l'esportazione dei profili di dati.

Pubblica su Security Command Center

I risultati dei profili di dati forniscono il contesto quando valuti e sviluppi piani di risposta per i risultati relativi a vulnerabilità e minacce in Security Command Center.

Prima di poter utilizzare questa azione, Security Command Center deve essere attivato a livello di organizzazione. L'attivazione di Security Command Center a livello di organizzazione consente il flusso dei risultati provenienti da servizi integrati come Sensitive Data Protection. Sensitive Data Protection funziona con Security Command Center in tutti i livelli di servizio.

Se Security Command Center non è attivato a livello di organizzazione, i risultati di Sensitive Data Protection non verranno visualizzati in Security Command Center. Per ulteriori informazioni, vedi Controllare il livello di attivazione di Security Command Center.

Per inviare i risultati dei profili di dati a Security Command Center, assicurati che l'opzione Pubblica in Security Command Center sia attivata.

Per ulteriori informazioni, vedi Pubblicare i profili di dati in Security Command Center.

Salva le copie dei profili dati su BigQuery

L'attivazione dell'opzione Salva le copie dei profili dati in BigQuery ti consente di conservare una copia salvata o la cronologia di tutti i profili generati. Questa operazione può essere utile per creare report di controllo e visualizzare i profili dei dati. Puoi anche caricare queste informazioni in altri sistemi.

Inoltre, questa opzione ti consente di visualizzare tutti i tuoi profili di dati in un'unica visualizzazione, indipendentemente dalla regione in cui si trovano i dati. Se disattivi questa opzione, puoi comunque visualizzare i profili di dati nella console Google Cloud. Tuttavia, nella console Google Cloud puoi selezionare una regione alla volta e visualizzare solo i profili di dati per quella regione.

Per esportare copie dei profili di dati in una tabella BigQuery:

  1. Attiva Salva le copie dei profili dati in BigQuery.

  2. Inserisci i dettagli della tabella BigQuery in cui vuoi salvare le copie del profilo dati:

    • In ID progetto, inserisci l'ID di un progetto esistente in cui vuoi esportare i profili dei dati.

    • In ID set di dati, inserisci il nome di un set di dati esistente nel progetto куда vuoi esportare i profili di dati.

    • In ID tabella, inserisci un nome per la tabella BigQuery in cui verranno esportati i profili dei dati. Se questa tabella non esiste, Sensitive Data Protection la crea automaticamente utilizzando il nome fornito.

Sensitive Data Protection inizia a esportare i profili dal momento in cui attivi questa opzione. I profili generati prima dell'attivazione dell'esportazione non vengono salvati in BigQuery.

Ad esempio, consulta Analisi dei profili dei dati per informazioni sulle query che puoi utilizzare per analizzare i profili dei dati.

Salva i risultati del rilevamento di esempio in BigQuery

Sensitive Data Protection può aggiungere risultati di esempio a una tabella BigQuery a tua scelta. I risultati di esempio rappresentano un sottoinsieme di tutti i risultati e potrebbero non rappresentare tutti gli infoType rilevati. In genere, il sistema genera circa 10 risultati di esempio per set di dati, ma questo numero può variare per ogni esecuzione del rilevamento.

Ogni risultato include la stringa effettiva (chiamata anche citazione) rilevata e la relativa posizione esatta.

Questa azione è utile se vuoi valutare se la configurazione dell'ispezione corrisponde correttamente al tipo di informazioni che vuoi segnalare come sensibili. Utilizzando i profili dei dati esportati e i risultati del campione esportati, puoi eseguire query per ottenere ulteriori informazioni sugli elementi specifici segnalati, sugli infoType corrispondenti, sulle relative posizioni esatte, sui livelli di sensibilità calcolati e su altri dettagli.

Per salvare i risultati di esempio in una tabella BigQuery, segui questi passaggi:

  1. Attiva Salva i risultati del rilevamento di esempio in BigQuery.

  2. Inserisci i dettagli della tabella BigQuery in cui vuoi salvare i risultati di esempio.

    • In ID progetto, inserisci l'ID di un progetto esistente in cui vuoi esportare i risultati.

    • In ID set di dati, inserisci il nome di un set di dati esistente nel progetto.

    • In ID tabella, inserisci il nome della tabella BigQuery in cui vuoi salvare i risultati. Se questa tabella non esiste, Sensitive Data Protection la crea automaticamente utilizzando il nome fornito.

Per informazioni sui contenuti di ogni risultato salvato nella tabella BigQuery, consulta DataProfileFinding.

Pubblica in Pub/Sub

L'attivazione di Pubblica in Pub/Sub ti consente di eseguire azioni programmatiche in base ai risultati del profilo. Puoi utilizzare le notifiche Pub/Sub per sviluppare un flusso di lavoro per rilevare e correggere i risultati con rischi o sensibilità significativi per i dati.

Per inviare notifiche a un argomento Pub/Sub:

  1. Attiva Pubblica in Pub/Sub.

    Viene visualizzato un elenco di opzioni. Ogni opzione descrive un evento che causa la spedizione di una notifica da parte di Sensitive Data Protection a Pub/Sub.

  2. Seleziona gli eventi che devono attivare una notifica Pub/Sub.

    Se selezioni Invia una notifica Pub/Sub ogni volta che un profilo viene aggiornato, Sensitive Data Protection invia una notifica quando si verifica una variazione nel livello di sensibilità, nel livello di rischio dei dati, negli infoType rilevati, nell'accesso pubblico e in altre metriche importanti nel profilo.

  3. Per ogni evento selezionato:

    1. Inserisci il nome dell'argomento. Il nome deve avere il seguente formato:

      projects/PROJECT_ID/topics/TOPIC_ID
      

      Sostituisci quanto segue:

      • PROJECT_ID: l'ID del progetto associato all'argomento Pub/Sub.
      • TOPIC_ID: l'ID dell'argomento Pub/Sub.
    2. Specifica se includere nella notifica il profilo completo del set di dati o solo il nome completo della risorsa del set di dati di cui è stato eseguito il profilo.

    3. Imposta i livelli minimi di rischio e sensibilità dei dati che devono essere soddisfatti affinché Sensitive Data Protection invii una notifica.

    4. Specifica se deve essere soddisfatta una sola o entrambe le condizioni di rischio e sensibilità dei dati. Ad esempio, se scegli AND, devono essere soddisfatte sia le condizioni relative al rischio dei dati sia quelle relative alla sensibilità prima che Sensitive Data Protection invii una notifica.

Imposta la posizione in cui archiviare la configurazione

Fai clic sull'elenco Posizione della risorsa e seleziona la regione in cui vuoi archiviare questa configurazione di scansione. Anche tutte le configurazioni di scansione che creerai in seguito verranno archiviate in questa posizione.

La posizione in cui scegli di archiviare la configurazione della scansione non influisce sui dati da esaminare. I tuoi dati vengono sottoposti a scansione nella stessa regione in cui sono archiviati. Per ulteriori informazioni, consulta Considerazioni sulla residenza dei dati.

Rivedi e crea

  1. Se vuoi assicurarti che la profilazione non venga avviata automaticamente dopo la creazione della configurazione della scansione, seleziona Crea analisi in modalità in pausa.

    Questa opzione è utile nei seguenti casi:

    • Hai scelto di salvare i profili dati in BigQuery e vuoi assicurarti che l'agente di servizio abbia accesso in scrittura alla tabella BigQuery in cui verranno salvate le copie dei profili dati.
    • Hai scelto di salvare i risultati del rilevamento di esempio in BigQuery e vuoi assicurarti che l'agente di servizio abbia accesso in scrittura alla tabella BigQuery in cui verranno salvati i risultati di esempio.
    • Hai configurato le notifiche Pub/Sub e vuoi concedere l'accesso in qualità di editore all'agente di servizio.
  2. Rivedi le impostazioni e fai clic su Crea.

    Sensitive Data Protection crea la configurazione di scansione e la aggiunge all'elenco delle configurazioni di scansione del rilevamento.

Per visualizzare o gestire le configurazioni di scansione, consulta Gestire le configurazioni di scansione.

Passaggi successivi

  • Scopri come gestire i profili di dati.
  • Scopri come gestire le configurazioni di scansione.
  • Scopri come ricevere e analizzare i messaggi Pub/Sub pubblicati dal profiler dei dati.
  • Scopri come risolvere i problemi relativi ai profili dei dati.