Profila i dati di Vertex AI in un'organizzazione o una cartella

Questa pagina descrive come configurare l'individuazione dei dati di Vertex AI a livello di organizzazione o cartella. Se vuoi profilare un progetto, consulta Profila i dati Vertex AI in un singolo progetto.

Per ulteriori informazioni sul servizio di rilevamento, consulta Profili dei dati.

Prima di iniziare

  1. Conferma di disporre delle autorizzazioni IAM necessarie per configurare i profili dei dati a livello di organizzazione.

    Se non disponi del ruolo Amministratore dell'organizzazione (roles/resourcemanager.organizationAdmin) o Amministratore sicurezza (roles/iam.securityAdmin), puoi comunque creare una configurazione di scansione. Tuttavia, dopo aver creato la configurazione della scansione, una persona con uno di questi ruoli deve concedere l'accesso alla profilazione dei dati al tuo agente di servizio.

  2. Devi disporre di un modello di ispezione in ogni regione in cui sono presenti dati da profilare. Se vuoi utilizzare un singolo modello per più regioni, puoi utilizzare un modello archiviato nella regione global. Se i criteri dell'organizzazione ti impediscono di creare un modello di ispezione nella regione global, devi impostare un modello di ispezione dedicato per ogni regione. Per ulteriori informazioni, consulta Considerazioni sulla residenza dei dati.

    Questa attività ti consente di creare un modello di ispezione solo nella regione global. Se hai bisogno di modelli di ispezione dedicati per una o più regioni, devi crearli prima di eseguire questa attività.

  3. Per inviare notifiche Pub/Sub a un argomento quando si verificano determinati eventi, ad esempio quando Sensitive Data Protection profila un nuovo set di dati, crea un argomento Pub/Sub prima di eseguire questa attività.

Per generare profili di dati, hai bisogno di un container dell'agente di servizio e di un agente di servizio al suo interno. Questa attività ti consente di crearli automaticamente.

Creazione di una configurazione di scansione

  1. Vai alla pagina Crea configurazione scansione.

    Vai a Crea configurazione di scansione

  2. Vai alla tua organizzazione. Nella barra degli strumenti, fai clic sul selettore di progetti e seleziona la tua organizzazione.

Le sezioni seguenti forniscono ulteriori informazioni sui passaggi della pagina Crea configurazione scansione. Al termine di ogni sezione, fai clic su Continua.

Seleziona un tipo di rilevamento

Seleziona Vertex AI.

Seleziona ambito

Esegui una di queste operazioni:

  • Per configurare la profilazione a livello di organizzazione, seleziona Scansiona l'intera organizzazione.
  • Per configurare la profilazione a livello di cartella, seleziona Scansiona cartella selezionata. Fai clic su Sfoglia e seleziona la cartella.

Gestisci pianificazioni

Se la frequenza di profilazione predefinita soddisfa le tue esigenze, puoi saltare questa sezione della pagina Crea configurazione di analisi.

Configura questa sezione per i seguenti motivi:

  • Per apportare modifiche precise alla frequenza di profilazione di tutti i dati o di determinati sottoinsiemi di dati.
  • Per specificare i set di dati di cui non vuoi creare il profilo.
  • Per specificare i set di dati per i quali non vuoi eseguire la profilazione più di una volta.

Per apportare modifiche precise alla frequenza di profilazione:

  1. Fai clic su Aggiungi pianificazione.
  2. Nella sezione Filtri, definisci uno o più filtri che specificano quali set di dati rientrano nell'ambito della pianificazione. Un set di dati viene considerato nell'ambito della pianificazione se corrisponde ad almeno uno dei filtri definiti.

    Per configurare un filtro, specifica un ID progetto o un'espressione regolare che specifichi uno o più progetti.

    Le espressioni regolari devono seguire la sintassi RE2.

    Ad esempio, se vuoi che tutti i set di dati di un progetto siano inclusi nel filtro, inserisci l'ID progetto nel campo ID progetto.

    Se vuoi aggiungere altri filtri, fai clic su Aggiungi filtro e ripeti questo passaggio.

  3. Fai clic su Frequenza.

  4. Nella sezione Frequenza, specifica se il servizio di rilevamento deve profilare i set di dati selezionati e, in caso affermativo, con quale frequenza:

    • Se non vuoi mai che i set di dati vengano profilati, disattiva Esegui la profilazione di questi dati.

    • Se vuoi che i set di dati vengano profilati almeno una volta, lascia Esegui la profilazione di questi dati attivata.

      Nei campi successivi di questa sezione, specifica se il sistema deve riprofilare i dati e quali eventi devono attivare un'operazione di riprofilazione. Per saperne di più, consulta Frequenza di generazione del profilo dei dati.

      1. Per In base a una pianificazione, specifica la frequenza con cui vuoi che i profili dei set di dati vengano ricreati. I set di dati vengono riprofilati indipendentemente dal fatto che abbiano subito modifiche.
      2. Per Quando si esaminano le modifiche al modello, specifica se vuoi che i tuoi dati vengano riprofilati quando il modello di ispezione associato viene aggiornato e, in caso affermativo, con quale frequenza.

        Una modifica al modello di ispezione viene rilevata quando si verifica una delle seguenti condizioni:

        • Il nome di un modello di ispezione cambia nella configurazione della scansione.
        • Il updateTime di un modello di ispezione cambia.

      3. Ad esempio, se imposti un modello di ispezione per la regione us-west1 e lo aggiorni, verrà eseguita la nuova profilazione solo dei dati nella regione us-west1.

  5. (Facoltativo) Fai clic su Condizioni.

    Nella sezione Condizioni, specifica le condizioni che i set di dati definiti nei filtri devono soddisfare prima che Sensitive Data Protection li profili.

    Se necessario, imposta quanto segue:

    • Condizione minima: se vuoi ritardare la profilazione di un set di dati finché non raggiunge una determinata età, attiva questa opzione. Poi, inserisci la durata minima.

    • Condizione temporale: se non vuoi che i set di dati precedenti vengano mai profilati, attiva questa opzione. Quindi, utilizza il selettore della data per selezionare una data e un'ora. Qualsiasi set di dati creato entro o prima del timestamp selezionato viene escluso dalla profilazione.

    Condizioni di esempio

    Supponiamo che tu abbia la seguente configurazione:

    • Condizioni minime

      • Durata minima: 24 ore
    • Condizione di tempo

      • Timestamp: 04/05/22, 23:59

    In questo caso, Sensitive Data Protection esclude qualsiasi set di dati creato entro il 4 maggio 2022 alle 23:59. Tra i set di dati creati dopo questa data e ora, Sensitive Data Protection profila solo i set di dati creati almeno 24 ore prima.

  6. Fai clic su Fine.

  7. (Facoltativo) Per aggiungere altre pianificazioni, fai clic su Aggiungi pianificazione e ripeti i passaggi precedenti.

  8. Per specificare la precedenza tra le pianificazioni, riordinali utilizzando le frecce su e giù .

    L'ordine dei programmi specifica come vengono risolti i conflitti tra i programmi. Se un set di dati corrisponde ai filtri di due pianificazioni diverse, la pianificazione più in alto nell'elenco delle pianificazioni determina la frequenza di profilazione per quel set di dati.

  9. (Facoltativo) Modifica o disattiva la pianificazione generica.

    L'ultima pianificazione nell'elenco è la pianificazione generica. Questa pianificazione copre i set di dati nell'ambito selezionato che non corrispondono a nessuna delle pianificazioni che hai creato. La pianificazione generica segue la frequenza di profilazione predefinita del sistema.

    • Per modificare la pianificazione generica, fai clic su Modifica pianificazione e poi modifica le impostazioni in base alle esigenze.
    • Per impedire a Sensitive Data Protection di profilare qualsiasi risorsa coperta dalla pianificazione generica, disattiva l'opzione Profila le risorse che non corrispondono a nessuna pianificazione personalizzata.

Seleziona modello di ispezione

A seconda di come vuoi fornire una configurazione di ispezione, scegli una delle seguenti opzioni. Indipendentemente dall'opzione scelta, Sensitive Data Protection analizza i tuoi dati nella regione in cui sono archiviati. ovvero i tuoi dati non vengono trasferiti dalla regione di origine.

Opzione 1: crea un modello di ispezione

Scegli questa opzione se vuoi creare un nuovo modello di ispezione nella regione global.

  1. Fai clic su Crea nuovo modello di ispezione.
  2. (Facoltativo) Per modificare la selezione predefinita degli infoType, fai clic su Gestisci infoType.

    Per saperne di più su come gestire gli infoType integrati e personalizzati, consulta Gestire gli infoType tramite la console Google Cloud .

    Per continuare, devi selezionare almeno un infoType.

  3. (Facoltativo) Configura ulteriormente il modello di ispezione aggiungendo set di regole e impostando una soglia di confidenza. Per ulteriori informazioni, vedi Configurare il rilevamento.

Quando Sensitive Data Protection crea la configurazione di scansione, archivia questo nuovo modello di ispezione nella regione global.

Opzione 2: utilizza un modello di ispezione esistente

Scegli questa opzione se hai modelli di ispezione esistenti che vuoi utilizzare.

  1. Fai clic su Seleziona un modello di ispezione esistente.
  2. Inserisci il nome completo della risorsa del modello di ispezione che vuoi utilizzare. Il campo Regione viene compilato automaticamente con il nome della regione in cui è memorizzato il modello di ispezione.

    Il modello di ispezione che inserisci deve trovarsi nella stessa regione dei dati da profilare.

    Per rispettare la residenza dei dati, Sensitive Data Protection non utilizza un modello di ispezione al di fuori della regione in cui è archiviato.

    Per trovare il nome risorsa completo di un modello di ispezione, segui questi passaggi:

    1. Vai all'elenco dei modelli di ispezione. Questa pagina si apre in una scheda separata.

      Vai ai modelli di ispezione

    2. Passa al progetto che contiene il modello di ispezione che vuoi utilizzare.
    3. Nella scheda Modelli, fai clic sull'ID del modello che vuoi utilizzare.
    4. Nella pagina visualizzata, copia il nome completo della risorsa del modello. Il nome completo della risorsa ha questo formato:
      projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
    5. Nella pagina Crea configurazione scansione, nel campo Nome modello, incolla il nome completo della risorsa del modello.
  3. Per aggiungere un modello di ispezione per un'altra regione, fai clic su Aggiungi modello di ispezione e inserisci il nome risorsa completo del modello. Ripeti questa operazione per ogni regione in cui hai un modello di ispezione dedicato.
  4. (Facoltativo) Aggiungi un modello di ispezione archiviato nella regione global. Sensitive Data Protection utilizza automaticamente questo modello per i dati nelle regioni in cui non è presente un modello di ispezione dedicato.

Aggiungi azioni

Questa sezione descrive come specificare le azioni che vuoi che Sensitive Data Protection esegua dopo la profilazione di un set di dati. Queste azioni sono utili se vuoi inviare approfondimenti raccolti dai profili dei dati ad altri serviziGoogle Cloud .

Pubblica in Google Security Operations

Le metriche raccolte dai profili dei dati possono aggiungere contesto ai risultati di Google Security Operations. Il contesto aggiuntivo può aiutarti a determinare i problemi di sicurezza più importanti da risolvere.

Ad esempio, se stai esaminando un determinato service agent, Google Security Operations può determinare a quali risorse ha avuto accesso il service agent e se una di queste risorse contiene dati sensibili.

Per inviare i profili dei dati all'istanza di Google Security Operations, attiva Pubblica in Google Security Operations.

Se non hai abilitato un'istanza Google Security Operations per la tua organizzazione, tramite il prodotto autonomo o tramite Security Command Center Enterprise, l'attivazione di questa opzione non ha alcun effetto.

Pubblica su Security Command Center

I risultati dei profili di dati forniscono il contesto quando valuti e sviluppi piani di risposta per i risultati relativi a vulnerabilità e minacce in Security Command Center.

Prima di poter utilizzare questa azione, Security Command Center deve essere attivato a livello di organizzazione. L'attivazione di Security Command Center a livello di organizzazione consente il flusso dei risultati dai servizi integrati come Sensitive Data Protection. Sensitive Data Protection funziona con Security Command Center in tutti i livelli di servizio.

Se Security Command Center non è attivato a livello di organizzazione, i risultati di Sensitive Data Protection non vengono visualizzati in Security Command Center. Per maggiori informazioni, vedi Controllare il livello di attivazione di Security Command Center.

Per inviare i risultati dei profili di dati a Security Command Center, assicurati che l'opzione Pubblica in Security Command Center sia attivata.

Per saperne di più, vedi Pubblicare profili di dati in Security Command Center.

Salva le copie dei profili dati su BigQuery

Sensitive Data Protection salva una copia di ogni profilo di dati generato in una tabella BigQuery. Se non fornisci i dettagli della tabella che preferisci, Sensitive Data Protection crea un set di dati e una tabella nel contenitore dell'agente di servizio. Per impostazione predefinita, il set di dati si chiama sensitive_data_protection_discovery e la tabella si chiama discovery_profiles.

In questo modo, puoi conservare una cronologia di tutti i profili generati. Questa cronologia può essere utile per creare report di audit e visualizzare i profili dei dati. Puoi anche caricare queste informazioni in altri sistemi.

Inoltre, questa opzione ti consente di visualizzare tutti i tuoi profili dei dati in un'unica visualizzazione, indipendentemente dalla regione in cui si trovano i dati. Anche se puoi visualizzare i profili dei dati tramite la consoleGoogle Cloud , la console mostra i profili in una sola regione alla volta.

Quando Sensitive Data Protection non riesce a profilare un set di dati, riprova periodicamente. Per ridurre al minimo il rumore nei dati esportati, Sensitive Data Protection esporta in BigQuery solo i profili generati correttamente.

Sensitive Data Protection inizia a esportare i profili dal momento in cui attivi questa opzione. I profili generati prima dell'attivazione dell'esportazione non vengono salvati in BigQuery.

Per esempi di query che puoi utilizzare durante l'analisi dei profili dei dati, consulta Analizzare i profili dei dati.

Salva i risultati del rilevamento di esempio in BigQuery

Sensitive Data Protection può aggiungere risultati di esempio a una tabella BigQuery a tua scelta. I risultati di esempio rappresentano un sottoinsieme di tutti i risultati e potrebbero non rappresentare tutti i tipi di informazioni rilevati. Normalmente, il sistema genera circa 10 risultati di esempio per set di dati, ma questo numero può variare per ogni esecuzione del rilevamento.

Ogni risultato include la stringa effettiva (chiamata anche citazione) rilevata e la sua posizione esatta.

Questa azione è utile se vuoi valutare se la configurazione dell'ispezione corrisponde correttamente al tipo di informazioni che vuoi contrassegnare come sensibili. Utilizzando i profili dei dati esportati e i risultati di esempio esportati, puoi eseguire query per ottenere maggiori informazioni sugli elementi specifici segnalati, sugli infoType corrispondenti, sulle loro posizioni esatte, sui livelli di sensibilità calcolati e su altri dettagli.

Per salvare i risultati di esempio in una tabella BigQuery, segui questi passaggi:

  1. Attiva l'opzione Salva i risultati del rilevamento di esempio in BigQuery.

  2. Inserisci i dettagli della tabella BigQuery in cui vuoi salvare i risultati di esempio.

    La tabella specificata per questa azione deve essere diversa da quella utilizzata per l'azione Salva le copie dei profili di dati in BigQuery.

    • In ID progetto, inserisci l'ID di un progetto esistente in cui vuoi esportare i risultati.

    • In ID set di dati, inserisci il nome di un set di dati esistente nel progetto.

    • Per ID tabella, inserisci il nome della tabella BigQuery in cui vuoi salvare i risultati. Se questa tabella non esiste, Sensitive Data Protection la crea automaticamente utilizzando il nome che fornisci.

Per informazioni sui contenuti di ciascun risultato salvato nella tabella BigQuery, vedi DataProfileFinding.

Pubblica in Pub/Sub

L'attivazione dell'opzione Pubblica su Pub/Sub ti consente di eseguire azioni programmatiche in base ai risultati della profilazione. Puoi utilizzare le notifiche Pub/Sub per sviluppare un flusso di lavoro per rilevare e correggere i risultati con un rischio o una sensibilità dei dati significativi.

Per inviare notifiche a un argomento Pub/Sub:

  1. Attiva Pubblica in Pub/Sub.

    Viene visualizzato un elenco di opzioni. Ogni opzione descrive un evento che fa sì che Sensitive Data Protection invii una notifica a Pub/Sub.

  2. Seleziona gli eventi che devono attivare una notifica Pub/Sub.

    Se selezioni Invia una notifica Pub/Sub ogni volta che un profilo viene aggiornato, Sensitive Data Protection invia una notifica quando si verifica una modifica a livello di sensibilità, livello di rischio dei dati, infoType rilevati, accesso pubblico e altre metriche importanti nel profilo.

  3. Per ogni evento selezionato:

    1. Inserisci il nome dell'argomento. Il nome deve avere il seguente formato:

      projects/PROJECT_ID/topics/TOPIC_ID
      

      Sostituisci quanto segue:

      • PROJECT_ID: l'ID del progetto associato all'argomento Pub/Sub.
      • TOPIC_ID: l'ID dell'argomento Pub/Sub.
    2. Specifica se includere il profilo completo del set di dati nella notifica o solo il nome completo della risorsa del set di dati di cui è stato eseguito il profiling.

    3. Imposta i livelli minimi di rischio e sensibilità dei dati che devono essere soddisfatti affinché Sensitive Data Protection invii una notifica.

    4. Specifica se deve essere soddisfatta una sola o entrambe le condizioni di rischio e sensibilità dei dati. Ad esempio, se scegli AND, devono essere soddisfatte sia le condizioni di rischio dei dati sia quelle di sensibilità prima che Sensitive Data Protection invii una notifica.

Invia a Dataplex Universal Catalog come aspetti

Questa azione consente di aggiungere aspetti del Catalogo universale Dataplex ai set di dati profilati in base agli approfondimenti dei profili dei dati. Questa azione viene applicata solo ai profili nuovi e aggiornati. I profili esistenti che non vengono aggiornati non vengono inviati a Dataplex Universal Catalog.

Quando abiliti questa azione, Sensitive Data Protection associa l'aspetto Sensitive Data Protection profile alla voce Dataplex Universal Catalog per ogni nuovo o aggiornato dataset di cui crei il profilo. Gli aspetti generati contengono approfondimenti raccolti dai profili dei dati. Puoi quindi cercare nella tua organizzazione e nei tuoi progetti le voci con valori di aspetto Sensitive Data Protection profile specifici.

Per inviare i profili dei dati a Dataplex Universal Catalog, assicurati che l'opzione Invia a Dataplex Catalog come aspetti sia attivata.

Per saperne di più, consulta Aggiungere aspetti del Catalogo universale Dataplex in base agli approfondimenti dei profili dei dati.

Gestisci container e fatturazione dell'agente di servizio

In questa sezione, specifica il progetto da utilizzare come container dell'agente di servizio. Puoi fare in modo che Sensitive Data Protection crei automaticamente un nuovo progetto oppure puoi sceglierne uno esistente.

Indipendentemente dal fatto che utilizzi un agente di servizio appena creato o ne riutilizzi uno esistente, assicurati che abbia accesso in lettura ai dati da profilare.

Creare automaticamente un progetto

Se non disponi delle autorizzazioni necessarie per creare un progetto nell'organizzazione, devi selezionare un progetto esistente o ottenere le autorizzazioni richieste. Per informazioni sulle autorizzazioni richieste, consulta Ruoli richiesti per utilizzare i profili dei dati a livello di organizzazione o cartella.

Per creare automaticamente un progetto da utilizzare come container dell'agente di servizio, segui questi passaggi:

  1. Nel campo Container dell'agente di servizio, rivedi l'ID progetto suggerito e modificalo se necessario.
  2. Fai clic su Crea.
  3. (Facoltativo) Aggiorna il nome predefinito del progetto.
  4. Seleziona l'account a cui addebitare tutte le operazioni fatturabili correlate a questo nuovo progetto, incluse quelle non correlate alla scoperta.

  5. Fai clic su Crea.

Sensitive Data Protection crea il nuovo progetto. L'agente di servizio all'interno di questo progetto verrà utilizzato per l'autenticazione a Sensitive Data Protection e ad altre API.

Seleziona un progetto esistente

Per selezionare un progetto esistente come container dell'agente di servizio, fai clic sul campo Service agent container e seleziona il progetto.

Impostare le località di elaborazione di riserva per le immagini

In generale, la protezione dei dati sensibili elabora i dati nella posizione in cui sono archiviati. Tuttavia, le immagini possono essere elaborate solo in una multiregione o nella regione global. Se imposti una località di riserva, Sensitive Data Protection la utilizza per elaborare le immagini che non si trovano in una multi-regione o nella regione global. Se salti questa sezione, le immagini non vengono elaborate.

Per impostare le località di riserva per l'elaborazione delle immagini, seleziona una o entrambe le seguenti opzioni:

  • Utilizza la multi-regione come località di riserva: se un'immagine non può essere elaborata nella sua località originale, viene elaborata nella multi-regione che corrisponde alla località originale dell'immagine. Se la posizione originale dell'immagine non ha una multi-regione corrispondente, l'immagine viene ignorata.
  • Esegui il failover a livello globale: se un'immagine non può essere elaborata nella sua posizione originale, viene elaborata nella regione global.

Se selezioni entrambe le opzioni, Sensitive Data Protection sceglie quale località utilizzare come località di riserva.

Imposta la posizione in cui archiviare la configurazione

Fai clic sull'elenco Posizione risorsa e seleziona la regione in cui vuoi archiviare questa configurazione di scansione. Anche tutte le configurazioni di scansione che creerai in seguito verranno archiviate in questa posizione.

La posizione in cui scegli di archiviare la configurazione della scansione non influisce sui dati da scansionare. I tuoi dati vengono analizzati nella stessa regione in cui sono archiviati. Per saperne di più, consulta Considerazioni sulla residenza dei dati.

Rivedi e crea

  1. Se vuoi assicurarti che la profilazione non inizi automaticamente dopo la creazione della configurazione della scansione, seleziona Crea scansione in modalità in pausa.

    Questa opzione è utile nei seguenti casi:

    • Il tuo amministratore di Google Cloud deve ancora concedere l'accesso alla profilazione dei dati all'agente di servizio.
    • Vuoi creare più configurazioni di analisi e vuoi che alcune configurazioni ignorino altre.
    • Hai scelto di salvare i profili dati in BigQuery e vuoi assicurarti che l'agente di servizio abbia accesso in scrittura alla tabella BigQuery in cui verranno salvate le copie dei profili dati.
    • Hai scelto di salvare i risultati del rilevamento di esempio in BigQuery e vuoi assicurarti che l'agente di servizio abbia accesso in scrittura alla tabella BigQuery in cui verranno salvati i risultati di esempio.
    • Hai configurato le notifiche Pub/Sub e vuoi concedere l'accesso alla pubblicazione all'agente di servizio.
  2. Rivedi le impostazioni e fai clic su Crea.

    Sensitive Data Protection crea la configurazione di scansione e la aggiunge all'elenco delle configurazioni di scansione del rilevamento.

Per visualizzare o gestire le configurazioni di scansione, consulta Gestire le configurazioni di scansione.

Passaggi successivi