Utilizzare l'archivio attributi Dataplex

Questo documento mostra come utilizzare l'archivio attributi Dataplex.

L'archivio attributi Dataplex è un'infrastruttura estensibile consente di specificare i comportamenti relativi ai criteri nelle risorse associate. Gli amministratori Dataplex possono usare l'archivio attributi per definire in che modo alcuni dati dovrebbero essere trattati associando i dati agli attributi.

Il vantaggio principale dell'utilizzo dell'Attribute Store è che puoi aggiungere più attributi a un oggetto, ad esempio una colonna. L'Attribute Store unisce i comportamenti di tutti gli attributi associati a un oggetto e li presenta come un unico criterio nella risorsa sottostante.

Puoi impostare gli attributi sui set di dati pubblicati. I set di dati pubblicati fanno riferimento Set di dati creati da Dataplex dalle tabelle rilevate in un bucket asset.

Sono supportati i seguenti comportamenti dei criteri:

  • Specifiche delle risorse: specifica l'accesso a una risorsa, ad esempio una tabella.
  • Specifiche delle colonne: specifica l'accesso a una colonna in una tabella BigQuery.

Puoi utilizzare Archivio attributi per definire una gerarchia degli attributi chiamata tassonomia. In una tassonomia, un attributo figlio eredita le specifiche dall'attributo padre nella gerarchia degli attributi. Le specifiche della risorsa principale vengono unite in un elenco unificato, che viene propagato alla risorsa.

Puoi utilizzare il Dataplex Attribute Store per:

  • Creare tassonomie.
  • Crea gli attributi e organizzali in una gerarchia.
  • Associa uno o più attributi alle tabelle.
  • Associare uno o più attributi alle colonne.

Terminologia

Nel presente documento viene utilizzata la seguente terminologia:

Tassonomia degli attributi

Una tassonomia dei dati è una gerarchia di attributi. In una tassonomia, gli attributi dei nodi principali consentono agli attributi sottostanti (attributi secondari) di ereditare e aggiungere alle proprie specifiche di comportamento quelle degli attributi principali.

Ad esempio: se un attributo denominato PII ha una specifica della risorsa group-a@company.com e un attributo secondario di PII denominato Social Security numbers ha una specifica della risorsagroup-b@company.com, le specifiche della risorsa applicate ai criteri a cui è associato l'attributo Social Security numbers sarannogroup-a@company.com e group-b@company.com.

Quando definisci un attributo, puoi scegliere se si tratta di un attributo principale o secondario . Quando definisci un attributo secondario, devi specificare l'attributo principale.

Specifiche delle colonne

Le specifiche del comportamento per le colonne. Specifica le persone o i gruppi che hanno accesso in lettura alle colonne. Se associ un attributo contenente una specifica della colonna alla colonna di una tabella, a questa colonna viene aggiunto un tag di criteri per le colonne BigQuery.

Specifiche delle risorse

Le autorizzazioni delle persone o dei gruppi per accedere alle risorse (tabelle). Se associ un attributo alla specifica della risorsa, Dataplex propaga i ruoli IAM agli utenti specificati per accedere alle tabelle associate all'attributo.

Prima di iniziare

Limitazioni

Dataplex propaga i criteri delle specifiche delle colonne come Tag di criteri BigQuery. BigQuery ha un limite di un tag di criteri per colonna. Se in una colonna esiste già un tag criterio, Dataplex genera un errore nel log di governance nella scheda Gestisci.

Quote

Di seguito sono riportate le quote e i limiti che si applicano allo Dataplex Attribute Store:

Limite Predefinito
Numero massimo di tassonomie in una regione 100
Numero massimo di attributi in tutte le tassonomie di una regione 10.000
Numero massimo di attributi che possono essere associati a una risorsa (tabella) 50
Numero massimo di attributi che possono essere associati a una colonna 100
Profondità massima per albero degli attributi dei dati in una tassonomia degli attributi 4

Ruoli e autorizzazioni richiesti

Per ottenere le autorizzazioni di cui hai bisogno per utilizzare l'archivio attributi Dataplex, chiedi all'amministratore di concederti seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per utilizzare l'attributo store Dataplex. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per utilizzare l'archivio attributi Dataplex sono necessarie le seguenti autorizzazioni:

  • Gestire tassonomie e attributi:
    • dataplex.datataxonomies.*
    • dataplex.dataattributes.* (except dataplex.dataattributes.configureResourceAccess and dataplex.dataattributes.configureDataAccess)
  • Visualizza le associazioni associate a risorse e attributi:
    • dataplex.datataxonomies.get
    • dataplex.datataxonomies.list
    • dataplex.dataattributes.get
    • dataplex.dataattributes.list
    • dataplex.dataattributebindings.get
    • dataplex.dataattributebindings.list
  • Crea e gestisci le risorse di associazione in un progetto: dataplex.dataattributebindings.*
  • Gestisci le specifiche di accesso alle risorse e ai dati:
    • dataplex.datataxonomies.configureResourceAccess
    • dataplex.datataxonomies.configureDataAccess

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Esempi di casi d'uso

Prendiamo in considerazione una società chiamata ACME che dispone di tre tipi di dati:

  • Dati Red sensibili.
  • Dati Green con limitazioni, ma meno sensibili.
  • Dati non classificati.

L'amministratore Dataplex di ACME crea il seguente insieme di attributi:

  • Attributo: Red

    • Specifiche della colonna: secrets_team@acme con autorizzazione di lettura
    • Specifiche delle risorse: secrets_team@acme e tenured_employees@acme con permesso di lettura
  • Attributo: Green

    • Specifiche della colonna: full_time_employees@acme con autorizzazione di lettura
    • Specifiche delle risorse: full_time_employees@acme con autorizzazione di modifica

Questa immagine contiene le specifiche della colonna e della risorsa per gli attributi Rosso e Verde.

Gli attributi Red e Green controllano il comportamento di accesso alle risorse (tabelle) a seconda degli attributi associati alle tabelle e alle relative colonne.

Considera una tabella con le seguenti colonne:

  • ID
  • Codice postale
  • Nome
  • Indirizzo
  • Valore$

Caso d'uso 1: associare lo stesso attributo alla tabella e a una colonna

Questa immagine mostra l'attributo Red associato alla tabella e al nome della colonna.

Se associ l'attributo Red alla tabella e alla relativa colonna Nome, Dataplex propaga i seguenti criteri:

  • I dipendenti di secrets_team@acme e tenured_employees@acme possono leggere la tabella, visualizzarne i metadati ed eseguire query.
  • Solo i dipendenti di secrets_team@acme possono eseguire query sulla colonna Name, poiché si tratta ulteriormente protetto dalle specifiche di colonna.

Caso d'uso 2: combinare gli attributi

Considera le seguenti associazioni:

  • Associa gli attributi Red e Green alla tabella.
  • Associa gli attributi Red e Green alla colonna Name.
  • Associa l'attributo Red alla colonna $Value.

Questa immagine mostra gli attributi Rosso e Verde associati alla tabella e al nome della colonna e l'attributo Rosso associato alla colonna $value

In questo caso, Dataplex propaga i criteri seguenti:

  • Dipendenti in secrets_team@acme, tenured_employees@acme e full_time_employees@acme può accedere alla tabella. Questo perché Dataplex unisce le specifiche delle risorse degli attributi Red e Green.
  • I dipendenti di secrets_team@acme e full_time_employees@acme possono accedi alla colonna Name. Questo perché Dataplex unisce specifiche delle colonne degli attributi Red e Green.
  • Solo i dipendenti in secrets_team@acme possono eseguire query sulla colonna $Value.

Caso d'uso 3: organizzare gli attributi in una gerarchia

Puoi organizzare gli attributi in una gerarchia specificando i sottotipi di attributi. Considera il seguente insieme di attributi:

Attributo principale 1:
Attributo: PII

  • Specifiche della colonna: secrets_team@acme
  • Specifiche delle risorse: secrets_team@acme e tenured_employees@acme

Attributo secondario di PII:
Attributo: Email

  • Specifiche delle colonne: email_comm@acme
  • Specifiche della risorsa: email_comm@acme

Attributo principale 2:
Attributo: Financial

  • Specifiche delle colonne: full_time_employees@acme
  • Specifiche della risorsa: full_time_employees@acme

Questa immagine mostra un esempio di gerarchia degli attributi.

Considera le seguenti associazioni:

  • Associa gli attributi Email e Financial alla tabella.
  • Associa gli attributi Email e Financial alla colonna Nome.
  • Associa l'attributo PII alla colonna $Value.

Questa immagine mostra come gli attributi di una gerarchia possono essere associati alla tabella e alle colonne.

In questo caso, Dataplex propaga i seguenti criteri:

  • I dipendenti di secrets_team@acme, tenured_employees@acme, full_time_employees@acme e email_comm@acme possono accedere alla tabella. Questo è che Dataplex unisce le specifiche delle risorse gli attributi Financial e Email, mentre l'attributo Email eredita specifiche dell'attributo PII.
  • Dipendenti in secrets_team@acme, email_comm@acme, full_time_employees@acme può accedere alla colonna Nome. Questo perché Dataplex unisce le specifiche delle colonne del Financial e Email.
  • Solo i dipendenti in secrets_team@acme possono eseguire query sulla colonna $Value.

Imposta gli attributi

Per creare un attributo, devi prima creare una tassonomia, quindi gli attributi dei dati principali e secondari.

Creare una tassonomia degli attributi dei dati

  1. Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.

    Vai all'Attributes Store

  2. Fai clic su Crea tassonomia.

  3. Inserisci il Nome tassonomia, l'ID e la Descrizione.

  4. Seleziona una regione.

  5. Fai clic su Invia.

    La nuova tassonomia viene visualizzata nella pagina Tassonomie di dati.

Crea un attributo padre

  1. Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.

    Vai all'Attributes Store

  2. Nella pagina Tassonomie dei dati, fai clic sulla tassonomia in cui vuoi creare l'attributo principale.

  3. Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.

  4. Seleziona Crea attributo dei dati padre.

  5. Inserisci un nome, un ID e una descrizione per l'attributo principale.

  6. (Facoltativo) Configura le specifiche degli attributi.

    1. Configura le specifiche delle risorse:

      1. Fai clic su Gestisci autorizzazioni per Risorsa.
      2. Fai clic su Aggiungi.
      3. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
      4. Seleziona i Ruoli richiesti e fai clic su Salva.
      5. Fai clic su Salva.
    2. Configura le specifiche delle colonne:

      1. Fai clic su Gestisci autorizzazioni per Colonna.
      2. Fai clic su Aggiungi.
      3. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
      4. Seleziona i Ruoli richiesti e fai clic su Salva.
      5. Fai clic su Salva.
  7. Fai clic su Crea.

Creare un attributo secondario

  1. Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.

    Vai all'archivio attributi

  2. Nella pagina Tassonomie di dati, fai clic sulla tassonomia in cui vuoi creare l'attributo figlio.

  3. Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.

  4. Seleziona Crea attributo dei dati del bambino.

  5. Seleziona un attributo dei dati principale per l'attributo figlio che stai creando.

  6. Inserisci un nome, un ID e una descrizione per l'attributo secondario.

  7. (Facoltativo) Configura le specifiche degli attributi.

    1. Configura le specifiche delle risorse:

      1. Fai clic su Gestisci autorizzazioni per Risorsa.
      2. Fai clic su Aggiungi.
      3. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
      4. Seleziona i Ruoli richiesti e fai clic su Salva.
      5. Fai clic su Salva.
    2. Configura le specifiche delle colonne:

      1. Fai clic su Gestisci autorizzazioni per Colonna.
      2. Fai clic su Aggiungi.
      3. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
      4. Seleziona i Ruoli richiesti e fai clic su Salva.
      5. Fai clic su Salva.
  8. Fai clic su Crea.

Aggiorna risorse Attribute Store

Aggiorna i dettagli della tassonomia

  1. Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.

    Vai all'Attributes Store

  2. Fai clic sulla tassonomia da aggiornare.

  3. Fai clic su Modifica.

  4. Modifica il nome della tassonomia e la relativa descrizione in base alle esigenze.

  5. Fai clic su Invia.

Aggiorna i dettagli dell'attributo

  1. Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.

    Vai all'Attributes Store

  2. Fai clic sulla tassonomia che contiene l'attributo da aggiornare.

  3. Fai clic sull'attributo che vuoi aggiornare.

  4. Per aggiornare il nome e la descrizione dell'attributo, fai clic su Modifica.

    1. Se stai aggiornando un attributo principale, hai la possibilità di aggiornarlo in un attributo secondario e viceversa. Seleziona le opzioni di conseguenza.
    2. Modifica il nome e la descrizione dell'attributo in base alle tue esigenze.
    3. Fai clic su Aggiorna.
  5. Per aggiornare le specifiche delle risorse per l'attributo, fai clic su per Specifiche delle risorse.

    1. Per aggiungere un nuovo principale:

      1. Fai clic su Aggiungi.
      2. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o un gruppo che deve accedere alla risorsa.
      3. Seleziona i Ruoli richiesti.
      4. Fai clic su Salva.
    2. Per aggiornare un principale esistente:

      1. Fai clic su per il principale che vuoi aggiornare.
      2. Seleziona i Ruoli richiesti.
      3. Fai clic su Salva.
    3. Per rimuovere un'entità esistente:

      1. Seleziona l'entità da rimuovere.
      2. Fai clic su Rimuovi.
  6. Per aggiornare le specifiche delle colonne per l'attributo, fai clic su per le Specifiche delle colonne.

    1. Per aggiungere una nuova entità:

      1. Fai clic su Aggiungi.
      2. Nel campo Nuove entità, inserisci l'indirizzo email di una persona o un gruppo che deve accedere alla colonna.
      3. Seleziona i Ruoli richiesti.
      4. Fai clic su Salva.
    2. Per aggiornare un principale esistente:

      1. Fai clic su per il principale che vuoi aggiornare.
      2. Seleziona i Ruoli richiesti.
      3. Fai clic su Salva.
    3. Per rimuovere un'entità esistente:

      1. Seleziona l'entità da rimuovere.
      2. Fai clic su Rimuovi.

Associare attributi alle risorse

Associare un attributo a una tabella

  1. Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.

    Vai all'archivio attributi

  2. Fai clic sulla tassonomia che contiene l'attributo.

  3. Fai clic sull'attributo a cui vuoi associare una tabella.

  4. Fai clic sulla scheda Risorse.

  5. Fai clic su Aggiungi risorse.

  6. Seleziona una tabella dall'elenco.

  7. Fai clic su Seleziona.

Associare un attributo a una colonna

  1. Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.

    Vai all'Attributes Store

  2. Cerca e seleziona la tabella a cui vuoi associare un attributo con una colonna.

  3. Fai clic sulla scheda Tag di schema e colonna.

  4. Fai clic su in Tag di criteri per colonna a cui vuoi associare un attributo.

  5. Seleziona la tassonomia che contiene l'attributo.

  6. Seleziona l'attributo.

  7. Fai clic su Allega.

Passaggi successivi