Questo documento mostra come utilizzare l'archivio attributi Dataplex.
L'archivio attributi Dataplex è un'infrastruttura estensibile consente di specificare i comportamenti relativi ai criteri nelle risorse associate. Gli amministratori Dataplex possono usare l'archivio attributi per definire in che modo alcuni dati dovrebbero essere trattati associando i dati agli attributi.
Il vantaggio principale dell'utilizzo dell'Attribute Store è che puoi aggiungere più attributi a un oggetto, ad esempio una colonna. L'Attribute Store unisce i comportamenti di tutti gli attributi associati a un oggetto e li presenta come un unico criterio nella risorsa sottostante.
Puoi impostare gli attributi sui set di dati pubblicati. I set di dati pubblicati fanno riferimento Set di dati creati da Dataplex dalle tabelle rilevate in un bucket asset.
Sono supportati i seguenti comportamenti dei criteri:
- Specifiche delle risorse: specifica l'accesso a una risorsa, ad esempio una tabella.
- Specifiche delle colonne: specifica l'accesso a una colonna in una tabella BigQuery.
Puoi utilizzare Archivio attributi per definire una gerarchia degli attributi chiamata tassonomia. In una tassonomia, un attributo figlio eredita le specifiche dall'attributo padre nella gerarchia degli attributi. Le specifiche della risorsa principale vengono unite in un elenco unificato, che viene propagato alla risorsa.
Puoi utilizzare il Dataplex Attribute Store per:
- Creare tassonomie.
- Crea gli attributi e organizzali in una gerarchia.
- Associa uno o più attributi alle tabelle.
- Associare uno o più attributi alle colonne.
Terminologia
Nel presente documento viene utilizzata la seguente terminologia:
Tassonomia degli attributi
Una tassonomia dei dati è una gerarchia di attributi. In una tassonomia, gli attributi dei nodi principali consentono agli attributi sottostanti (attributi secondari) di ereditare e aggiungere alle proprie specifiche di comportamento quelle degli attributi principali.
Ad esempio:
se un attributo denominato PII
ha una specifica della risorsa group-a@company.com
e un attributo secondario di PII
denominato Social Security numbers
ha una specifica della risorsagroup-b@company.com
, le specifiche della risorsa applicate ai
criteri a cui è associato l'attributo Social Security numbers
sarannogroup-a@company.com
e group-b@company.com
.
Quando definisci un attributo, puoi scegliere se si tratta di un attributo principale o secondario . Quando definisci un attributo secondario, devi specificare l'attributo principale.
Specifiche delle colonne
Le specifiche del comportamento per le colonne. Specifica le persone o i gruppi che hanno accesso in lettura alle colonne. Se associ un attributo contenente una specifica della colonna alla colonna di una tabella, a questa colonna viene aggiunto un tag di criteri per le colonne BigQuery.
Specifiche delle risorse
Le autorizzazioni delle persone o dei gruppi per accedere alle risorse (tabelle). Se associ un attributo alla specifica della risorsa, Dataplex propaga i ruoli IAM agli utenti specificati per accedere alle tabelle associate all'attributo.
Prima di iniziare
Limitazioni
Dataplex propaga i criteri delle specifiche delle colonne come Tag di criteri BigQuery. BigQuery ha un limite di un tag di criteri per colonna. Se in una colonna esiste già un tag criterio, Dataplex genera un errore nel log di governance nella scheda Gestisci.
Quote
Di seguito sono riportate le quote e i limiti che si applicano allo Dataplex Attribute Store:
Limite | Predefinito |
---|---|
Numero massimo di tassonomie in una regione | 100 |
Numero massimo di attributi in tutte le tassonomie di una regione | 10.000 |
Numero massimo di attributi che possono essere associati a una risorsa (tabella) | 50 |
Numero massimo di attributi che possono essere associati a una colonna | 100 |
Profondità massima per albero degli attributi dei dati in una tassonomia degli attributi | 4 |
Ruoli e autorizzazioni richiesti
Per ottenere le autorizzazioni di cui hai bisogno per utilizzare l'archivio attributi Dataplex, chiedi all'amministratore di concederti seguenti ruoli IAM sul progetto:
-
Gestisci le tassonomie e gli attributi:
Dataplex Taxonomy Admin (
roles/dataplex.taxonomyAdmin
) -
Visualizza le associazioni associate a risorse e attributi:
Visualizzatore tassonomia Dataplex (
roles/dataplex.taxonomyViewer
) -
Crea e gestisci le risorse di associazione in un progetto:
-
Amministratore associazione Dataplex (
roles/dataplex.bindingAdmin
) -
Dataplex Admin (
roles/dataplex.admin
nella risorsa Zona)
-
Amministratore associazione Dataplex (
-
Gestisci le specifiche di accesso alle risorse e ai dati:
Amministratore sicurezza Dataplex (
roles/dataplex.securityAdmin
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per utilizzare l'attributo store Dataplex. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:
Autorizzazioni obbligatorie
Per utilizzare l'archivio attributi Dataplex sono necessarie le seguenti autorizzazioni:
-
Gestire tassonomie e attributi:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Visualizza le associazioni associate a risorse e attributi:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Crea e gestisci le risorse di associazione in un progetto:
dataplex.dataattributebindings.*
-
Gestisci le specifiche di accesso alle risorse e ai dati:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Esempi di casi d'uso
Prendiamo in considerazione una società chiamata ACME che dispone di tre tipi di dati:
- Dati
Red
sensibili. - Dati
Green
con limitazioni, ma meno sensibili. - Dati non classificati.
L'amministratore Dataplex di ACME crea il seguente insieme di attributi:
Attributo:
Red
- Specifiche della colonna:
secrets_team@acme
con autorizzazione di lettura - Specifiche delle risorse:
secrets_team@acme
etenured_employees@acme
con permesso di lettura
- Specifiche della colonna:
Attributo:
Green
- Specifiche della colonna:
full_time_employees@acme
con autorizzazione di lettura - Specifiche delle risorse:
full_time_employees@acme
con autorizzazione di modifica
- Specifiche della colonna:
Gli attributi Red
e Green
controllano il comportamento di accesso alle risorse (tabelle)
a seconda degli attributi associati alle tabelle e alle relative colonne.
Considera una tabella con le seguenti colonne:
- ID
- Codice postale
- Nome
- Indirizzo
- Valore$
Caso d'uso 1: associare lo stesso attributo alla tabella e a una colonna
Se associ l'attributo Red
alla tabella e alla relativa colonna Nome,
Dataplex propaga i seguenti criteri:
- I dipendenti di
secrets_team@acme
etenured_employees@acme
possono leggere la tabella, visualizzarne i metadati ed eseguire query. - Solo i dipendenti di
secrets_team@acme
possono eseguire query sulla colonna Name, poiché si tratta ulteriormente protetto dalle specifiche di colonna.
Caso d'uso 2: combinare gli attributi
Considera le seguenti associazioni:
- Associa gli attributi
Red
eGreen
alla tabella. - Associa gli attributi
Red
eGreen
alla colonna Name. - Associa l'attributo
Red
alla colonna $Value.
In questo caso, Dataplex propaga i criteri seguenti:
- Dipendenti in
secrets_team@acme
,tenured_employees@acme
efull_time_employees@acme
può accedere alla tabella. Questo perché Dataplex unisce le specifiche delle risorse degli attributiRed
eGreen
. - I dipendenti di
secrets_team@acme
efull_time_employees@acme
possono accedi alla colonna Name. Questo perché Dataplex unisce specifiche delle colonne degli attributiRed
eGreen
. - Solo i dipendenti in
secrets_team@acme
possono eseguire query sulla colonna $Value.
Caso d'uso 3: organizzare gli attributi in una gerarchia
Puoi organizzare gli attributi in una gerarchia specificando i sottotipi di attributi. Considera il seguente insieme di attributi:
Attributo principale 1:
Attributo: PII
- Specifiche della colonna:
secrets_team@acme
- Specifiche delle risorse:
secrets_team@acme
etenured_employees@acme
Attributo secondario di PII
:
Attributo: Email
- Specifiche delle colonne:
email_comm@acme
- Specifiche della risorsa:
email_comm@acme
Attributo principale 2:
Attributo: Financial
- Specifiche delle colonne:
full_time_employees@acme
- Specifiche della risorsa:
full_time_employees@acme
Considera le seguenti associazioni:
- Associa gli attributi
Email
eFinancial
alla tabella. - Associa gli attributi
Email
eFinancial
alla colonna Nome. - Associa l'attributo
PII
alla colonna $Value.
In questo caso, Dataplex propaga i seguenti criteri:
- I dipendenti di
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
eemail_comm@acme
possono accedere alla tabella. Questo è che Dataplex unisce le specifiche delle risorse gli attributiFinancial
eEmail
, mentre l'attributoEmail
eredita specifiche dell'attributoPII
. - Dipendenti in
secrets_team@acme
,email_comm@acme
,full_time_employees@acme
può accedere alla colonna Nome. Questo perché Dataplex unisce le specifiche delle colonne delFinancial
eEmail
. - Solo i dipendenti in
secrets_team@acme
possono eseguire query sulla colonna $Value.
Imposta gli attributi
Per creare un attributo, devi prima creare una tassonomia, quindi gli attributi dei dati principali e secondari.
Creare una tassonomia degli attributi dei dati
Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.
Fai clic su Crea tassonomia.
Inserisci il Nome tassonomia, l'ID e la Descrizione.
Seleziona una regione.
Fai clic su Invia.
La nuova tassonomia viene visualizzata nella pagina Tassonomie di dati.
Crea un attributo padre
Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.
Nella pagina Tassonomie dei dati, fai clic sulla tassonomia in cui vuoi creare l'attributo principale.
Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.
Seleziona Crea attributo dei dati padre.
Inserisci un nome, un ID e una descrizione per l'attributo principale.
(Facoltativo) Configura le specifiche degli attributi.
Configura le specifiche delle risorse:
- Fai clic su Gestisci autorizzazioni per Risorsa.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
- Seleziona i Ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Configura le specifiche delle colonne:
- Fai clic su Gestisci autorizzazioni per Colonna.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
- Seleziona i Ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Fai clic su Crea.
Creare un attributo secondario
Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.
Nella pagina Tassonomie di dati, fai clic sulla tassonomia in cui vuoi creare l'attributo figlio.
Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.
Seleziona Crea attributo dei dati del bambino.
Seleziona un attributo dei dati principale per l'attributo figlio che stai creando.
Inserisci un nome, un ID e una descrizione per l'attributo secondario.
(Facoltativo) Configura le specifiche degli attributi.
Configura le specifiche delle risorse:
- Fai clic su Gestisci autorizzazioni per Risorsa.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
- Seleziona i Ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Configura le specifiche delle colonne:
- Fai clic su Gestisci autorizzazioni per Colonna.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
- Seleziona i Ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Fai clic su Crea.
Aggiorna risorse Attribute Store
Aggiorna i dettagli della tassonomia
Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.
Fai clic sulla tassonomia da aggiornare.
Fai clic su Modifica.
Modifica il nome della tassonomia e la relativa descrizione in base alle esigenze.
Fai clic su Invia.
Aggiorna i dettagli dell'attributo
Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.
Fai clic sulla tassonomia che contiene l'attributo da aggiornare.
Fai clic sull'attributo che vuoi aggiornare.
Per aggiornare il nome e la descrizione dell'attributo, fai clic su Modifica.
- Se stai aggiornando un attributo principale, hai la possibilità di aggiornarlo in un attributo secondario e viceversa. Seleziona le opzioni di conseguenza.
- Modifica il nome e la descrizione dell'attributo in base alle tue esigenze.
- Fai clic su Aggiorna.
Per aggiornare le specifiche delle risorse per l'attributo, fai clic su
per Specifiche delle risorse.Per aggiungere un nuovo principale:
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o un gruppo che deve accedere alla risorsa.
- Seleziona i Ruoli richiesti.
- Fai clic su Salva.
Per aggiornare un principale esistente:
- Fai clic su per il principale che vuoi aggiornare.
- Seleziona i Ruoli richiesti.
- Fai clic su Salva.
Per rimuovere un'entità esistente:
- Seleziona l'entità da rimuovere.
- Fai clic su Rimuovi.
Per aggiornare le specifiche delle colonne per l'attributo, fai clic su
per le Specifiche delle colonne.Per aggiungere una nuova entità:
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o un gruppo che deve accedere alla colonna.
- Seleziona i Ruoli richiesti.
- Fai clic su Salva.
Per aggiornare un principale esistente:
- Fai clic su per il principale che vuoi aggiornare.
- Seleziona i Ruoli richiesti.
- Fai clic su Salva.
Per rimuovere un'entità esistente:
- Seleziona l'entità da rimuovere.
- Fai clic su Rimuovi.
Associare attributi alle risorse
Associare un attributo a una tabella
Nella console Google Cloud, vai alla pagina Archivio attributi di Dataplex.
Fai clic sulla tassonomia che contiene l'attributo.
Fai clic sull'attributo a cui vuoi associare una tabella.
Fai clic sulla scheda Risorse.
Fai clic su Aggiungi risorse.
Seleziona una tabella dall'elenco.
Fai clic su Seleziona.
Associare un attributo a una colonna
Nella console Google Cloud, vai alla pagina Attribute Store (Repository di attributi) di Dataplex.
Cerca e seleziona la tabella a cui vuoi associare un attributo con una colonna.
Fai clic sulla scheda Tag di schema e colonna.
Fai clic su
in Tag di criteri per colonna a cui vuoi associare un attributo.Seleziona la tassonomia che contiene l'attributo.
Seleziona l'attributo.
Fai clic su Allega.
Passaggi successivi
- Scopri di più sulla sicurezza di Dataplex.
- Scopri di più sulla gestione dei criteri in Dataplex.
- Scopri di più sui ruoli IAM di Dataplex.