Questa pagina è stata tradotta dall'API Cloud Translation.

Gestire le risorse utilizzando Data Catalog

Questa pagina spiega come cercare e gestire le risorse Spanner utilizzando Data Catalog.

Data Catalog è un servizio di gestione dei metadati completamente gestito e scalabile all'interno di Dataplex. Cataloga automaticamente i seguenti metadati su istanza Spanner, database, tabelle, colonne e visualizzazioni:

Nome e nome completo
Località (regione)
Data di creazione e data dell'ultima modifica
Schema (per tabelle e visualizzazioni)
Descrizione

I metadati di Spanner vengono sincronizzati automaticamente con Data Catalog a intervalli regolari, in genere ogni poche ore. Puoi utilizzare Data Catalog per scoprire e comprendere i metadati di Spanner. Utilizza Data Catalog per facilitare le seguenti attività:

Analisi, incluse dipendenze e idoneità per un caso d'uso
Gestione dei cambiamenti
Spostamento dei dati (pipeline)
Evoluzione dello schema

Con Data Catalog puoi organizzare i metadati collegando i tag alle voci dei metadati di Spanner. Ogni tag può avere più campi di metadati e può essere basato su un modello di tag predefinito o personalizzato.

Ad esempio, puoi associare il seguente tag a una colonna contenente un codice fiscale, che è un'informazione che consente l'identificazione personale (PII):

pii:true
pii_type:SSN

Quando sposti un'istanza che utilizza i tag, questi non vengono spostati automaticamente nell'istanza di destinazione. Devi invece esportare i tag dall'istanza di origine prima di spostarla e importarli nell'istanza di destinazione. Per ulteriori informazioni, consulta Esportare e importare i tag.

Per scoprire di più su Data Catalog, consulta Che cos'è Data Catalog.

Prima di iniziare

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Abilita l'API Data Catalog per il progetto.

Attiva l'API Data Catalog
Controlla le autorizzazioni.

Per cercare e associare tag alle risorse Spanner, sono necessari determinati ruoli e autorizzazioni di Identity and Access Management (IAM). Per maggiori dettagli, consulta Ruoli e autorizzazioni IAM richiesti per Data Catalog.

Creare modelli di tag

I modelli di tag sono strutture riutilizzabili per creare rapidamente nuovi tag. I modelli ti aiutano a evitare la duplicazione del lavoro e i tag incompleti. Crea tutti i modelli di tag di cui hai bisogno.

Per scoprire di più, vedi Tag e modelli di tag.

Associare tag alle risorse Spanner

L'associazione di tag alle risorse Spanner ti consente di:

Aggiungi i metadati dell'attività alle risorse.
Cerca le risorse in base ai metadati aziendali e ad altri metadati personalizzati.

Per scoprire di più, vedi Tag e modelli di tag.

Cercare asset Spanner

Utilizza la pagina di ricerca di Dataplex nella console Google Cloud per cercare asset Spanner.

Vai alla pagina di ricerca di Dataplex.

Vai a Dataplex
Nel riquadro Filtri, in Sistemi, seleziona Spanner.

Dataplex mostra tutti gli asset Spanner noti.
(Facoltativo) Per restringere la ricerca, esegui una delle seguenti operazioni:
- Utilizza la ricerca filtrata nella pagina Ricerca. Seleziona le caselle di controllo in Tipi di dati, Progetti e Tag.
- Nel campo di ricerca, aggiungi un parametro di ricerca dopo system=cloud_spanner. Separa i parametri con spazi.
Ad esempio, per visualizzare solo i database, inserisci il seguente testo nel campo di ricerca e premi Enter.
```
 system=cloud_spanner type=database
```
Nota: per cercare le istanze Spanner, utilizza type=service. Per cercare una configurazione dell'istanza, utilizza instance_config=configuration-name.

Puoi anche utilizzare le parentesi e gli operatori logici and e or per espressioni complesse. Per scoprire di più sulle espressioni che puoi utilizzare nel campo di ricerca, consulta la sintassi di ricerca di Data Catalog.
Nella tabella dei risultati, fai clic sul nome di una risorsa per visualizzarne i metadati.
(Facoltativo) Esegui una delle seguenti operazioni:
- Fai clic su AGGIUNGI PANORAMICA per aggiungere una descrizione in formato RTF della risorsa.
- Fai clic su ALLEGA TAG per aggiungere un tag all'asset.
- Per una tabella, fai clic sulla scheda SCHEMA per visualizzare le colonne della tabella.
- Per un'istanza (SERVICE), per visualizzare i database dei membri, fai clic sulla scheda ELENCO ELEMENTI e poi su VISUALIZZA ELEMENTI SECONDARI NELLA Ricerca. Se la scheda ELENCO ENTRY non viene visualizzata, l'istanza non ha database.

Esempio di flusso di lavoro: visualizzazione dettagliata dall'istanza alle colonne

In questo esempio di flusso di lavoro, inizi cercando un'istanza Spanner, poi visualizzi un database membro, poi una tabella in quel database e infine le colonne della tabella.

Vai alla pagina di ricerca di Dataplex.

Vai a Dataplex
Nel riquadro Filtri, in Sistemi, seleziona Spanner.
Per visualizzare tutte le istanze Spanner in Data Catalog, seleziona la casella di controllo Servizio in Tipi di dati oppure inserisci il seguente testo nel campo di ricerca e premi Enter.
```
system=cloud_spanner type=service
```
Seleziona un nome per l'istanza.
Nella pagina Dettagli del servizio Spanner, fai clic sulla scheda ELENCO ENTRY e poi su VISUALIZZA ENTRY SECONDARIE NELLA Ricerca.

Dataplex mostra i database nell'istanza.

Nota: se non è presente la scheda ELENCO ENTRY, torna alla pagina Ricerca e scelgo un'altra istanza.
Nella pagina Dettagli del database Spanner, fai clic sulla scheda ELENCO ELEMENTI e poi su VISUALIZZA ELEMENTI SECONDARI NELLA Ricerca.

Dataplex mostra le tabelle nel database.
Seleziona il nome di una tabella e poi, nella pagina Dettagli tabella Spanner, fai clic su SCHEMA per visualizzare le colonne della tabella.
(Facoltativo) Per aggiungere un tag a una colonna, fai clic sul segno Più in Tag colonna.

Esporta e importa tag

Quando sposti un'istanza Spanner, il processo di spostamento elimina i tag istanza che hai creato in Data Catalog. Per conservare i tag, devi:

Esegui query sui tag associati all'istanza.
Copia i dettagli dei tag.
Crea i tag nell'istanza spostata.

Spanner sincronizza i dati ogni 6 ore. Eventuali modifiche ai metadati apportate agli asset Spanner, come istanze, database, tabelle, visualizzazioni o colonne, potrebbero richiedere circa 6 ore per essere propagate a Data Catalog.

Esportare i tag dalla configurazione dell'istanza di origine

Per elencare i tag di un'istanza (elemento o gruppo di elementi), utilizza il comando gcloud data-catalog tags list di Google Cloud CLI come segue:

curl \
'https://datacatalog.googleapis.com/v1/projects/PROJECT/locations/LOCATION/entryGroups/ENTRY_GROUP/tags?key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --compressed

Sostituisci quanto segue:

PROJECT: progetto che contiene i tag.
LOCATION: posizione dei tag.
API_KEY: una stringa univoca che ti consente di accedere a un'API.
ACCESS_TOKEN: il token di accesso utilizzato dalla tua applicazione per autenticarsi al servizio.

Importa i tag nella configurazione della destinazione

Prima di completare questa procedura, svolgi i seguenti passaggi:

Per copiare un tag, crea i tag nell'istanza spostata utilizzando il comando gcloud data-catalog tags create come segue:

curl --request POST \
'https://datacatalog.googleapis.com/v1/entries:lookup?fullyQualifiedName=FQN&location=LOCATION&project=PROJECT&key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --header 'Content-Type: application/json' \
  --data '{"column":"myColumnName","name":"myTagName","template":"myTemplateName","fields":{"myDoubleField":{"doubleValue":0}}}' \
  --compressed

Sostituisci quanto segue:

FQN: nome completo (FQN) della risorsa. I FQDN possono assumere due forme:

Per le risorse non regionalizzate: {SYSTEM}:{PROJECT}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

Per le risorse a livello di regione: {SYSTEM}:{PROJECT}.{LOCATION_ID}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

Esempio di tabella DPMS:

dataproc_metastore:{PROJECT_ID}.{LOCATION_ID}.{INSTANCE_ID}.{DATABASE_ID}.{TABLE_ID}
LOCATION: posizione in cui viene eseguita la ricerca.
PROJECT: progetto in cui viene eseguita la ricerca.
API_KEY: una stringa univoca che ti consente di accedere a un'API.
ACCESS_TOKEN: il token di accesso utilizzato dalla tua applicazione per autenticarsi al servizio.

Ruoli e autorizzazioni IAM richiesti per Data Catalog

La tabella seguente mostra i ruoli e le autorizzazioni IAM richiesti per le varie operazioni di Data Catalog.

Operazione di Data Catalog	Risorsa Spanner	Ruoli o autorizzazioni richiesti
crea un modello di tag	N/D	roles/datacatalog.tagTemplateCreator
Cercare risorse Spanner	Istanza	spanner.instances.get
	Database	spanner.databases.get
	Tabella	spanner.databases.get
	Visualizzazioni	spanner.databases.get
Visualizzare i tag pubblici	Istanza	spanner.instances.get
	Database	spanner.databases.get
	Tabella	spanner.databases.get
	Visualizzazioni	spanner.databases.get
Visualizzare i tag privati	Istanze	datacatalog.tagTemplates.getTag + spanner.instances.get
	Database	datacatalog.tagTemplates.getTag + spanner.databases.get
	Tabelle	datacatalog.tagTemplates.getTag + spanner.databases.get
	Visualizzazioni	datacatalog.tagTemplates.getTag + spanner.databases.get
Collega un tag a una risorsa Spanner utilizzando un modello di tag	Istanze	datacatalog.tagTemplates.use + spanner.instances.updateTag
	Database	datacatalog.tagTemplates.use + spanner.databases.updateTag
	Tabelle	datacatalog.tagTemplates.use + spanner.databases.updateTag
	Visualizzazioni	datacatalog.tagTemplates.use + spanner.databases.updateTag

L'autorizzazione spanner.instances.UpdateTag è inclusa nel seguente ruolo:

roles/spanner.admin

L'autorizzazione spanner.databases.UpdateTag è inclusa nei seguenti ruoli:

roles/spanner.admin
roles/spanner.databaseAdmin
roles/spanner.databaseUser

Per ulteriori informazioni, consulta Ruoli predefiniti.