Gestisci le risorse utilizzando Data Catalog

Questa pagina spiega come cercare e gestire le risorse Spanner utilizzando Data Catalog.

Data Catalog è un servizio di gestione dei metadati scalabile e completamente gestito all'interno di Dataplex. Cataloga automaticamente i seguenti metadati relativi a istanze, database, tabelle, colonne e viste di Spanner:

  • Nome e nome completo
  • Località (regione)
  • Data di creazione e data dell'ultima modifica
  • Schema (per tabelle e viste)
  • Descrizione

I metadati Spanner vengono sincronizzati automaticamente con Data Catalog a intervalli regolari, di solito a intervalli di alcune ore. Puoi usare Data Catalog per scoprire e comprendere i metadati Spanner. Utilizza Data Catalog per svolgere le seguenti attività:

  • Analisi, incluse dipendenze e idoneità a un caso d'uso
  • Gestione del cambiamento
  • Spostamento dei dati (pipeline)
  • Evoluzione dello schema

Con Data Catalog, puoi organizzare i metadati associando tag alle voci di metadati di Spanner. Ogni tag può avere più campi di metadati e può essere basato su un modello di tag predefinito o personalizzato.

Ad esempio, puoi collegare il seguente tag a una colonna che contiene un codice fiscale, ovvero informazioni che consentono l'identificazione personale (PII):

pii:true
pii_type:SSN

Quando sposta un'istanza che utilizza i tag, questi non vengono spostati automaticamente nell'istanza di destinazione. Devi esportare i tag dall'istanza di origine prima di spostare l'istanza e importare i tag nell'istanza di destinazione. Per maggiori informazioni, consulta la sezione Esportare e importare tag.

Per scoprire di più su Data Catalog, consulta Che cos'è Data Catalog.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  5. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  6. Abilitare l'API Data Catalog per il progetto.

    Abilitare l'API Data Catalog

  7. Controlla le autorizzazioni.

    Per cercare e collegare tag agli asset Spanner, devi disporre di determinati ruoli e autorizzazioni di Identity and Access Management (IAM). Per maggiori dettagli, consulta Ruoli e autorizzazioni IAM richiesti per Data Catalog.

Creare modelli di tag

I templi dei tag sono strutture riutilizzabili per creare rapidamente nuovi tag. I modelli consentono di evitare la duplicazione del lavoro e i tag incompleti. Crea tutti i modelli di tag di cui hai bisogno.

Per scoprire di più, consulta Tag e modelli di tag.

Associa tag agli asset Spanner

Il collegamento di tag agli asset Spanner ti consente di:

  • Aggiungi i metadati dell'attività alle risorse.
  • Cerca le risorse in base ai metadati aziendali e ad altri metadati personalizzati.

Per scoprire di più, consulta Tag e modelli di tag.

Cerca asset Spanner

Usa la pagina di ricerca di Dataplex nella console Google Cloud per cercare asset Spanner.

  1. Vai alla pagina di ricerca di Dataplex.

    Vai a Dataplex

  2. Nel riquadro Filtri, in Sistemi, seleziona Spanner.

    Dataplex mostra tutti gli asset Spanner noti.

  3. (Facoltativo) Esegui una delle seguenti operazioni per restringere la ricerca:

    • Utilizza la ricerca per facet nella pagina Ricerca. Seleziona le caselle di controllo in Tipi di dati, Progetti e Tag.

    • Nel campo di ricerca, aggiungi un parametro di ricerca dopo system=cloud_spanner. Separa i parametri con degli spazi.

    Ad esempio, per visualizzare solo i database, inserisci il seguente testo nel campo di ricerca e premi Enter.

     system=cloud_spanner type=database
    

    Puoi anche utilizzare le parentesi e gli operatori logici and e or per le espressioni complesse. Per scoprire di più sulle espressioni che puoi utilizzare nel campo di ricerca, consulta la sintassi di ricerca di Data Catalog.

  4. Nella tabella dei risultati, fai clic sul nome di una risorsa per visualizzarne i metadati.

  5. (Facoltativo) Esegui una delle seguenti operazioni:

    • Fai clic su AGGIUNGI PANORAMICA per aggiungere una descrizione RTF dell'asset.
    • Fai clic su ALLEGA TAG per aggiungere un tag all'asset.
    • Per una tabella, fai clic sulla scheda SCHEMA per visualizzare le colonne della tabella.
    • Per un'istanza (SERVICE), per visualizzare i database dei membri, fai clic sulla scheda ELENCO DI INGRESSO, quindi su VISUALIZZA LE ENTRATE BAMBINI NELLA RICERCA. Se la scheda ELENCO INGRESSO non viene visualizzata, significa che l'istanza non ha database.

Flusso di lavoro di esempio - Visualizzazione in dettaglio dall'istanza alle colonne

In questo flusso di lavoro di esempio, inizi cercando un'istanza Spanner, quindi visualizzi un database membro, visualizzi una tabella al suo interno e poi visualizzi le colonne della tabella.

  1. Vai alla pagina di ricerca di Dataplex.

    Vai a Dataplex

  2. Nel riquadro Filtri, in Sistemi, seleziona Spanner.

  3. Per visualizzare tutte le istanze Spanner in Data Catalog, seleziona la casella di controllo Servizio in Tipi di dati oppure inserisci il seguente testo nel campo di ricerca e premi Enter.

    system=cloud_spanner type=service
    
  4. Seleziona un nome istanza.

  5. Nella pagina Dettagli del servizio Spanner, fai clic sulla scheda ELENCO DI INGRESSO, quindi su VISUALIZZA LE ENTRATE BAMBINI NELLA RICERCA.

    Dataplex visualizza i database nell'istanza.

  6. Nella pagina Dettagli del database di Spanner, fai clic sulla scheda ELENCO DI INGRESSO, quindi su VISUALIZZA LE ENTRATE BAMBINI NELLA RICERCA.

    Dataplex visualizza le tabelle nel database.

  7. Seleziona il nome di una tabella, quindi, nella pagina Dettagli tabella Spanner, fai clic su SCHEMA per visualizzare le colonne della tabella.

  8. (Facoltativo) Per aggiungere un tag a una colonna, fai clic sul segno più in Tag di colonna.

Esportare e importare tag

Quando muovi un'istanza di Spanner, il processo di spostamento elimina i tag di istanza che hai creato in Data Catalog. Per conservare i tag:

  • Esegui una query sui tag associati all'istanza.
  • Copia i dettagli dei tag.
  • Crea i tag nell'istanza spostata.

I dati di sincronizzazione di Spanner ogni 6 ore. Eventuali modifiche ai metadati apportate su asset di Spanner come istanze, database, tabelle, viste o colonne potrebbero richiedere circa 6 ore per essere propagate in Data Catalog.

Esporta i tag dalla configurazione dell'istanza di origine

Per elencare i tag per un'istanza (voce o gruppo di voci), utilizza il comando gcloud data-catalog tags list di Google Cloud CLI come segue:

curl \
'https://datacatalog.googleapis.com/v1/projects/PROJECT/locations/LOCATION/entryGroups/ENTRY_GROUP/tags?key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --compressed

Sostituisci quanto segue:

  • PROJECT: progetto che contiene i tag.
  • LOCATION: posizione dei tag.
  • API_KEY: una stringa univoca che ti consente di accedere a un'API.
  • ACCESS_TOKEN: il token di accesso utilizzato dall'applicazione per eseguire l'autenticazione al servizio.

Importa i tag nella configurazione di destinazione

Prima di completare questa procedura, segui questi passaggi:

Per copiare un tag, crea i tag nell'istanza spostata utilizzando il comando gcloud data-catalog tags create come segue:

curl --request POST \
'https://datacatalog.googleapis.com/v1/entries:lookup?fullyQualifiedName=FQN&location=LOCATION&project=PROJECT&key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --header 'Content-Type: application/json' \
  --data '{"column":"myColumnName","name":"myTagName","template":"myTemplateName","fields":{"myDoubleField":{"doubleValue":0}}}' \
  --compressed

Sostituisci quanto segue:

  • FQN: nome completo (FQN) della risorsa. I nomi di dominio completi assumono due forme:

    Per le risorse non regionalizzate: {SYSTEM}:{PROJECT}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

    Per le risorse regionalizzate: {SYSTEM}:{PROJECT}.{LOCATION_ID}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

    Esempio per una tabella DPMS:

    dataproc_metastore:{PROJECT_ID}.{LOCATION_ID}.{INSTANCE_ID}.{DATABASE_ID}.{TABLE_ID}

  • LOCATION: località in cui viene eseguita la ricerca.

  • PROJECT: progetto in cui viene eseguita la ricerca.

  • API_KEY: una stringa univoca che ti consente di accedere a un'API.

  • ACCESS_TOKEN: il token di accesso utilizzato dall'applicazione per eseguire l'autenticazione al servizio.

Autorizzazioni e ruoli IAM richiesti per Data Catalog

La seguente tabella mostra i ruoli e le autorizzazioni IAM richiesti per le varie operazioni di Data Catalog.

Operazione di Data Catalog Risorsa Spanner Autorizzazioni o ruoli richiesti
Crea un modello di tag N/A roles/datacatalog.tagTemplateCreator
Cerca risorse Spanner Istanza spanner.instances.get
Database spanner.databases.get
Tabella spanner.databases.get
Viste spanner.databases.get
Visualizza tag pubblici Istanza spanner.instances.get
Database spanner.databases.get
Tabella spanner.databases.get
Viste spanner.databases.get
Visualizza tag privati Istanze datacatalog.tagTemplates.getTag + spanner.instances.get
Database datacatalog.tagTemplates.getTag + spanner.databases.get
Tabelle datacatalog.tagTemplates.getTag + spanner.databases.get
Viste datacatalog.tagTemplates.getTag + spanner.databases.get
Collega un tag a una risorsa Spanner utilizzando un modello di tag Istanze datacatalog.tagTemplates.use + spanner.instances.updateTag
Database datacatalog.tagTemplates.use + spanner.databases.updateTag
Tabelle datacatalog.tagTemplates.use + spanner.databases.updateTag
Viste datacatalog.tagTemplates.use + spanner.databases.updateTag

L'autorizzazione spanner.instances.UpdateTag è inclusa nel seguente ruolo:

  • roles/spanner.admin

L'autorizzazione spanner.databases.UpdateTag è inclusa nei seguenti ruoli:

  • roles/spanner.admin
  • roles/spanner.databaseAdmin
  • roles/spanner.databaseUser

Per ulteriori informazioni, consulta Ruoli predefiniti.

Passaggi successivi