Gestisci le risorse utilizzando Data Catalog

Questa pagina spiega come cercare e gestire Spanner mediante Data Catalog.

Data Catalog è un servizio di gestione dei metadati scalabile e completamente gestito, Dataplex. Cataloga automaticamente i seguenti metadati Istanze, database, tabelle, colonne e viste Spanner:

  • Nome e nome completo
  • Località (regione)
  • Data di creazione e data dell'ultima modifica
  • Schema (per tabelle e viste)
  • Descrizione

Spanner i metadati vengono sincronizzati automaticamente con Data Catalog a intervalli regolari intervalli, di solito a intervalli di alcune ore. Puoi utilizzare Data Catalog per per il rilevamento e la comprensione dei metadati Spanner. Utilizza le funzionalità di Data Catalog per supportare le seguenti attività:

  • Analisi, incluse le dipendenze e l'idoneità per un caso d'uso
  • Gestione dei cambiamenti
  • Spostamento dei dati (pipeline)
  • Evoluzione dello schema

Con Data Catalog puoi selezionare i metadati associando tag a Voci di metadati Spanner. Ogni tag può avere più metadati e può essere basato su un modello di tag predefinito o personalizzato.

Ad esempio, potresti collegare il seguente tag a una colonna che contiene un codice fiscale, ovvero informazioni che consentono l'identificazione personale (PII):

pii:true
pii_type:SSN

Quando sposta un'istanza che utilizza i tag, questi non vengono automaticamente spostati nell'istanza di destinazione. È invece necessario esportare i tag dell'istanza di origine prima di spostare l'istanza e importare i tag nell'istanza di destinazione. Per ulteriori informazioni, vedi Esportare e importare tag.

Per scoprire di più su Data Catalog, consulta Che cos'è Data Catalog.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  6. Abilitare l'API Data Catalog per il progetto.

    Abilita l'API Data Catalog

  7. Controlla le autorizzazioni.

    Devi disporre di determinati ruoli e autorizzazioni di Identity and Access Management (IAM) per cercare e collegare tag agli asset Spanner. Per maggiori dettagli, vedi Ruoli e autorizzazioni IAM richiesti per Data Catalog.

Creare modelli di tag

Le templi dei tag sono strutture riutilizzabili per creare rapidamente nuovi tag. I modelli ti consentono di evitare la duplicazione del lavoro e i tag incompleti. Crea il maggior numero possibile di contenuti di tag in base alle tue esigenze.

Per ulteriori informazioni, consulta la sezione Tag e tag modelli.

Associa i tag agli asset Spanner

Collegare i tag agli asset Spanner ti consente di:

  • Aggiungi metadati dell'attività alle risorse.
  • Cerca gli asset in base a metadati dell'attività e altri metadati personalizzati.

Per ulteriori informazioni, consulta la sezione Tag e tag modelli.

Cerca asset Spanner

Utilizzare la pagina di ricerca di Dataplex nella console Google Cloud per cercare asset Spanner.

  1. Vai alla pagina di ricerca di Dataplex.

    Vai a Dataplex

  2. Nel riquadro Filtri, in Sistemi, seleziona Spanner.

    Dataplex visualizza tutti gli asset Spanner noti.

  3. (Facoltativo) Per restringere la ricerca, esegui una delle seguenti operazioni:

    • Puoi utilizzare la ricerca con facet nella pagina Ricerca. Seleziona caselle di controllo sotto Tipi di dati, Progetti e Tag.

    • Nel campo di ricerca, aggiungi un parametro di ricerca dopo system=cloud_spanner. Separa i parametri con spazi.

    Ad esempio, per visualizzare solo i database, inserisci il seguente testo nella ricerca campo, quindi premi Enter.

     system=cloud_spanner type=database
    

    Puoi anche utilizzare le parentesi e gli operatori logici and e or per espressioni complesse. Per ulteriori informazioni sulle espressioni che puoi nel campo di ricerca, consulta Ricerca in Data Catalog a riga di comando.

  4. Nella tabella dei risultati, fai clic sul nome di una risorsa di cui visualizzare i metadati. dell'asset.

  5. (Facoltativo) Esegui una delle seguenti operazioni:

    • Fai clic su AGGIUNGI PANORAMICA per aggiungere una descrizione RTF dell'asset.
    • Fai clic su COLLEGA TAG per aggiungere un tag alla risorsa.
    • Per visualizzare una tabella, fai clic sulla scheda SCHEMA per visualizzare le relative colonne.
    • Per un'istanza (SERVICE), per visualizzare i database membri, fai clic sull'icona Scheda ELENCO LE VOCITE, quindi fai clic su VISUALIZZA LE ENTRATE MINORI NELLA RICERCA. (Se La scheda ENTRY LIST non viene visualizzata, significa che l'istanza non ha database.

Flusso di lavoro di esempio - Visualizzazione in dettaglio dall'istanza alle colonne

In questo flusso di lavoro di esempio, inizi cercando uno Spanner Istanza, quindi visualizzare un database di membri, visualizzare una tabella in quel database quindi visualizza le colonne della tabella.

  1. Vai alla pagina di ricerca di Dataplex.

    Vai a Dataplex

  2. Nel riquadro Filtri, in Sistemi, seleziona Spanner.

  3. Per visualizzare tutte le istanze Spanner in Data Catalog, seleziona la casella di controllo Servizio in Tipi di dati oppure inserisci testo seguente nel campo di ricerca e premi Enter.

    system=cloud_spanner type=service
    
  4. Seleziona un nome istanza.

  5. Nella pagina Dettagli servizio Spanner, fai clic sulla VOCE ELENCO, quindi fai clic su VISUALIZZA LE SCHEDE MINORI NELLA RICERCA.

    Dataplex visualizza i database nell'istanza.

  6. Nella pagina Dettagli database Spanner fai clic sulla VOCE ELENCO, quindi fai clic su VISUALIZZA LE SCHEDE MINORI NELLA RICERCA.

    Dataplex visualizza le tabelle nel database.

  7. Seleziona il nome di una tabella e nella pagina Dettagli tabella di Spanner fai clic su SCHEMA per visualizzare le colonne della tabella.

  8. (Facoltativo) Per aggiungere un tag a una colonna, fai clic sul segno più in Colonna .

Esportare e importare i tag

Quando sposta un'istanza Spanner, il processo di spostamento elimina i tag di istanza creati Data Catalog (Catalogo dati). Per conservare i tag, procedi nel seguente modo:

  • Esegui una query sui tag associati all'istanza.
  • Copia i dettagli dei tag.
  • Crea i tag sull'istanza spostata.

Spanner sincronizza i dati ogni 6 ore. Eventuali modifiche ai metadati apportate Asset Spanner come istanze, database, tabelle, viste la propagazione delle colonne a Data Catalog potrebbe richiedere circa 6 ore.

Esporta i tag dalla configurazione dell'istanza di origine

Per elencare i tag per un'istanza (voce o gruppo di voci), utilizza Google Cloud CLI gcloud data-catalog tags list come segue:

curl \
'https://datacatalog.googleapis.com/v1/projects/PROJECT/locations/LOCATION/entryGroups/ENTRY_GROUP/tags?key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --compressed

Sostituisci quanto segue:

  • PROJECT: progetto che contiene i tag.
  • LOCATION: posizione dei tag.
  • API_KEY: una stringa univoca che ti consente di accedere a un'API.
  • ACCESS_TOKEN: il token di accesso che la tua applicazione utilizza per autenticarsi al servizio.

Importa i tag nella configurazione di destinazione

Prima di completare questa procedura, segui questi passaggi:

Per copiare un tag, crea i tag nell'istanza spostata utilizzando il metodo gcloud data-catalog tags create come segue:

curl --request POST \
'https://datacatalog.googleapis.com/v1/entries:lookup?fullyQualifiedName=FQN&location=LOCATION&project=PROJECT&key=API_KEY' \
  --header 'Authorization: Bearer ACCESS_TOKEN' \
  --header 'Accept: application/json' \
  --header 'Content-Type: application/json' \
  --data '{"column":"myColumnName","name":"myTagName","template":"myTemplateName","fields":{"myDoubleField":{"doubleValue":0}}}' \
  --compressed

Sostituisci quanto segue:

  • FQN: nome completo (FQN) della risorsa. Per i nomi di dominio è necessario moduli:

    Per le risorse non regionalizzate: {SYSTEM}:{PROJECT}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

    Per le risorse regionalizzate: {SYSTEM}:{PROJECT}.{LOCATION_ID}.{PATH_TO_RESOURCE_SEPARATED_WITH_DOTS}

    Esempio per una tabella DPMS:

    dataproc_metastore:{PROJECT_ID}.{LOCATION_ID}.{INSTANCE_ID}.{DATABASE_ID}.{TABLE_ID}

  • LOCATION: località in cui viene eseguita la ricerca.

  • PROJECT: progetto in cui viene eseguita la ricerca.

  • API_KEY: una stringa univoca che ti consente di accedere a un'API.

  • ACCESS_TOKEN: il token di accesso che la tua applicazione utilizza per autenticarsi al servizio.

Ruoli e autorizzazioni IAM richiesti per Data Catalog

La tabella seguente mostra le autorizzazioni e i ruoli IAM richiesti per le varie operazioni di Data Catalog.

Operazione di Data Catalog Risorsa Spanner Ruoli o autorizzazioni richiesti
crea un modello di tag N/D roles/datacatalog.tagTemplateCreator
Cerca risorse Spanner Istanza spanner.instances.get
Database spanner.databases.get
Tabella spanner.databases.get
Visualizzazioni spanner.databases.get
Visualizza tag pubblici Istanza spanner.instances.get
Database spanner.databases.get
Tabella spanner.databases.get
Visualizzazioni spanner.databases.get
Visualizza tag privati Istanze datacatalog.tagTemplates.getTag + spanner.instances.get
Database datacatalog.tagTemplates.getTag + spanner.databases.get
Tabelle datacatalog.tagTemplates.getTag + spanner.databases.get
Visualizzazioni datacatalog.tagTemplates.getTag + spanner.databases.get
Collega un tag a una risorsa Spanner utilizzando un modello di tag Istanze datacatalog.tagTemplates.use + spanner.instances.updateTag
Database datacatalog.tagTemplates.use + spanner.databases.updateTag
Tabelle datacatalog.tagTemplates.use + spanner.databases.updateTag
Visualizzazioni datacatalog.tagTemplates.use + spanner.databases.updateTag

L'autorizzazione spanner.instances.UpdateTag è inclusa nel seguente ruolo:

  • roles/spanner.admin

L'autorizzazione spanner.databases.UpdateTag è inclusa nei seguenti ruoli:

  • roles/spanner.admin
  • roles/spanner.databaseAdmin
  • roles/spanner.databaseUser

Per saperne di più, vedi Ruoli predefiniti.

Passaggi successivi