Gestire gli asset di dati utilizzando Data Catalog

Data Catalog è una funzionalità di Dataplex che cataloga automaticamente i metadati sulle risorse Bigtable. Questa funzionalità consente alla tua organizzazione di cercare e gestire gli asset di dati Bigtable.

I metadati vengono sincronizzati automaticamente da Bigtable a Data Catalog per le seguenti risorse Bigtable:

  • Istanze
  • Cluster
  • Tabelle, inclusi i dettagli famiglia di colonne

Data Catalog è un servizio di gestione dei metadati completamente gestito all'interno di Dataplex. che fornisce meccanismi di visualizzazione e tagging unificati per i metadati tecnici e aziendali. Per scoprire di più su Data Catalog e perché dovresti utilizzarlo, consulta Che cos'è Data Catalog.

Vantaggi dell'utilizzo di Data Catalog con Bigtable

Le informazioni di Data Catalog sui tuoi dati possono essere utili per analisi, riutilizzo, sviluppo di applicazioni e gestione dei dati.

Puoi cercare le voci in Data Catalog per nome della risorsa o per dettagli. Ad esempio, puoi cercare il nome di un'istanza per trovare la voce relativa a un'istanza o cercare una famiglia di colonne per trovare la voce di una tabella. Puoi anche utilizzare una ricerca sfaccettata, applicando filtri per restringere la ricerca. Per ulteriori informazioni, consulta Cercare e visualizzare asset di dati con Data Catalog.

Il tagging degli asset di dati può aiutarti a comprendere e catalogare i dati disponibili nelle tabelle Bigtable per renderli più rilevabili e disponibili per la ricerca da parte di altri utenti di Data Catalog e parte della tua infrastruttura dati più ampia. Puoi utilizzare i tag per aggiungere i tuoi metadati ai metadati catalogati e utilizzarli per eseguire ricerche.

Inizia a utilizzare Data Catalog

Per iniziare a utilizzare Data Catalog per gestire gli asset di dati di Bigtable, completa le seguenti attività:

  1. Se non hai mai utilizzato Data Catalog, abilita l'API.

  2. Concedi ruoli IAM alle entità che richiedono l'accesso alle voci Bigtable in Data Catalog.

  3. Per scoprire di più su come cercare asset di dati, leggi l'articolo Come eseguire ricerche con Data Catalog.

  4. Consulta la sintassi di ricerca di Data Catalog per capire come trovare i tuoi metadati.

  5. Per ulteriori informazioni sul tagging delle voci di Data Catalog, consulta Tag e modelli di tag

Modalità di ricerca dei metadati Bigtable

Puoi cercare metadati Bigtable sincronizzati utilizzando Data Catalog.

Oltre ai qualificatori standard, puoi cercare risorse Bigtable con quanto segue:

  • Istanza

    • Nome istanza Bigtable
    • ID istanza Bigtable
    • Località del cluster
    • ID cluster
  • Tabella

    • ID tabella
    • Nome famiglia di colonne
    • Nome istanza Bigtable
    • ID istanza Bigtable

Ruoli obbligatori

La visualizzazione, il tagging e la ricerca di risorse Bigtable in Data Catalog hanno requisiti di autorizzazione diversi. In generale, concedi alle entità della tua organizzazione il ruolo minimo necessario per svolgere un'attività.

Autorizzazione per visualizzare tag pubblici e privati

Per ottenere le autorizzazioni necessarie per visualizzare i tag pubblici e privati nelle risorse Bigtable, chiedi all'amministratore di concederti i ruoli IAM seguenti:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per visualizzare i tag pubblici e privati. Le autorizzazioni esatte necessarie sono le seguenti:

  • bigtable.instances.get
  • bigtable.clusters.get
  • bigtable.tables.get
  • datacatalog.tagTemplates.getTag

Autorizzazione per cercare risorse Bigtable

Per ottenere le autorizzazioni necessarie per cercare le risorse Bigtable in Data Catalog, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per cercare le risorse Bigtable. Le autorizzazioni esatte necessarie sono le seguenti:

  • bigtable.instances.get
  • bigtable.clusters.get
  • bigtable.tables.get

Autorizzazione per collegare tag alle risorse Bigtable

Per ottenere le autorizzazioni necessarie per collegare i tag alle risorse Bigtable in Data Catalog, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per aggiungere tag pubblici e privati. Le autorizzazioni esatte necessarie sono le seguenti:

  • bigtable.instances.update
  • bigtable.clusters.update
  • bigtable.tables.update
  • datacatalog.tagTemplates.use
  • datacatalog.entries.updateTag

(Facoltativo) Creare un ruolo personalizzato

Puoi creare un ruolo personalizzato da concedere agli utenti che richiedono l'accesso completo a tutti i metadati Bigtable in Data Catalog nel tuo progetto o nella tua organizzazione. Poi puoi rendere qualsiasi account utente o di servizio che deve accedere a un'entità del ruolo personalizzato. Per scoprire di più sui ruoli personalizzati, consulta Ruoli e autorizzazioni.

Scegli un nome significativo per il ruolo, ad esempio Editor cataloghi dati Bigtable, quindi assegna solo le entità che devono accedere al ruolo. Per istruzioni di configurazione, consulta Creazione di un ruolo personalizzato.

Concedi le autorizzazioni seguenti al ruolo personalizzato:

  • bigtable.instances.get
  • bigtable.instances.update
  • bigtable.clusters.get
  • bigtable.clusters.update
  • bigtable.tables.get
  • bigtable.tables.update
  • datacatalog.tagTemplates.getTag
  • datacatalog.tagTemplates.use

Per maggiori dettagli sulle autorizzazioni Data Catalog, vedi Ruoli per la ricerca nelle risorse Google Cloud. Per descrizioni delle autorizzazioni Bigtable, vedi Autorizzazioni.

Vincoli noti

La sezione seguente elenca alcuni vincoli da considerare prima di utilizzare Data Catalog per gestire i metadati Bigtable.

Vincoli di località

Se la tua organizzazione ha configurato i vincoli di località, le voci di metadati per le risorse Bigtable potrebbero non essere sincronizzate con Data Catalog. Tutte le voci create prima di applicare i vincoli di località vengono conservate da Data Catalog.

Per consentire a Data Catalog di caricare le risorse, ti consigliamo di aggiungere global al criterio per località.

Eccezione nome famiglia di colonne

L'API Data Catalog rifiuta le richieste in cui il nome della famiglia di colonne nella richiesta include un punto (.). Ad esempio, se il nome della famiglia di colonne è personal.info.

Passaggi successivi