Cercare risorse in Dataplex Catalog

Questo documento descrive come utilizzare la ricerca in Dataplex Catalog per cercare risorse come set di dati BigQuery, istanze Cloud SQL e altre. Per ulteriori informazioni sugli asset Google Cloud supportati nel Catalogo Dataplex, consulta Origini Google Cloud supportate.

Ambito di ricerca

I risultati di ricerca in Dataplex Catalog rispettano le autorizzazioni di cui disponi sulle risorse corrispondenti nei sistemi di origine.

Ad esempio, se disponi dell'accesso in lettura ai metadati BigQuery di un oggetto, questo viene visualizzato nei risultati di ricerca di Dataplex Catalog. Se hai accesso a una tabella BigQuery, ma non al set di dati contenente la tabella, la tabella viene comunque visualizzata come previsto nella ricerca del Catalogo Dataplex.

I risultati di ricerca includono solo le risorse che appartengono allo stesso perimetro VPC-SC del progetto in cui viene eseguita la ricerca. Quando utilizzi la console Google Cloud, si tratta del progetto selezionato nella console.

Per ampliare l'ambito dei risultati di ricerca oltre le risorse all'interno del perimetro di Controlli di servizio VPC del progetto, utilizza le regole di instradamento in entrata e in uscita di Controlli di servizio VPC. Queste regole facilitano lo scambio di dati privato ed efficiente all'interno della tua organizzazione. Puoi configurare le regole di inoltro e in uscita utilizzando la console Google Cloud o tramite file JSON o YAML. Fai riferimento al seguente esempio YAML e consulta la documentazione di VPC Service Controls per personalizzare la regola in base ai tuoi requisiti specifici.

egressPolicies:
  - egressFrom:
      identityType: ANY_USER_ACCOUNT
    egressTo:
      # Specify which resources should be present in the search results. In this example,
      # BigQuery.
      operations:
      - methodSelectors:
        - method: '*'
        serviceName: bigquery.googleapis.com
      # Specify project ids under which the search is performed.
      resources:
      - projects/SEARCH_PROJECT_ID
ingressPolicies:
  - ingressFrom:
      identityType: ANY_USER_ACCOUNT
      sources:
      - accessLevel: '*'
    ingressTo:
      # Specify which resources should be present in the search results. In this example,
      # BigQuery.
      operations:
      - methodSelectors:
        - method: '*'
        serviceName: bigquery.googleapis.com
      # Specify project ids to expose in search results.
      resources:
      - projects/INGRESS_PROJECT_ID

Per saperne di più sui ruoli di Identity and Access Management di Dataplex Catalog, consulta Ruoli IAM di Dataplex.

Limitazioni del richiamo nella ricerca

Le query di ricerca di Dataplex Catalog non garantiscono un recupero completo. I risultati corrispondenti alla query potrebbero non essere restituiti, nemmeno nelle pagine di risultati successive. Inoltre, i risultati restituiti (e non restituiti) possono variare se ripeti le query di ricerca.

Filtri

I filtri ti consentono di restringere i risultati di ricerca. Tutti i filtri sono raggruppati in sezioni:

  • Sistemi come BigQuery, Cloud SQL e altri. Il sistema Dataplex contiene voci personalizzate.
  • Aspetti (tag) elenca tutti gli aspetti a tua disposizione.
  • Progetto elenca tutti i progetti a tua disposizione.
  • Gli alias di tipo descrivono i tipi di risorse, come database, set di dati, modelli, tabelle, visualizzazioni, servizi e tipi personalizzati.
  • I set di dati provengono da BigQuery.

Puoi combinare i filtri di più sezioni per trovare gli asset che corrispondono almeno a una condizione di ogni sezione selezionata. Più filtri selezionati in un'unica sezione vengono valutati utilizzando l'operatore logico OR.

Ad esempio, prendi in considerazione la combinazione di filtri nell'immagine seguente (fai clic sull'immagine per ingrandirla). Sono selezionati i seguenti filtri di ricerca: sistemiBigQuery, alias di tipo table e view, aspetti My aspect type 1 e My aspect type 2, progetto my-test-project e set di datitest_bq_dataset.

Filtri di ricerca che mostrano più selezioni.

Dataplex Catalog cerca i seguenti asset:

  • Tabelle BigQuery in test_bq_dataset con aspetto My aspect type 1
  • Tabelle BigQuery in test_bq_dataset con aspetto My aspect type 2
  • Viste BigQuery in test_bq_dataset con aspetto My aspect type 1
  • Viste BigQuery in test_bq_dataset con aspetto My aspect type 2

Filtra per valore dell'aspetto

I filtri Aspetti ti consentono di eseguire query sugli asset taggati utilizzando un determinato modello. Puoi utilizzare il menu Personalizza per perfezionare ulteriormente i risultati efiltrare in base a valori specifici degli aspetti. Le condizioni di filtro dei valori dell'aspetto dipendono dal tipo di dati del campo dell'aspetto. Ad esempio, per i campi datetime e number, puoi specificare una data specifica o un intervallo.

Visibilità dei filtri

I filtri Sistemi, Alias tipo, Progetto e Set di dati vengono visualizzati in base alla query corrente nel campo Ricerca.

Prima di iniziare

Prima di cercare risorse, assicurati di disporre dei ruoli richiesti e attiva l'API.

Ruoli obbligatori

Questa sezione descrive i ruoli e le autorizzazioni necessari per cercare risorse e accedere ai risultati di ricerca.

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.

Ruoli obbligatori per la ricerca delle voci

Per cercare le voci, devi disporre di almeno uno dei ruoli IAM di Dataplex Catalog per il progetto utilizzato per la ricerca. Le autorizzazioni per i risultati di ricerca vengono controllate indipendentemente dal progetto selezionato.

Ruoli obbligatori per accedere ai risultati di ricerca

I risultati di ricerca in Dataplex Catalog sono definiti in base al tuo ruolo. Per cercare un asset in Dataplex Catalog, devi avere le autorizzazioni per accedere alla risorsa corrispondente nel sistema di origine. Per ulteriori informazioni, consulta la sezione Ambito di ricerca di questo documento.

Ad esempio, per cercare set di dati, tabelle, viste e modelli BigQuery, devi disporre delle rispettive autorizzazioni per queste voci. Per ulteriori informazioni, consulta Autorizzazioni BigQuery.

Il seguente elenco descrive le autorizzazioni minime richieste:

  • Per cercare una tabella, devi disporre dell'autorizzazione bigquery.tables.get per quella tabella.
  • Per cercare un set di dati, devi disporre dell'autorizzazione bigquery.datasets.get per quel set di dati.
  • Per cercare i metadati di un set di dati o di una tabella, devi disporre del ruolo Visualizzatore metadati BigQuery (roles/bigquery.metadataViewer).

Un altro esempio: per cercare istanze, database, schemi, tabelle e viste Cloud SQL, devi disporre delle rispettive autorizzazioni per queste voci. Per ulteriori informazioni, consulta Ruoli e autorizzazioni di Cloud SQL.

Per cercare voci personalizzate, devi disporre del ruolo Dataplex Catalog Viewer (roles/dataplex.catalogViewer).

Abilita l'API

Enable the Dataplex API.

Enable the API

Cerca risorse

Console

Per cercare risorse, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Ricerca di Dataplex.

    Vai a Cerca

  2. Per Scegli la piattaforma di ricerca, seleziona Dataplex Catalog come modalità di ricerca.

    Se selezioni Dataplex Catalog, puoi eseguire ricerche nell'archiviazione dei metadati di Dataplex Catalog. Se sei già un utente di Data Catalog, la selezione di Data Catalog ti consente di eseguire ricerche nel repository di Data Catalog.

  3. Nel campo di ricerca, inserisci la query o utilizza il riquadro Filtri per perfezionare i parametri di ricerca.

    Puoi aggiungere manualmente i seguenti filtri:

    • Aggiungi un filtro dei progetti: in Progetto, fai clic su Aggiungi progetto. Cerca un progetto specifico, selezionalo e fai clic su Apri.
    • Aggiungi un filtro per tipo di aspetto: in Aspetti, fai clic sul menu Aggiungi altri tipi di aspetto. Cerca un modello specifico, selezionalo e fai clic su Ok.
  4. (Facoltativo) Oltre agli asset a tua disposizione, puoi cercare le risorse disponibili pubblicamente in Google Cloud selezionando Includi set di dati pubblici.

Utilizza i seguenti suggerimenti per creare una query di ricerca:

  • Racchiudi l'espressione di ricerca tra virgolette se contiene spazi. Ad esempio, "search terms".
  • Puoi anteporre una parola chiave a NOT per ottenere la negazione logica del keyword:term filtro. Puoi anche utilizzare gli operatori booleani AND e OR per combinare le espressioni di ricerca. Gli operatori AND, OR e NOT non fanno distinzione tra maiuscole e minuscole.

    Ad esempio, NOT column:term elenca tutte le colonne tranne quelle che corrispondono al termine specificato. Per un elenco di parole chiave e altri termini che puoi utilizzare in una espressione di ricerca di Dataplex Catalog, consulta Sintassi di ricerca.

gcloud

Per cercare le risorse, utilizza il comando gcloud dataplex entries search.

REST

Per cercare le risorse, utilizza il metodo searchEntries.

Visualizzare i dettagli di una voce

Console

Utilizza la ricerca di Dataplex Catalog per visualizzare i dettagli di una voce.

  1. Nella console Google Cloud, vai alla pagina Ricerca di Dataplex.

    Vai a Cerca

  2. Seleziona Dataplex Catalog come modalità di ricerca.

  3. Nella casella di ricerca, inserisci il nome di una voce.

  4. Fai clic sulla voce.

    Viene visualizzata la pagina dei dettagli della voce. La pagina include le seguenti sezioni:

    • Dettagli della voce: include informazioni come tipo di voce, sistema, piattaforma, nome completo, ora di creazione, ora dell'ultima modifica, descrizione e responsabili.
    • Panoramica: una panoramica della voce, se disponibile.
    • Aspetti: gli aspetti obbligatori e facoltativi definiti per la voce. Per ulteriori informazioni, consulta Categorie di aspetti.

gcloud

Per visualizzare i dettagli di una voce, utilizza il comando gcloud dataplex entries lookup.

REST

Per visualizzare i dettagli di una voce, utilizza il metodo lookupEntry.

Passaggi successivi