Cercare asset di dati in Dataplex Catalog

Utilizza la ricerca in Dataplex Catalog per cercare asset di dati come set di dati BigQuery, istanze Cloud SQL e altri. Per ulteriori informazioni sugli asset Google Cloud supportati in Dataplex Catalog, consulta Origini Google Cloud supportate.

Ambito della ricerca

I risultati di ricerca in Dataplex Catalog rispettano le autorizzazioni di cui disponi sulle risorse corrispondenti nei sistemi di origine.

Ad esempio, se disponi dell'accesso in lettura ai metadati BigQuery questo oggetto viene visualizzato nella tua ricerca in Dataplex Catalog che consentono di analizzare i dati e visualizzare i risultati. Se hai accesso a una tabella BigQuery, ma non alla contenente la tabella, la tabella viene comunque visualizzata come previsto Ricerca in Dataplex Catalog.

I risultati di ricerca includono solo le risorse che appartengono allo stesso perimetro VPC-SC del progetto in base al quale viene eseguita la ricerca. Quando utilizzi il Google Cloud, si tratta del progetto selezionato nella Google Cloud.

Per ampliare l'ambito dei risultati di ricerca oltre le risorse all'interno del perimetro di Controlli di servizio VPC del progetto, utilizza le regole di traffico in entrata e in uscita di Controlli di servizio VPC. Queste regole facilitano lo scambio di dati privato ed efficiente all'interno dell'organizzazione. Puoi configurare le regole in entrata e in uscita utilizzando la console Google Cloud o tramite file JSON o YAML. Fai riferimento all'esempio YAML seguente e consulta la documentazione sui Controlli di servizio VPC per personalizzare la regola in base ai tuoi requisiti specifici.

egressPolicies:
  - egressFrom:
      identityType: ANY_USER_ACCOUNT
    egressTo:
      # Specify which resources should be present in the search results. In this example,
      # BigQuery.
      operations:
      - methodSelectors:
        - method: '*'
        serviceName: bigquery.googleapis.com
      # Specify project ids under which the search is performed.
      resources:
      - projects/SEARCH_PROJECT_ID
ingressPolicies:
  - ingressFrom:
      identityType: ANY_USER_ACCOUNT
      sources:
      - accessLevel: '*'
    ingressTo:
      # Specify which resources should be present in the search results. In this example,
      # BigQuery.
      operations:
      - methodSelectors:
        - method: '*'
        serviceName: bigquery.googleapis.com
      # Specify project ids to expose in search results.
      resources:
      - projects/INGRESS_PROJECT_ID

Per ulteriori informazioni sui ruoli IAM Dataplex Catalog, consulta Ruoli IAM Dataplex.

Limitazioni del richiamo nella ricerca

Le query di ricerca di Dataplex Catalog non garantiscono il richiamo completo. I risultati che corrispondono alla tua query potrebbero non essere restituiti, anche nel risultato successivo pagine. Inoltre, i risultati restituiti (e non restituiti) possono variare se ripeti query di ricerca.

Filtri

I filtri ti consentono di restringere i risultati di ricerca. Tutti i filtri sono raggruppati in sezioni:

  • Sistemi come BigQuery, Cloud SQL e altri. Il sistema Dataplex contiene voci personalizzate.
  • Aspetti (tag) elenca tutti gli aspetti a tua disposizione.
  • In Progetto sono elencati tutti i progetti disponibili per te.
  • Alias dei tipi che descrivono tipi di risorse come database, set di dati modelli, tabelle, viste, servizi e tipi personalizzati.
  • I set di dati provengono da BigQuery.

Puoi combinare i filtri di più sezioni per trovare le risorse corrispondenti almeno una condizione per ogni sezione selezionata. Più filtri selezionati in un'unica sezione vengono valutati utilizzando l'operatore logico OR.

Ad esempio, considera la combinazione di filtri nell'immagine seguente (fai clic sull'immagine per ingrandire). Sono selezionati i seguenti filtri di ricerca: sistemiBigQuery, alias di tipo table e view, aspetti My aspect type 1 e My aspect type 2, progetto my-test-project e set di datitest_bq_dataset.

Filtri di ricerca che mostrano più selezioni.

Dataplex Catalog cerca i seguenti asset:

  • Tabelle BigQuery in test_bq_dataset con aspetto My aspect type 1
  • Tabelle BigQuery in test_bq_dataset con aspetto My aspect type 2
  • Visualizzazioni BigQuery in test_bq_dataset con aspetto My aspect type 1
  • Viste BigQuery in test_bq_dataset con aspetto My aspect type 2

Filtra per valore di aspetto

I filtri Aspetti ti consentono di eseguire query per asset taggati utilizzando una specifica modello. Puoi utilizzare il menu Personalizza per perfezionare ulteriormente i risultati e filtrare in base a specifici valori di aspetto. Le condizioni di filtro dei valori dell'aspetto dipendono dal tipo di dati del campo dell'aspetto. Ad esempio, per i campi datetime e number, puoi specificare una data specifica o un intervallo.

Visibilità dei filtri

I filtri Sistemi, Alias di tipo, Progetto e Set di dati vengono visualizzati in base alla query corrente nel campo Ricerca.

Prima di iniziare

Prima di cercare asset di dati, procedi nel seguente modo.

Ruoli obbligatori

Questa sezione descrive i ruoli e le autorizzazioni richiesti per cercare asset di dati e accedere ai risultati di ricerca.

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestisci accesso.

Potresti anche riuscire a ottenere le autorizzazioni richieste ruoli personalizzati o altro ruoli predefiniti.

Ruoli obbligatori per la ricerca delle voci

Per cercare le voci, devi disporre di almeno uno dei ruoli IAM di Dataplex Catalog per il progetto utilizzato per la ricerca. Le autorizzazioni per i risultati di ricerca vengono controllate indipendentemente dal progetto selezionato.

Ruoli richiesti per accedere ai risultati di ricerca

I risultati di ricerca in Dataplex Catalog sono definiti in base al tuo ruolo. Per cercare un asset in Dataplex Catalog, devi dispongono delle autorizzazioni per accedere alla risorsa corrispondente nel sistema di origine. Per saperne di più, consulta la sezione Ambito della ricerca di questo documento.

Ad esempio, per cercare set di dati, tabelle, viste e modelli BigQuery, devi disporre delle rispettive autorizzazioni per queste voci. Per ulteriori informazioni, vedi Autorizzazioni BigQuery. Il seguente elenco descrive le autorizzazioni minime richieste:

  • Per cercare una tabella, devi disporre dell'autorizzazione bigquery.tables.get per quella tabella.
  • Per cercare un set di dati, devi disporre dell'autorizzazione bigquery.datasets.get per quel set di dati.
  • Per cercare metadati per un set di dati o una tabella, è necessario BigQuery Ruolo Visualizzatore metadati (roles/bigquery.metadataViewer).

Un altro esempio: per cercare istanze, database, schemi, tabelle e viste Cloud SQL, devi disporre delle rispettive autorizzazioni per queste voci. Per ulteriori informazioni, consulta Ruoli e autorizzazioni di Cloud SQL.

Per cercare voci personalizzate, devi avere il ruolo Visualizzatore Dataplex Catalog (roles/dataplex.catalogViewer).

Abilita l'API

Enable the Dataplex API.

Enable the API

Ricerca di asset di dati

Console

Per cercare asset di dati:

  1. Nella console Google Cloud, vai alla pagina Ricerca in Dataplex.

    Vai a Cerca

  2. Per Scegli la piattaforma di ricerca, seleziona Dataplex Catalog come modalità di ricerca.

    Se selezioni Dataplex Catalog puoi eseguire ricerche Archiviazione dei metadati Dataplex Catalog. Selezione Data Catalog ti consente di eseguire ricerche in Data Catalog repository esistente, se sei un utente di Data Catalog esistente.

  3. Nel campo di ricerca, inserisci la query o utilizza il riquadro Filtri per perfezionare i parametri di ricerca.

    Puoi aggiungere manualmente i seguenti filtri:

    • Aggiungi un filtro dei progetti: in Progetto, fai clic su Aggiungi progetto. Cerca un progetto specifico, selezionalo e fai clic su Apri.
    • Aggiungi un filtro per tipo di aspetto: in Aspetti, fai clic sul menu Aggiungi altri tipi di aspetto. Cerca un modello specifico, seleziona e fai clic su OK.
  4. (Facoltativo) Oltre agli asset a tua disposizione, puoi cercare asset di dati disponibili pubblicamente in Google Cloud selezionando Includi set di dati pubblici.

Utilizza i seguenti suggerimenti per creare una query di ricerca:

  • Racchiudi l'espressione di ricerca tra virgolette se contiene spazi. Ad esempio, "search terms".
  • Puoi anteporre una parola chiave a NOT per ottenere la negazione logica del keyword:term filtro. Puoi anche utilizzare gli operatori booleani AND e OR per combinare le espressioni di ricerca. Gli operatori AND, OR e NOT non sono sensibile alle maiuscole.

    Ad esempio, NOT column:term elenca tutte le colonne tranne quelle che corrispondono al termine specificato. Per un elenco di parole chiave e altri termini che puoi utilizzare in un'espressione di ricerca di Dataplex Catalog, consulta la Sintassi di ricerca.

gcloud

Per cercare asset di dati, utilizza Comando gcloud dataplex entries search.

REST

Per cercare asset di dati, utilizza il metodo searchEntries.

Visualizzare i dettagli di una voce

Console

Utilizza la ricerca in Dataplex Catalog per visualizzare i dettagli di una voce.

  1. Nella console Google Cloud, vai alla pagina Ricerca in Dataplex.

    Vai a Cerca

  2. Seleziona Dataplex Catalog come modalità di ricerca.

  3. Nella casella di ricerca, inserisci il nome di una voce.

  4. Fai clic sulla voce.

    Viene visualizzata la pagina dei dettagli della voce. La pagina include le seguenti sezioni:

    • Dettagli voce: include informazioni come tipo di voce, sistema, piattaforma, nome completo, ora di creazione, ora dell'ultima modifica, descrizione e responsabili.
    • Panoramica: una panoramica della voce, se disponibile.
    • Aspetti: gli aspetti obbligatori e facoltativi definiti per la voce. Per ulteriori informazioni, consulta Categorie di aspetti.

gcloud

Per visualizzare i dettagli di una voce, utilizza il comando gcloud dataplex entries lookup.

REST

Per visualizzare i dettagli di una voce, utilizza il metodo lookupEntry.

Passaggi successivi