Sintassi di ricerca per Dataplex Catalog

Questo documento descrive la sintassi delle query di ricerca di Dataplex. Prima del giorno di leggere il presente documento, è importante aver compreso i concetti Dataplex Catalog come voci di dati, aspetti, tipi di aspetto, gruppi di voci e tipi di voci. Per saperne di più, consulta la panoramica di Dataplex Catalog.

Per avviare una query di ricerca in Dataplex Catalog nella console Google Cloud, vai alla pagina Ricerca di Dataplex e seleziona Dataplex Catalog come modalità di ricerca.

Vai a Cerca

Per saperne di più, consulta Cercare asset di dati in Dataplex Catalog.

Nella sua forma più semplice, una query di ricerca in Dataplex Catalog consiste di un singolo predicato. Un predicato di questo tipo può corrispondere a diversi metadati:

  • Una sottostringa di un nome, un nome visualizzato o una descrizione di una risorsa di dati
  • Una sottostringa del tipo di asset di dati
  • Una sottostringa del nome di una colonna (o colonna nidificata) nello schema di un dato risorsa
  • Una sottostringa di un ID progetto
  • Una stringa da una descrizione panoramica

Ad esempio, il predicato foo corrisponde alle seguenti entità:

  • Asset di dati con il nome foo.bar
  • Asset di dati con il nome visualizzato Foo Bar
  • Asset di dati con descrizione This is the foo script
  • Risorsa di dati con il tipo esatto foo
  • Colonna foo_bar nello schema di un asset di dati
  • Colonna nidificata foo_bar nello schema di una risorsa di dati
  • Progetto prod-foo-bar
  • Asset di dati con una panoramica contenente la parola foo

Predicati qualificati

Puoi qualificare un predicato anteponendogli una chiave che limita la corrispondenza a un determinato elemento di metadati:

  • Un segno di uguale (=) limita la ricerca a una corrispondenza esatta.
  • I due punti (:) dopo la chiave creano una corrispondenza tra il predicato e una sottostringa all'interno del valore nei risultati di ricerca.

La tokenizzazione suddivide lo stream di testo in una serie di token, ciascuno solitamente corrispondente a una singola parola.

Ad esempio:

  • name:foo seleziona le entità i cui nomi contengono la sottostringa foo, come foo1 e barfoo.
  • description:foo seleziona le entità con il token foo nella descrizione, come bar e foo.
  • location=foo associa gli asset di dati in una località specificata con foo come il nome della posizione di installazione.

Le chiavi del predicato type, system, location e orgid supportano solo il qualificatore della corrispondenza esatta (=), non il qualificatore della sottostringa (:). Ad esempio,type=foo o orgid=number.

Dataplex Catalog supporta i seguenti qualificatori:

Qualificatore Descrizione
name:x Corrisponde a x come sottostringa dell'ID della risorsa di dati.
displayname:x Trova x come sottostringa del nome visualizzato dell'asset di dati.
column:x Corrisponde a x come sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema della risorsa di dati.
description:x Corrisponde a x come token nella descrizione della risorsa di dati.
label:bar Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con alcune value) e la chiave di etichetta ha bar come sottostringa.
label=bar Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con un valore) e la chiave dell'etichetta è uguale a bar come stringa.
label:bar:x Trova x come sottostringa nel valore di un'etichetta con chiave bar collegata a un asset di dati BigQuery.
label=foo:bar Corrisponde agli asset di dati BigQuery in cui la chiave è uguale foo e il valore della chiave è uguale a bar.
label.foo=bar Corrisponde agli asset di dati BigQuery in cui la chiave è uguale foo e il valore della chiave è uguale a bar.
label.foo Corrisponde agli asset di dati BigQuery con un'etichetta la cui chiave è uguale a foo come stringa.
type=TYPE Corrisponde agli asset di dati di un tipo di voce specifico o del suo alias di tipo.
projectid:bar Corrisponde agli asset di dati all'interno dei progetti Google Cloud corrispondenti bar come sottostringa nell'ID.
parent:x Corrisponde a x come sottostringa del percorso gerarchico di un asset di dati. Il percorso principale è un fully_qualified_name della risorsa principale.
orgid=number Abbina gli asset di dati all'interno di un'organizzazione Google Cloud con il valore esatto dell'ID number.
system=SYSTEM Associa asset di dati di un sistema specificato.
location=LOCATION

Corrisponde agli asset di dati in una posizione specificata con un nome esatto. Ad esempio, location=us-central1 corrisponde agli asset ospitati in Iowa.

Gli asset BigQuery Omni supportano questo qualificatore utilizzando il Nome località di BigQuery Omni. Ad esempio: location=aws-us-east-1 corrisponde a BigQuery Omni dei tuoi asset nella Virginia del Nord.

createtime

Trova gli asset di dati creati prima, durante o dopo una determinata data o ora.

Ad esempio:

  • createtime:2019-01-01 corrisponde agli asset di dati creati in data 01-01-2019.
  • createtime<2019-02 corrisponde agli asset dati creati prima del 01-02-2019 00:00:00.
  • createtime>2019-02 corrisponde agli asset di dati creati dopo il 2019-02-01T00:00:00.

Formato timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di date con trattino (-) e i separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

Trova gli asset di dati aggiornati prima, durante o dopo una determinata data o ora.

Ad esempio:

  • updatetime:2019-01-01 corrisponde alle risorse di dati aggiornate il giorno 1° gennaio 2019.
  • updatetime<2019-02 corrisponde agli asset di dati aggiornati prima del 01-02-2019 00:00:00.
  • updatetime>2019-02 corrisponde agli asset di dati aggiornati dopo il giorno 01-02-2019 00:00:00.

Formato del timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di date con trattino (-) e i separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
fully_qualified_name:x Corrisponde a x come una sottostringa di fully_qualified_name.
fully_qualified_name=x Corrisponde a x come fully_qualified_name.

Per cercare le voci in base agli aspetti associati, utilizza la seguente sintassi della query.

Qualificatore Descrizione
aspect:x Corrisponde a x come sottostringa del percorso completo al tipo di aspetto di un aspetto associato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
aspect=x Corrisponde a x come percorso completo dell'aspetto il tipo di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
aspect:xOPERATORvalue

Cerca i valori dei campi di aspetto. Corrisponde a x come sottostringa del percorso completo al tipo di aspetto e al nome del campo di un aspetto che allegati alla voce, nel formato projectid.location.ASPECT_TYPE_ID.FIELD_NAME

L'elenco degli operatori supportati dipende dal tipo di campo nella come segue:

  • Stringa: = (corrispondenza esatta) e : (sottostringa)
  • Tutti i tipi di numeri: =, :, <, >, <=, >=, =>, =<
  • Enum: =
  • Data e ora: uguale a quella dei numeri, ma con i valori da confrontare. vengono trattate come valori data/ora invece che numeri
  • Boolean: =

Solo i campi di primo livello dell'aspetto sono disponibili per la ricerca.

Ad esempio, tutte le seguenti query corrispondono alle voci in cui il valore del campo is-enrolled nell'aspetto employee-info è true. Altre voci corrispondenti nella sottostringa vengono restituiti.

  • aspect:example-project.us-central1.employee-info.is-enrolled=true
  • aspect:example-project.us-central1.employee=true
  • aspect:employee=true

Operatori logici

Una query può essere composta da più predicati con operatori logici. Se non specifichi un operatore, viene implicito AND logico. Ad esempio, foo bar restituisce le entità che corrispondono sia al predicato foo sia al predicato bar.

Sono supportati i valori logici AND e OR logici. Ad esempio: foo OR bar.

Puoi negare un predicato con un prefisso - (trattino) o NOT. Ad esempio: -name:foo restituisce le entità con nomi che non corrispondono al predicato foo.

Gli operatori logici non sono sensibili alle maiuscole. Ad esempio, or e OR sono accettabile.

Sintassi abbreviata

È disponibile anche una sintassi di ricerca abbreviata, che utilizza | (barra verticale) per Operatori OR e , (virgola) per gli operatori AND.

Ad esempio, per cercare voci all'interno di uno dei numerosi progetti utilizzando OR puoi utilizzare la seguente sintassi abbreviata:

projectid:(id1|id2|id3|id4)

La stessa ricerca senza utilizzare la sintassi abbreviata è la seguente:

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

Per cercare voci con nomi di colonna corrispondenti, utilizza quanto segue:

  • AND: column:(name1, name2, name3)
  • OPPURE: column:(name1|name2|name3)

Questa sintassi abbreviata funziona per predicati qualificati tranne label.

Passaggi successivi