Questo documento descrive la sintassi delle query di ricerca di Dataplex. Prima del giorno di leggere il presente documento, è importante aver compreso i concetti Dataplex Catalog come voci di dati, aspetti, tipi di aspetto, gruppi di voci e tipi di voci. Per saperne di più, consulta la panoramica di Dataplex Catalog.
Per avviare una query di ricerca in Dataplex Catalog nella console Google Cloud, vai alla pagina Ricerca di Dataplex e seleziona Dataplex Catalog come modalità di ricerca.
Per saperne di più, consulta Cercare asset di dati in Dataplex Catalog.
Ricerca semplice
Nella sua forma più semplice, una query di ricerca in Dataplex Catalog consiste di un singolo predicato. Un predicato di questo tipo può corrispondere a diversi metadati:
- Una sottostringa di un nome, un nome visualizzato o una descrizione di una risorsa di dati
- Una sottostringa del tipo di asset di dati
- Una sottostringa del nome di una colonna (o colonna nidificata) nello schema di un dato risorsa
- Una sottostringa di un ID progetto
- Una stringa da una descrizione panoramica
Ad esempio, il predicato foo
corrisponde alle seguenti entità:
- Asset di dati con il nome
foo.bar
- Asset di dati con il nome visualizzato
Foo Bar
- Asset di dati con descrizione
This is the foo script
- Risorsa di dati con il tipo esatto
foo
- Colonna
foo_bar
nello schema di un asset di dati - Colonna nidificata
foo_bar
nello schema di una risorsa di dati - Progetto
prod-foo-bar
- Asset di dati con una panoramica contenente la parola
foo
Predicati qualificati
Puoi qualificare un predicato anteponendogli una chiave che limita la corrispondenza a un determinato elemento di metadati:
- Un segno di uguale (
=
) limita la ricerca a una corrispondenza esatta. - I due punti (
:
) dopo la chiave creano una corrispondenza tra il predicato e una sottostringa all'interno del valore nei risultati di ricerca.
La tokenizzazione suddivide lo stream di testo in una serie di token, ciascuno solitamente corrispondente a una singola parola.
Ad esempio:
name:foo
seleziona le entità i cui nomi contengono la sottostringafoo
, comefoo1
ebarfoo
.description:foo
seleziona le entità con il tokenfoo
nella descrizione, comebar
efoo
.location=foo
associa gli asset di dati in una località specificata confoo
come il nome della posizione di installazione.
Le chiavi del predicato type
, system
, location
e orgid
supportano solo il qualificatore della corrispondenza esatta (=
), non il qualificatore della sottostringa (:
). Ad esempio,type=foo
o orgid=number
.
Dataplex Catalog supporta i seguenti qualificatori:
Qualificatore | Descrizione |
---|---|
name:x |
Corrisponde a x come sottostringa dell'ID della risorsa di dati. |
displayname:x |
Trova x come sottostringa del nome visualizzato dell'asset di dati. |
column:x |
Corrisponde a x come sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema della risorsa di dati. |
description:x |
Corrisponde a x come token nella descrizione della risorsa di dati. |
label:bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con alcune
value) e la chiave di etichetta ha bar come sottostringa. |
label=bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con
un valore) e la chiave dell'etichetta è uguale a bar come stringa. |
label:bar:x |
Trova x come sottostringa nel valore di un'etichetta con
chiave bar collegata a un asset di dati BigQuery. |
label=foo:bar |
Corrisponde agli asset di dati BigQuery in cui la chiave è uguale
foo e il valore della chiave è uguale a bar . |
label.foo=bar |
Corrisponde agli asset di dati BigQuery in cui la chiave è uguale
foo e il valore della chiave è uguale a bar . |
label.foo |
Corrisponde agli asset di dati BigQuery con un'etichetta la cui chiave è uguale a foo come stringa. |
type=TYPE |
Corrisponde agli asset di dati di un tipo di voce specifico o del suo alias di tipo. |
projectid:bar |
Corrisponde agli asset di dati all'interno dei progetti Google Cloud corrispondenti
bar come sottostringa nell'ID. |
parent:x |
Corrisponde a x come sottostringa del percorso gerarchico di un
asset di dati. Il percorso principale è un fully_qualified_name della
risorsa principale. |
orgid=number |
Abbina gli asset di dati all'interno di un'organizzazione Google Cloud con
il valore esatto dell'ID number . |
system=SYSTEM |
Associa asset di dati di un sistema specificato. |
location=LOCATION |
Corrisponde agli asset di dati in una posizione specificata con un nome esatto.
Ad esempio, Gli asset BigQuery Omni supportano questo qualificatore utilizzando il
Nome località di BigQuery Omni.
Ad esempio:
|
createtime |
Trova gli asset di dati creati prima, durante o dopo una determinata data o ora. Ad esempio:
Formato timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di date con trattino ( Ad esempio:
|
updatetime |
Trova gli asset di dati aggiornati prima, durante o dopo una determinata data o ora. Ad esempio:
Formato del timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di date con trattino ( Ad esempio:
|
fully_qualified_name:x |
Corrisponde a x come una sottostringa di fully_qualified_name . |
fully_qualified_name=x |
Corrisponde a x come fully_qualified_name . |
Ricerca per aspetto
Per cercare le voci in base agli aspetti associati, utilizza la seguente sintassi della query.
Qualificatore | Descrizione |
---|---|
aspect:x |
Corrisponde a x come sottostringa del percorso completo al tipo di aspetto di un aspetto associato alla voce, nel formato projectid.location.ASPECT_TYPE_ID |
aspect=x |
Corrisponde a x come percorso completo dell'aspetto
il tipo di un aspetto allegato alla voce, nel formato
projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
Cerca i valori dei campi di aspetto. Corrisponde a L'elenco degli operatori supportati dipende dal tipo di campo nella come segue:
Solo i campi di primo livello dell'aspetto sono disponibili per la ricerca. Ad esempio, tutte le seguenti query corrispondono alle voci in cui il valore
del campo
|
Operatori logici
Una query può essere composta da più predicati con operatori logici. Se non specifichi un operatore, viene implicito AND
logico. Ad esempio, foo bar
restituisce
le entità che corrispondono sia al predicato foo
sia al predicato bar
.
Sono supportati i valori logici AND
e OR
logici. Ad esempio: foo OR bar
.
Puoi negare un predicato con un prefisso -
(trattino) o NOT
. Ad esempio:
-name:foo
restituisce le entità con nomi che non corrispondono al predicato foo
.
Gli operatori logici non sono sensibili alle maiuscole. Ad esempio, or
e OR
sono
accettabile.
Sintassi abbreviata
È disponibile anche una sintassi di ricerca abbreviata, che utilizza |
(barra verticale) per
Operatori OR
e ,
(virgola) per gli operatori AND
.
Ad esempio, per cercare voci all'interno di uno dei numerosi progetti utilizzando OR
puoi utilizzare la seguente sintassi abbreviata:
projectid:(id1|id2|id3|id4)
La stessa ricerca senza utilizzare la sintassi abbreviata è la seguente:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Per cercare voci con nomi di colonna corrispondenti, utilizza quanto segue:
- AND:
column:(name1, name2, name3)
- OPPURE:
column:(name1|name2|name3)
Questa sintassi abbreviata funziona per
predicati qualificati tranne label
.
Passaggi successivi
- Scopri come cercare asset di dati in Dataplex Catalog
- Scopri di più su Dataplex Catalog.
- Scopri come arricchire le voci con i metadati utilizzando gli aspetti.
- Scopri come gestire le voci e importare le origini personalizzate.