Questo documento descrive la sintassi per le query di ricerca di Dataplex. Prima di leggere questo documento, è importante comprendere i concetti di Dataplex Catalog, ad esempio voci di dati, aspetti, tipi di aspetto, gruppi di voci e tipi di voci. Per ulteriori informazioni, consulta la panoramica di Dataplex Catalog.
Per avviare una query di ricerca in Dataplex Catalog nella console Google Cloud, vai alla pagina Ricerca in Dataplex e seleziona Dataplex Catalog come modalità di ricerca.
Per ulteriori informazioni, consulta Cercare asset di dati in Dataplex Catalog.
Ricerca semplice
Nella sua forma più semplice, una query di ricerca in Dataplex Catalog è composta da un singolo predicato. Un predicato di questo tipo può corrispondere a diversi metadati:
- Una sottostringa di un nome, un nome visualizzato o una descrizione di un asset di dati
- Una sottostringa del tipo di asset di dati
- Una sottostringa del nome di una colonna (o del nome di una colonna nidificata) nello schema di un asset di dati
- Una sottostringa di un ID progetto
- Una stringa da una descrizione panoramica
Ad esempio, il predicato foo
corrisponde alle seguenti entità:
- Asset di dati con il nome
foo.bar
- Asset di dati con nome visualizzato
Foo Bar
- Asset di dati con descrizione
This is the foo script
- Asset di dati di tipo esatto
foo
- Colonna
foo_bar
nello schema di un asset di dati - Colonna
foo_bar
nidificata nello schema di un asset di dati - Progetto
prod-foo-bar
- Asset di dati con una panoramica contenente la parola
foo
Predicati qualificati
Puoi qualificare un predicato aggiungendo un prefisso a una chiave che limita la corrispondenza a una parte specifica di metadati:
- Il segno di uguale (
=
) limita la ricerca a una corrispondenza esatta. - I due punti (
:
) dopo la chiave associa il predicato a una sottostringa o a un token all'interno del valore nei risultati di ricerca.
La tokenizzazione divide il flusso di testo in una serie di token, dove ogni token corrisponde solitamente a una singola parola.
Ad esempio:
name:foo
seleziona le entità i cui nomi contengono la sottostringafoo
, comefoo1
ebarfoo
.description:foo
seleziona le entità con il tokenfoo
nella descrizione, comebar
efoo
.location=foo
associa gli asset di dati in una località specificata confoo
come nome della località.
Le chiavi dei predicati type
, system
, location
e orgid
supportano solo il qualificatore di corrispondenza esatta (=
), non il qualificatore di sottostringa (:
). Ad esempio, type=foo
o orgid=number
.
Dataplex Catalog supporta i seguenti qualificatori:
Qualificatore | Descrizione |
---|---|
name:x |
Corrisponde a x come sottostringa dell'ID risorsa di dati. |
displayname:x |
Trova x come sottostringa del nome visualizzato dell'asset di dati. |
column:x |
Corrisponde a x come una sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema dell'asset di dati. |
description:x |
Corrisponde a x come token nella descrizione dell'asset di dati. |
label:bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con un certo valore) e la chiave di etichetta ha bar come sottostringa. |
label=bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con
qualche valore) e la chiave di etichetta è uguale a bar come stringa. |
label:bar:x |
Corrisponde a x come una sottostringa nel valore di un'etichetta con
chiave bar associata a un asset di dati BigQuery. |
label=foo:bar |
Corrisponde agli asset di dati BigQuery dove la chiave è uguale a foo e la coppia chiave-valore è bar . |
label.foo=bar |
Corrisponde agli asset di dati BigQuery dove la chiave è uguale a foo e la coppia chiave-valore è bar . |
label.foo |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta con
chiave uguale a foo come stringa. |
type=TYPE |
Corrisponde agli asset di dati di un tipo di voce specifico o del suo alias di tipo. |
projectid:bar |
Abbina gli asset di dati all'interno dei progetti Google Cloud che corrispondono a
bar come sottostringa nell'ID. |
parent:x |
Corrisponde a x come una sottostringa del percorso gerarchico di un
asset di dati. Il percorso padre è un fully_qualified_name della
risorsa padre. |
orgid=number |
Abbina gli asset di dati all'interno di un'organizzazione Google Cloud con
il valore ID esatto di number . |
system=SYSTEM |
Corrisponde agli asset di dati di un sistema specificato. |
location=LOCATION |
Associa gli asset di dati in una posizione specificata con un nome esatto.
Ad esempio, Gli asset BigQuery Omni supportano questo qualificatore utilizzando il nome della località di BigQuery Omni.
Ad esempio, |
createtime |
Trova gli asset di dati creati entro, prima o dopo una determinata data o ora. Ad esempio:
Formato timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di data con trattino ( Ad esempio:
|
updatetime |
Trova gli asset di dati che sono stati aggiornati entro, prima o dopo una determinata data o ora. Ad esempio:
Formato timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati i timestamp parziali, i separatori di data con trattino ( Ad esempio:
|
fully_qualified_name:x |
Corrisponde a x come una sottostringa di fully_qualified_name . |
fully_qualified_name=x |
Corrisponde a x come fully_qualified_name . |
Ricerca Aspect
Per cercare le voci in base agli aspetti associati, utilizza la seguente sintassi delle query.
Qualificatore | Descrizione |
---|---|
aspect:x |
Corrisponde a x come una sottostringa del percorso completo del tipo di aspetto di un aspetto collegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID |
aspect=x |
Corrisponde a x come percorso completo del tipo di aspetto di un aspetto collegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
Cerca i valori dei campi di aspetto. Corrisponde a L'elenco degli operatori supportati dipende dal tipo di campo nell'aspetto, come segue:
Solo i campi di primo livello dell'aspetto sono disponibili per la ricerca. Ad esempio, tutte le seguenti query corrispondono a voci in cui il valore
del campo
|
Operatori logici
Una query può essere composta da diversi predicati con operatori logici. Se non
specifica un operatore, è implicito il criterio AND
. Ad esempio, foo bar
restituisce
entità che corrispondono sia al predicato foo
che al predicato bar
.
Sono supportati i valori logici AND
e OR
logici. Ad esempio: foo OR bar
.
Puoi negare un predicato con un prefisso -
(trattino) o NOT
. Ad esempio, -name:foo
restituisce entità con nomi che non corrispondono al predicato foo
.
Gli operatori logici non sono sensibili alle maiuscole. Ad esempio, or
e OR
sono
accettabili.
Sintassi abbreviata
È disponibile anche una sintassi di ricerca abbreviata, in cui gli operatori OR
utilizzano |
(barra verticale) e ,
(virgola) per gli operatori AND
.
Ad esempio, per cercare voci all'interno di uno dei numerosi progetti utilizzando l'operatore OR
, puoi utilizzare la seguente sintassi abbreviata:
projectid:(id1|id2|id3|id4)
La stessa ricerca senza utilizzare la sintassi abbreviata ha il seguente aspetto:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Per cercare voci con nomi di colonna corrispondenti, utilizza quanto segue:
- E:
column:(name1, name2, name3)
- OPPURE:
column:(name1|name2|name3)
Questa sintassi abbreviata funziona per i
predicati qualificati ad eccezione di label
.
Passaggi successivi
- Scopri come cercare asset di dati in Dataplex Catalog
- Scopri di più su Dataplex Catalog.
- Scopri come arricchire le voci con metadati utilizzando gli aspetti.
- Scopri come gestire le voci e importare origini personalizzate.