Questo documento descrive la sintassi per le query di ricerca di Dataplex. Prima del giorno di leggere il presente documento, è importante aver compreso i concetti Dataplex Catalog come voci di dati, aspetti, tipi di aspetto, gruppi di voci e tipi di voci. Per ulteriori informazioni, vedi Panoramica di Dataplex Catalog.
Per avviare una query di ricerca in Dataplex Catalog nella console Google Cloud, vai alla pagina Ricerca di Dataplex e seleziona Dataplex Catalog come modalità di ricerca.
Per ulteriori informazioni, vedi Cerca asset di dati in Dataplex Catalog.
Ricerca semplice
Nella sua forma più semplice, una query di ricerca in Dataplex Catalog consiste di un singolo predicato. Un predicato di questo tipo può corrispondere a diversi metadati:
- Una sottostringa di un nome, un nome visualizzato o una descrizione di un asset di dati
- Una sottostringa del tipo di asset di dati
- Una sottostringa del nome di una colonna (o colonna nidificata) nello schema di un dato risorsa
- Una sottostringa di un ID progetto
- Una stringa da una descrizione panoramica
Ad esempio, il predicato foo
corrisponde alle seguenti entità:
- Asset di dati con il nome
foo.bar
- Asset di dati con nome visualizzato
Foo Bar
- Asset di dati con descrizione
This is the foo script
- Asset di dati di tipo esatto
foo
- Colonna
foo_bar
nello schema di un asset di dati - Colonna
foo_bar
nidificata nello schema di un asset di dati - Progetto
prod-foo-bar
- Asset di dati con una panoramica contenente la parola
foo
Predicati qualificati
Per qualificare un predicato, puoi anteporre una chiave che limita il corrispondenti a metadati specifici:
- Il segno di uguale (
=
) limita la ricerca a una corrispondenza esatta. - I due punti (
:
) dopo la chiave corrispondono al predicato a una sottostringa o a all'interno del valore nei risultati di ricerca.
La tokenizzazione divide il flusso di testo in una serie di token, con ogni di solito corrispondente a una singola parola.
Ad esempio:
name:foo
seleziona le entità i cui nomi contengono la sottostringafoo
, comefoo1
ebarfoo
.description:foo
seleziona le entità con il tokenfoo
nella descrizione, comebar
efoo
.location=foo
associa gli asset di dati in una località specificata confoo
come il nome della posizione di installazione.
Le chiavi dei predicati type
, system
, location
e orgid
supportano solo
il qualificatore di corrispondenza esatta (=
), non il qualificatore di sottostringa (:
). Ad esempio:
type=foo
o orgid=number
.
Dataplex Catalog supporta i seguenti qualificatori:
Qualificatore | Descrizione |
---|---|
name:x |
Corrisponde a x come sottostringa dell'ID asset di dati. |
displayname:x |
Trova x come sottostringa del nome visualizzato dell'asset di dati. |
column:x |
Corrisponde a x come sottostringa del nome della colonna (o nidificata
nome colonna) nello schema dell'asset di dati. |
description:x |
Corrisponde a x come token nella descrizione dell'asset di dati. |
label:bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con alcune
value) e la chiave di etichetta ha bar come sottostringa. |
label=bar |
Corrisponde agli asset di dati BigQuery provvisti di etichetta (con
un valore) e la chiave di etichetta è uguale a bar come stringa. |
label:bar:x |
Trova x come sottostringa nel valore di un'etichetta con
chiave bar collegata a un asset di dati BigQuery. |
label=foo:bar |
Corrisponde agli asset di dati BigQuery dove la chiave è uguale
foo e il valore della chiave è uguale a bar . |
label.foo=bar |
Corrisponde agli asset di dati BigQuery dove la chiave è uguale
foo e il valore della chiave è uguale a bar . |
label.foo |
Corrisponde agli asset di dati BigQuery provvisti di un'etichetta la cui
uguale a foo come stringa. |
type=TYPE |
Corrisponde agli asset di dati di un tipo di voce specifico o del suo alias di tipo. |
projectid:bar |
Corrisponde agli asset di dati all'interno dei progetti Google Cloud corrispondenti
bar come sottostringa nell'ID. |
parent:x |
Corrisponde a x come sottostringa del percorso gerarchico di un
asset di dati. Il percorso padre è un fully_qualified_name di
risorsa padre. |
orgid=number |
Abbina gli asset di dati all'interno di un'organizzazione Google Cloud con
il valore esatto dell'ID number . |
system=SYSTEM |
Corrisponde agli asset di dati di un sistema specificato. |
location=LOCATION |
Associa gli asset di dati in una posizione specificata con un nome esatto.
Ad esempio, Gli asset BigQuery Omni supportano questo qualificatore utilizzando il
Nome località di BigQuery Omni.
Ad esempio:
|
createtime |
Trova gli asset di dati creati all'interno, prima o dopo un determinato data o ora. Ad esempio:
Formato timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Parziale
timestamp, separatori di data del trattino ( Ad esempio:
|
updatetime |
Trova gli asset di dati che sono stati aggiornati all'interno, prima o dopo un determinato data o ora. Ad esempio:
Formato timestamp: Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Parziale
timestamp, separatori di data del trattino ( Ad esempio:
|
fully_qualified_name:x |
Corrisponde a x come una sottostringa di fully_qualified_name . |
fully_qualified_name=x |
Corrisponde a x come fully_qualified_name . |
Ricerca Aspect
Per cercare voci in base agli aspetti associati, utilizza la seguente query a riga di comando.
Qualificatore | Descrizione |
---|---|
aspect:x |
Corrisponde a x come sottostringa del percorso completo dell'aspetto
il tipo di un aspetto associato alla voce, nel formato
projectid.location.ASPECT_TYPE_ID |
aspect=x |
Corrisponde a x come percorso completo dell'aspetto
il tipo di un aspetto associato alla voce, nel formato
projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
Cerca i valori dei campi di aspetto. Corrisponde a L'elenco degli operatori supportati dipende dal tipo di campo nella come segue:
Solo i campi di primo livello dell'aspetto sono disponibili per la ricerca. Ad esempio, tutte le seguenti query corrispondono alle voci in cui il valore
del campo
|
Operatori logici
Una query può essere composta da diversi predicati con operatori logici. In caso contrario
specifica un operatore, è implicito AND
logico. Ad esempio, foo bar
restituisce
entità che corrispondono sia al predicato foo
che al predicato bar
.
Sono supportati i valori logici AND
e OR
logici. Ad esempio: foo OR bar
.
Puoi negare un predicato con un prefisso -
(trattino) o NOT
. Ad esempio:
-name:foo
restituisce le entità con nomi che non corrispondono al predicato foo
.
Gli operatori logici non sono sensibili alle maiuscole. Ad esempio, or
e OR
sono
accettabile.
Sintassi abbreviata
È disponibile anche una sintassi di ricerca abbreviata, che utilizza |
(barra verticale) per
Operatori OR
e ,
(virgola) per gli operatori AND
.
Ad esempio, per cercare voci all'interno di uno dei numerosi progetti utilizzando OR
puoi utilizzare la seguente sintassi abbreviata:
projectid:(id1|id2|id3|id4)
La stessa ricerca senza utilizzare la sintassi abbreviata ha il seguente aspetto:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Per cercare voci con nomi di colonna corrispondenti, utilizza quanto segue:
- E:
column:(name1, name2, name3)
- OPPURE:
column:(name1|name2|name3)
Questa sintassi abbreviata funziona per
predicati qualificati tranne label
.
Passaggi successivi
- Scopri come cercare asset di dati in Dataplex Catalog
- Scopri di più su Dataplex Catalog.
- Scopri come arricchire le voci con metadati utilizzando gli aspetti.
- Scopri come gestire le voci e importare origini personalizzate.