Questo documento descrive la sintassi per le query di ricerca di Data Catalog. Prima di leggere questo documento, è importante che tu comprenda i concetti di Data Catalog, come inserimento di dati, tag e modelli di tag e altri tipi di metadati. Consulta Cos'è Data Catalog?
Per avviare una query di ricerca di Data Catalog nella console Google Cloud, vai alla pagina Ricerca Dataplex.
Vai alla pagina Cerca di Dataplex
Ricerca semplice
Nella sua forma più semplice, una query di ricerca di Data Catalog comprende un singolo predicato. Un predicato di questo tipo può corrispondere a diversi metadati:
- Una sottostringa di un nome, di un nome visualizzato o di una descrizione di un asset di dati
- Tipo esatto di asset di dati
- Una sottostringa del nome di una colonna (o di una colonna nidificata) nello schema di un asset di dati
- Una sottostringa di un ID progetto
- Il valore di un tag pubblico, il nome di un modello di tag pubblico o il nome di un campo in un modello di tag pubblico associato a una voce di dati.
- (Anteprima) Una stringa per un indirizzo email o il nome di un gestore dati
- (Anteprima) Una stringa da una descrizione panoramica
La ricerca semplice non supporta i campi dei modelli di tag di tipo datetime
.
Ad esempio, il predicato foo
corrisponde alle seguenti entità:
- Asset di dati con il nome
foo.bar
- Asset di dati con nome visualizzato
Foo Bar
- Asset di dati con descrizione
This is the foo script.
- Asset di dati con il tipo esatto di
foo
- Colonna
foo_bar
nello schema di un asset di dati - Colonna
foo_bar
nidificata nello schema di un asset di dati - Progetto
prod-foo-bar
- Modello di tag pubblico denominato
foo
, voci di dati codificate con il modello di tagfoo
, nome visualizzato del modello di tagfoo
, nome del campo del modello di tagfoo
e valore del campo tagfoo
in una stringa, enum o RTF. - (Anteprima) Asset di dati con un gestore dati chiamato
foo
. - (Anteprima) Asset di dati con una panoramica contenente la parola
foo
.
Per saperne di più sui ruoli e sulle autorizzazioni di visualizzazione di tag pubblici e privati, vedi Ruoli per visualizzare tag pubblici e privati.
Predicati qualificati
Puoi qualificare un predicato aggiungendo il prefisso a una chiave che limita la corrispondenza a una specifica porzione di metadati.
Il segno uguale (=
) limita la ricerca a una corrispondenza esatta.
I due punti (:
) dopo la chiave corrispondono al predicato di una sottostringa o di un token all'interno del valore nei risultati di ricerca.
La tokenizzazione suddivide il flusso di testo in una serie di token, con ciascun token che di solito corrisponde a una singola parola.
Ad esempio:
name:foo
seleziona le entità con nomi che contengono la sottostringafoo
:foo1
ebarfoo
.description:foo
seleziona le entità con il tokenfoo
nella descrizione:bar and foo
.location=foo
corrisponde a tutti gli asset di dati in una località specificata confoo
come nome della località.
Data Catalog supporta i seguenti qualificatori:
Qualificatore | Descrizione |
---|---|
name:x |
Corrisponde a x come sottostringa dell'ID risorsa di dati. |
displayname:x |
Trova x come sottostringa del nome visualizzato dell'asset di dati. |
column:x |
Corrisponde a x come sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema dell'asset di dati.Puoi cercare una colonna nidificata in base al relativo percorso utilizzando l'operatore logico AND. Ad esempio, column:(foo bar) corrisponde a una colonna nidificata con il percorso foo.bar . |
description:x |
Corrisponde a x come token nella descrizione dell'asset di dati. |
label:bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con un certo valore) e la chiave di etichetta ha bar come sottostringa. |
label=bar |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta (con un certo valore) e la chiave di etichetta è uguale a bar come stringa. |
label:bar:x |
Corrisponde a x come sottostringa nel valore di un'etichetta con la chiave bar associata a un asset di dati BigQuery. |
label=foo:bar |
Corrisponde agli asset di dati BigQuery in cui la chiave è uguale a foo e la chiave-valore è uguale a bar . |
label.foo=bar |
Corrisponde agli asset di dati BigQuery in cui la chiave è uguale a foo e la chiave-valore è uguale a bar . |
label.foo |
Corrisponde agli asset di dati BigQuery che hanno un'etichetta la cui chiave è uguale a foo come stringa. |
type=<type> |
Corrisponde agli asset di dati di un determinato sottotipo o tipo di oggetto. I sottotipi possono essere aggiunti con il formato <type>.<sub-type>. I tipi e i sottotipi includono:
|
projectid:bar |
Corrisponde agli asset di dati all'interno dei progetti Cloud che corrispondono a bar come sottostringa nell'ID. |
parent:x |
Corrisponde a x come sottostringa del percorso gerarchico di un asset di dati BigQuery. Il percorso ha il formato <project_id>.<dataset_name> .Ad esempio, parent:foo.bar corrisponde a tutte le tabelle e le visualizzazioni di un set di dati con il percorso project-foo.bar-dataset . |
orgid=number |
Abbina gli asset di dati all'interno di un'organizzazione Cloud con l'esatto valore ID di number . |
system=<system> |
Corrisponde a tutti gli asset di dati di un sistema specificato. I sistemi includono:
|
location=<location> |
Corrisponde a tutti gli asset di dati in una località specificata con un nome esatto. Ad esempio, location=us-central1 corrisponde a tutti gli asset ospitati in Iowa.Per un elenco completo delle località supportate, consulta Regioni di Data Catalog. |
cluster_location=<location> |
Corrisponde a tutti gli asset di dati Bigtable in una località specificata con un nome esatto. Ad esempio, cluster_location=us-central1 corrisponde a tutti gli asset ospitati in Iowa.Per un elenco completo delle località supportate, vedi Regioni di Bigtable. |
tag:x |
Corrisponde agli asset di dati in cui x corrisponde a qualsiasi sottostringa in <tag_template_project_id >.<tag_template_id >.<tag_field_id > di un tag privato o pubblico.Esempi:
|
tag:key<operator>val |
Innanzitutto, associa il valore key a qualsiasi sottostringa dell'ID campo tag, dell'ID modello di tag o dell'ID progetto Google Cloud di un modello di tag. Quindi, corrisponde val al valore tag di key in base al tipo di campo tag.Gli insiemi <operator> dipendenti dal tipo consentiti per i valori tag sono:
|
createtime |
Trova gli asset di dati creati all'interno, prima o dopo una determinata data o ora. Esempi:
|
updatetime |
Trova gli asset di dati che sono stati aggiornati all'interno, prima o dopo una determinata data o ora. Esempi:
|
policytag:x |
Trova x come sottostringa del nome visualizzato del tag criterio. Trova tutti gli asset utilizzando tag di criteri corrispondenti o i relativi discendenti. |
policytagid=x |
Corrisponde a x come ID tag criterio o tassonomia. Trova tutti gli asset utilizzando tag di criteri corrispondenti o i relativi discendenti. |
term:x |
Corrisponde agli asset di dati collegati a un termine del glossario aziendale in cui una sottostringa del nome, della descrizione o del gestore di dati corrisponde a x . |
fully_qualified_name:x |
Corrisponde a x come sottostringa di fully_qualified_name . |
fully_qualified_name=x |
Corrisponde a x come fully_qualified_name . |
Operatori logici
Una query può essere formata da vari
predicati con operatori logici. Se non specifichi un operatore, viene implicito
AND
logico. Ad esempio, foo bar
restituisce entità che corrispondono sia al
predicato foo
sia al predicato bar
.
Sono supportati gli operatori logico AND e OR logico, ad esempio foo OR bar
.
Puoi negare un predicato con un prefisso -
o NOT
. Ad esempio, -name:foo
restituisce
tutte le entità con nomi che non corrispondono al predicato foo
.
Sintassi abbreviata
È disponibile anche una sintassi di ricerca abbreviata, utilizzando |
per gli operatori OR
e ,
per gli operatori AND
.
Ad esempio, per cercare le voci all'interno di uno dei numerosi progetti utilizzando l'operatore OR
, puoi utilizzare:
projectid:(pid1|pid2|pid3|pid4)
Invece di:
projectid:pid1 OR projectid:pid2 OR projectid:pid3 OR projectid:pid4
Per cercare voci con nomi di colonna corrispondenti:
- E:
column:(name1, name2, name3)
- OPPURE:
column:(name1|name2|name3)
Questa sintassi abbreviata funziona per i predicati qualificati elencati in precedenza, ad eccezione di tag
, term
, policytag
, policytagid
e label
.