Neste documento, descrevemos a sintaxe das consultas de pesquisa do Dataplex. Antes de ler este documento, é importante entender os conceitos do catálogo do Dataplex, como entradas de dados, aspectos, tipos de aspecto, grupos de entrada e tipos de entrada. Para mais informações, consulte Visão geral do catálogo do Dataplex.
Para iniciar uma consulta de pesquisa do catálogo do Dataplex no Console do Google Cloud, acesse a página Pesquisa do Dataplex e selecione Catálogo do Dataplex como o modo de pesquisa.
Para mais informações, consulte Pesquisar recursos de dados no catálogo do Dataplex.
Pesquisa simples
Na forma mais simples, uma consulta de pesquisa do catálogo do Dataplex consiste em um único predicado. Esse predicado pode corresponder a várias partes de metadados:
- Uma substring de um nome, nome de exibição ou descrição de um recurso de dados
- Uma substring do tipo de um recurso de dados
- Uma substring de um nome de coluna (ou nome de coluna aninhada) no esquema de um recurso de dados.
- Uma substring de um ID do projeto
- String de uma descrição geral
Por exemplo, o predicado foo
corresponde às seguintes entidades:
- Recurso de dados com o nome
foo.bar
- Recurso de dados com o nome de exibição
Foo Bar
- Recurso de dados com a descrição
This is the foo script
- Recurso de dados com o tipo exato
foo
- Coluna
foo_bar
no esquema de um recurso de dados - Coluna aninhada
foo_bar
no esquema de um recurso de dados - Projeto
prod-foo-bar
- Recurso de dados com uma visão geral contendo a palavra
foo
Predicados qualificados
É possível qualificar um predicado adicionando-o como prefixo com uma chave que restringe a correspondência a uma parte específica dos metadados:
- Um sinal de igual (
=
) restringe a pesquisa a uma correspondência exata. - Dois pontos (
:
) depois da chave corresponde ao predicado a uma substring ou a um token no valor nos resultados da pesquisa.
A tokenização divide o fluxo do texto em uma série de tokens, cada um geralmente correspondente a uma única palavra.
Exemplo:
name:foo
seleciona entidades com nomes que contêm a substringfoo
, comofoo1
ebarfoo
.description:foo
seleciona entidades com o tokenfoo
na descrição, comobar
efoo
.location=foo
corresponde recursos de dados em um local especificado comfoo
como o nome do local.
As chaves de predicado type
, system
, location
e orgid
oferecem suporte apenas ao
qualificador de correspondência exata (=
), e não ao qualificador de substring (:
). Por exemplo,
type=foo
ou orgid=number
.
O Dataplex Catalog oferece suporte aos seguintes qualificadores:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como substring do ID do recurso de dados. |
displayname:x |
Corresponda x como substring do nome de exibição do recurso de dados. |
column:x |
Corresponde a x como uma substring do nome da coluna (ou nome da coluna aninhada) no esquema do recurso de dados. |
description:x |
Corresponde x como um token na descrição do recurso de dados. |
label:bar |
Corresponde aos recursos de dados do BigQuery que têm um rótulo (com algum valor) e que a chave de rótulo tem bar como substring. |
label=bar |
Corresponde aos recursos de dados do BigQuery que têm um rótulo (com
algum valor) e a chave de rótulo é igual a bar como uma string. |
label:bar:x |
Corresponde a x como uma substring no valor de um rótulo com a chave bar anexada a um recurso de dados do BigQuery. |
label=foo:bar |
Corresponde aos recursos de dados do BigQuery em que a chave é
foo e a chave-valor é bar . |
label.foo=bar |
Corresponde aos recursos de dados do BigQuery em que a chave é
foo e a chave-valor é bar . |
label.foo |
Corresponde aos recursos de dados do BigQuery que têm um rótulo cuja
chave é igual a foo como uma string. |
type=TYPE |
Corresponde aos recursos de dados de um tipo de entrada específico ou ao alias de tipo. |
projectid:bar |
Corresponde recursos de dados em projetos do Google Cloud que correspondem a
bar como uma substring no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso de dados. O caminho pai é um fully_qualified_name do recurso pai. |
orgid=number |
Faz a correspondência entre os recursos de dados de uma organização do Google Cloud e
o valor exato do ID de number . |
system=SYSTEM |
Corresponde recursos de dados de um sistema especificado. |
location=LOCATION |
Faz a correspondência entre recursos de dados em um local especificado com um nome exato.
Por exemplo, Os recursos do BigQuery Omni aceitam esse qualificador usando o
nome do local do BigQuery Omni.
Por exemplo,
|
createtime |
Encontra recursos de dados que foram criados dentro, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar no fuso horário GMT. Fusos horários não são aceitos. Carimbos de data/hora parciais, separadores de data com hífen ( Exemplo:
|
updatetime |
Encontra recursos de dados que foram atualizados dentro, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar no fuso horário GMT. Fusos horários não são aceitos. Carimbos de data/hora parciais, separadores de data com hífen ( Exemplo:
|
fully_qualified_name:x |
Corresponde a x como uma substring de fully_qualified_name . |
fully_qualified_name=x |
Corresponde a x como fully_qualified_name . |
Pesquisa de aspecto
Para pesquisar entradas com base nos aspectos anexados, use a seguinte sintaxe de consulta.
Qualificador | Descrição |
---|---|
aspect:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect=x |
Corresponde a x como o caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect:xOPERATORvalue |
Pesquisa por valores de campo de aspecto. Corresponde a A lista de operadores compatíveis depende do tipo de campo no aspecto, da seguinte maneira:
Somente os campos de nível superior do aspecto são pesquisáveis. Por exemplo, todas as consultas a seguir correspondem a entradas em que o valor do campo
|
Operadores lógicos
Uma consulta pode consistir em vários predicados com operadores lógicos. Se você não
especificar um operador, o AND
lógico ficará implícito. Por exemplo, foo bar
retorna
entidades que correspondem ao predicado foo
e ao predicado bar
.
Há suporte para AND
e OR
lógicos. Por exemplo, foo OR bar
.
É possível negar um predicado com o prefixo -
(hífen) ou NOT
. Por exemplo,
-name:foo
retorna entidades com nomes que não correspondem ao predicado foo
.
Os operadores lógicos não diferenciam maiúsculas de minúsculas. Por exemplo, or
e OR
são
aceitáveis.
Sintaxe abreviada
Uma sintaxe de pesquisa abreviada também está disponível, usando |
(barra vertical) para
os operadores OR
e ,
(vírgula) para os operadores AND
.
Por exemplo, para pesquisar entradas em um de muitos projetos usando o operador OR
, use a seguinte sintaxe abreviada:
projectid:(id1|id2|id3|id4)
A mesma pesquisa sem usar sintaxe abreviada é semelhante ao seguinte:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Para pesquisar entradas com nomes de coluna correspondentes, use o código abaixo:
- E:
column:(name1, name2, name3)
- OU:
column:(name1|name2|name3)
Essa sintaxe abreviada funciona para os predicados qualificados, exceto para label
.
A seguir
- Saiba como pesquisar recursos de dados no catálogo do Dataplex
- Saiba mais sobre o Catálogo do Dataplex.
- Saiba como aprimorar entradas com metadados usando aspectos.
- Saiba como gerenciar entradas e ingerir origens personalizadas.