Este documento descreve como usar a pesquisa no catálogo universal do Dataplex para pesquisar recursos, como conjuntos de dados do BigQuery, instâncias do Cloud SQL e outros.
O Dataplex Universal Catalog oferece dois modos de pesquisa: pesquisa por palavras-chave e pesquisa em linguagem natural (pré-visualização).
A pesquisa de palavras-chave permite-lhe encontrar recursos através de palavras-chave específicas, filtros e uma sintaxe definida.
A pesquisa de linguagem natural expande a pesquisa de palavras-chave para suportar consultas de linguagem natural. Permite-lhe encontrar recursos através de linguagem comum, eliminando a necessidade de sintaxe complexa.
Para mais informações sobre os Google Cloud recursos suportados no catálogo universal do Dataplex, consulte asorigens Google Cloud suportadas.
Âmbito da pesquisa
Os resultados da pesquisa no Dataplex Universal Catalog respeitam as autorizações que tem sobre os recursos correspondentes nos sistemas de origem.
Por exemplo, se tiver acesso de leitura aos metadados do BigQuery de um objeto, esse objeto aparece nos resultados da pesquisa do catálogo universal do Dataplex. Se tiver acesso a uma tabela do BigQuery, mas não ao conjunto de dados que contém essa tabela, a tabela continua a ser apresentada conforme esperado na pesquisa do catálogo universal do Dataplex.
Por predefinição, a pesquisa está limitada à sua organização. Os resultados incluem apenas recursos da mesma organização que o projeto no qual está a pesquisar.
Os resultados da pesquisa incluem apenas os recursos que pertencem ao mesmo perímetro do VPC-SC que o projeto no qual a pesquisa é realizada. Quando usa a Google Cloud consola, este é o projeto selecionado na consola.
Para alargar o âmbito dos resultados da pesquisa para além dos recursos no perímetro do VPC Service Controls do seu projeto, use as regras de entrada e saída do VPC Service Controls. Estas regras facilitam a troca de dados privada e eficiente na sua organização. Pode configurar regras de entrada e saída através da Google Cloud consola ou de ficheiros JSON ou YAML. Consulte o exemplo de YAML abaixo e consulte a documentação do VPC Service Controls para adaptar a regra aos seus requisitos específicos.
egressPolicies:
- egressFrom:
identityType: ANY_USER_ACCOUNT
egressTo:
# Specify which resources should be present in the search results. In this example,
# BigQuery.
operations:
- methodSelectors:
- method: '*'
serviceName: bigquery.googleapis.com
# Specify project ids under which the search is performed.
resources:
- projects/SEARCH_PROJECT_ID
ingressPolicies:
- ingressFrom:
identityType: ANY_USER_ACCOUNT
sources:
- accessLevel: '*'
ingressTo:
# Specify which resources should be present in the search results. In this example,
# BigQuery.
operations:
- methodSelectors:
- method: '*'
serviceName: bigquery.googleapis.com
# Specify project ids to expose in search results.
resources:
- projects/INGRESS_PROJECT_ID
Para mais informações sobre as funções de gestão de identidade e acesso (IAM) de que precisa para usar a pesquisa do Dataplex Universal Catalog, consulte o artigo Funções de IAM do Dataplex Universal Catalog.
Isole os resultados da pesquisa por ambiente através dos VPC Service Controls
Para isolar os resultados da pesquisa do catálogo universal do Dataplex entre ambientes, como desenvolvimento, teste e produção, configure perímetros dos VPC Service Controls separados para cada ambiente. Atribua os projetos que contêm os recursos de dados e os projetos usados para realizar pesquisas ao perímetro do ambiente correspondente. As pesquisas realizadas a partir de um projeto dentro de um perímetro específico só devolvem resultados para recursos que também se encontram nesse mesmo perímetro.
Limitações de memorização na pesquisa
As consultas de pesquisa do Dataplex Universal Catalog não garantem uma capacidade de memorização total. Podem não ser devolvidos resultados que correspondam à sua consulta. Além disso, os resultados devolvidos (e não devolvidos) podem variar se repetir as consultas de pesquisa.
Para consultar todos os metadados do catálogo universal do Dataplex, pode exportar os metadados para o Cloud Storage e, em seguida, consultá-los a partir do BigQuery. Para mais informações, consulte o artigo Exporte metadados.
Filtros
Os filtros permitem-lhe restringir os resultados da pesquisa. Os filtros estão disponíveis na pesquisa por palavras-chave e em linguagem natural, mas as opções disponíveis podem diferir ligeiramente consoante o modo.
Quando fornece filtros em várias secções, estes são avaliados através do operador lógico AND
. Os resultados da pesquisa contêm recursos que correspondem a, pelo menos, uma condição de cada secção selecionada. Por exemplo, se selecionar o sistema BigQuery e o tipo de recurso do conjunto de dados, os resultados da pesquisa incluem conjuntos de dados do BigQuery, mas não conjuntos de dados do Vertex AI.
Se selecionar vários filtros numa única secção, estes são avaliados através do operador lógico OR
. Por exemplo, se selecionar o tipo de recurso do conjunto de dados e o tipo de recurso da tabela, os resultados da pesquisa incluem conjuntos de dados e tabelas.
Filtros de pesquisa de palavras-chave
Para a pesquisa de palavras-chave, os filtros estão agrupados nas seguintes secções:
- Sistemas, como o BigQuery, o Cloud SQL e outros. O sistema Dataplex Universal Catalog contém entradas personalizadas.
- Aspetos (etiquetas): lista todos os aspetos disponíveis para si.
- Projeto apresenta todos os projetos disponíveis para si.
- Os alias de tipos descrevem tipos de recursos, como bases de dados, conjuntos de dados, modelos, tabelas, vistas, serviços e tipos personalizados.
- Os conjuntos de dados são provenientes do BigQuery.
Filtre por valor do aspeto
Os filtros Aspetos permitem-lhe consultar recursos etiquetados com um modelo específico. Pode usar o menu Personalizar para refinar ainda mais os resultados e
filtrar por valores de aspetos específicos. As condições do filtro de valor do aspeto dependem do tipo de dados desse campo de aspeto. Por exemplo, para os campos datetime
e number
, pode especificar uma data específica ou um intervalo.
Visibilidade do filtro
Os filtros Sistemas, Alias de tipo, Projeto e Conjuntos de dados são apresentados consoante a consulta atual no campo Pesquisa.
Filtros de pesquisa de linguagem natural
Para a pesquisa em linguagem natural, estão disponíveis os seguintes filtros:
- Âmbito: pesquise em toda a organização (predefinição), no projeto atual ou apenas nos recursos com estrela. Para mais informações, consulte a secção Âmbito da pesquisa deste documento.
- Sistemas: o Google Cloud serviço ao qual o recurso pertence, como o BigQuery. O sistema do catálogo universal do Dataplex contém grupos de entradas.
- Projetos: os projetos nos quais pesquisar.
- Tipo: o tipo de recurso, como ligação do BigQuery, contentor do Cloud Storage ou base de dados. Dependendo do tipo de recurso, também pode filtrar por subtipo, como o tipo de ligação ou o dialeto de SQL.
- Selecionar localizações: as localizações onde pesquisar.
- Selecionar conjuntos de dados: os resultados da pesquisa estão limitados aos recursos do BigQuery que pertencem aos conjuntos de dados do BigQuery selecionados. No campo Escreva para filtrar, introduza o nome do conjunto de dados.
- Tipos de aspetos: os tipos de aspetos do Dataplex Universal Catalog que estão associados ao recurso que está a pesquisar. Para filtrar por valores de aspeto, clique em Filtrar por valores de anotação e, de seguida, selecione os valores.
Antes de começar
Antes de realizar a pesquisa, certifique-se de que lhe foram concedidas as funções necessárias e que ativou a API necessária.
Funções necessárias
Esta secção descreve as funções e as autorizações necessárias para pesquisar recursos e aceder aos resultados da pesquisa.
Para mais informações sobre a concessão de funções, consulte o artigo Gerir acesso.
Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Funções necessárias para pesquisar entradas
Para pesquisar entradas, precisa de, pelo menos, uma das seguintes funções da IAM no projeto usado para a pesquisa: administrador do catálogo do Dataplex, editor do catálogo do Dataplex ou leitor do catálogo do Dataplex. As autorizações nos resultados da pesquisa são verificadas independentemente do projeto selecionado.
Funções necessárias para aceder aos resultados da pesquisa
Os resultados da pesquisa no Dataplex Universal Catalog são definidos de acordo com a sua função. Para pesquisar um recurso no Dataplex Universal Catalog, tem de ter autorizações para aceder ao recurso correspondente no sistema de origem. Para mais informações, consulte a secção Âmbito da pesquisa deste documento.
Por exemplo, para pesquisar conjuntos de dados, tabelas, vistas e modelos do BigQuery, precisa das autorizações respetivas para essas entradas. Para mais informações, consulte as autorizações do BigQuery.
A lista seguinte descreve as autorizações mínimas necessárias:
- Para pesquisar uma tabela, precisa de autorização
bigquery.tables.get
para essa tabela. - Para pesquisar um conjunto de dados, precisa de
bigquery.datasets.get
autorização para esse conjunto de dados. - Para pesquisar metadados de um conjunto de dados ou de uma tabela, precisa da função de visualizador de metadados do BigQuery (
roles/bigquery.metadataViewer
).
Como outro exemplo, para pesquisar instâncias, bases de dados, esquemas, tabelas e vistas do Cloud SQL, precisa das respetivas autorizações nessas entradas. Para mais informações, consulte o artigo Funções e autorizações do Cloud SQL.
Para pesquisar entradas personalizadas, precisa da função de visualizador do catálogo do Dataplex (roles/dataplex.catalogViewer
).
Ative a API
Enable the Dataplex API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM
role (roles/serviceusage.serviceUsageAdmin
), which
contains the serviceusage.services.enable
permission. Learn how to grant
roles.
Pesquisar recursos
Consola
Para pesquisar recursos, siga estes passos:
Na Google Cloud consola, aceda à página Pesquisa do catálogo universal do Dataplex.
Para Escolher plataforma de pesquisa, selecione Dataplex Universal Catalog.
A seleção de Dataplex Universal Catalog permite-lhe pesquisar o armazenamento de metadados do Dataplex Universal Catalog. Se selecionar Catálogo de dados, pode pesquisar o seu repositório do Catálogo de dados, se for um utilizador existente do Catálogo de dados.
Para usar a pesquisa de palavras-chave, siga estes passos:
No campo Encontre recursos em todos os projetos, introduza a sua consulta.
Para refinar a pesquisa, use o painel Filtros. Para ver a lista de filtros disponíveis, consulte os filtros de pesquisa de palavras-chave.
Pode adicionar manualmente os seguintes filtros:
- Adicione um filtro de projeto: em Projeto, clique em Adicionar projeto. Pesquise um projeto específico, selecione-o e, de seguida, clique em Abrir.
- Adicione um filtro de tipo de aspeto: em Aspetos, clique no menu Adicionar mais tipos de aspetos. Pesquise um modelo específico, selecione-o e, de seguida, clique em OK.
Opcional: além dos recursos disponíveis, pode pesquisar recursos disponíveis publicamente em Google Cloud selecionando Incluir conjuntos de dados públicos.
Use as seguintes sugestões para criar uma consulta de pesquisa:
- Inclua a sua expressão de pesquisa entre aspas se contiver espaços. Por
exemplo,
"search terms"
. - Preceda uma palavra-chave com
NOT
para corresponder à negação lógica do filtrokeyword:term
. Também pode usar os operadores booleanosAND
eOR
para combinar expressões de pesquisa. Os operadoresAND
,OR
eNOT
não são sensíveis a maiúsculas e minúsculas.
Por exemplo,
NOT column:term
lista todas as colunas, exceto as que correspondem ao termo especificado. Para ver uma lista de palavras-chave e outros termos que pode usar numa expressão de pesquisa do Dataplex Universal Catalog, consulte a sintaxe de pesquisa.- Inclua a sua expressão de pesquisa entre aspas se contiver espaços. Por
exemplo,
Para usar a pesquisa em linguagem natural, siga estes passos:
Clique em Experimentar pesquisa em linguagem natural.
No campo Encontre recursos em projetos com linguagem natural, introduza a sua consulta em linguagem natural e, de seguida, prima Enter.
Seguem-se alguns exemplos de consultas:
Show me the datasets that contain taxi information
Find data on vaccine distribution across different countries
Get tables with historical temperature data for major world cities
Search for hurricane tracking and storm activity datasets
Population data by country
Para refinar a pesquisa, clique em Filtros. Para ver a lista de filtros disponíveis, consulte o artigo Filtros de pesquisa em linguagem natural.
Para ver mais informações sobre o recurso pesquisado, nos resultados da pesquisa, clique no nome do recurso. É apresentada a página de detalhes da entrada.
gcloud
Para pesquisar recursos, use o comando gcloud dataplex entries search
.
REST
Para pesquisar recursos, use o método searchEntries
.
Veja os detalhes de uma entrada
Consola
Use a pesquisa do Dataplex Universal Catalog para ver os detalhes de uma entrada.
Pesquise uma entrada no Dataplex Universal Catalog.
Nos resultados da pesquisa, clique na entrada para a qual quer ver os detalhes.
É apresentada a página de detalhes da entrada. A página inclui as seguintes secções:
- Detalhes da entrada: inclui informações como o tipo de entrada, o sistema, a plataforma, o nome totalmente qualificado, a hora de criação, a hora da última modificação, a descrição e os responsáveis.
- Vista geral: uma vista geral da entrada, se disponível.
- Aspetos: os aspetos obrigatórios e opcionais definidos para a entrada. Para mais informações, consulte o artigo Categorias de aspetos.
gcloud
Para ver os detalhes de uma entrada, use o comando gcloud dataplex entries lookup
.
REST
Para ver os detalhes de uma entrada, use o
método lookupEntry
.
Limitações
Seguem-se as limitações da pesquisa em linguagem natural:
A pesquisa de linguagem natural está otimizada para a descoberta e a exploração, devolvendo um conjunto limitado dos resultados mais relevantes. Pode não fornecer uma lista exaustiva de todos os itens correspondentes e, por isso, pode não ser adequado para cargas de trabalho que dependam desta funcionalidade, como pipelines de organização.
A pesquisa em linguagem natural tem em conta apenas os metadados dos recursos, incluindo esquemas, descrições e aspetos. Não responde a perguntas sobre os dados nas tabelas (por exemplo, "Quais foram as vendas do mês passado?") nem executa consultas analíticas nos metadados (por exemplo, "Quantas tabelas existem no conjunto de dados X?").
Os recursos públicos estão fora do âmbito da pesquisa em linguagem natural.
O que se segue?
- Compreenda a sintaxe de pesquisa do Dataplex Universal Catalog.
- Saiba mais acerca da gestão de metadados no Dataplex Universal Catalog.
- Saiba como enriquecer as entradas com metadados através de aspetos.
- Saiba como gerir entradas e carregar origens personalizadas.