Analisar com a tela de dados do BigQuery
Este documento descreve como usar a tela de dados para análise de dados. Também é possível gerenciar metadados da tela de dados usando o Dataplex.
Tela de dados do BigQuery Studio, que é um recurso do Gemini no BigQuery, permite encontrar, transformar, consultar e visualizar dados usando comandos em idiomas naturais e uma interface gráfica para fluxos de trabalho de análise.
Para fluxos de trabalho de análise, a tela de dados do BigQuery usa um gráfico acíclico dirigido (DAG), que fornece uma visão gráfica do fluxo de trabalho. Na tela de dados do BigQuery, é possível iterar os resultados da consulta e trabalhar com várias ramificações de pesquisa em um único lugar.
A tela de dados do BigQuery foi projetada para acelerar as tarefas de análise e ajudar profissionais de dados, como analistas e engenheiros de dados, com seus jornada de dados para insights. Não é necessário ter conhecimento técnico de ferramentas específicas, apenas familiaridade básica com a leitura e a gravação de SQL. A tela de dados do BigQuery funciona com os metadados do Dataplex para identificar tabelas apropriadas com base na linguagem natural.
A tela de dados do BigQuery não é destinada ao uso direto por usuários empresariais.
A tela de dados do BigQuery usa o Gemini no BigQuery para encontrar seus dados, criar SQL, gerar gráficos e criar resumos de dados.
Saiba como e quando o Gemini para Google Cloud usa seus dados.
Recursos
Com a tela de dados do BigQuery, é possível realizar as seguintes tarefas:
Use consultas de linguagem natural ou a sintaxe de pesquisa por palavras-chave com metadados do Dataplex para encontrar recursos como tabelas, visualizações ou visualizações materializadas.
Use linguagem natural para consultas SQL básicas, como as seguintes:
- Consultas que contêm cláusulas
FROM
, funções matemáticas, matrizes e structs. - Operações
JOIN
para duas tabelas.
- Consultas que contêm cláusulas
Visualize dados usando os seguintes tipos de gráficos:
- Gráfico de barras
- Mapa de calor
- Gráfico de linhas
- Gráfico de pizza
- Gráfico de dispersão
Crie visualizações personalizadas usando linguagem natural para descrever o que você quer.
Automatize os insights de dados.
Limitações
Os comandos de linguagem natural podem não funcionar bem com:
- BigQuery ML
- Apache Spark
- Tabelas de objetos
- BigLake
INFORMATION_SCHEMA
visualizações- JSON
- Campos aninhados e repetidos
- Funções e tipos de dados complexos, como
DATETIME
eTIMEZONE
As visualizações de dados não funcionam com gráficos de mapa geográfico.
Práticas recomendadas para a solicitação
Com as técnicas de comandos corretas, é possível gerar consultas SQL complexas. O as sugestões abaixo ajudam a tela de dados do BigQuery a refinar de idiomas para aumentar a precisão das consultas:
Escreva com clareza. Faça seu pedido de forma clara e evite ser vago.
Faça perguntas diretas. Para uma resposta mais precisa, faça uma pergunta por vez e mantenha as instruções concisas. Se necessário, separe as instruções em diferentes nós na tela de dados do BigQuery.
Dê instruções focadas e explícitas. Enfatize termos-chave na sua comandos.
Especificar a ordem das operações. Dê instruções de forma clara de forma ordenada. Divida as tarefas em etapas pequenas e focadas.
Refine e itere. Teste frases e abordagens diferentes para saber produz os melhores resultados.
Para mais informações, consulte Práticas recomendadas de comandos para a tela de dados do BigQuery.
Antes de começar
- Verifique se o Gemini no BigQuery está ativado para seu Google Cloud projeto. Geralmente, essa etapa é realizada por um administrador.
- Verifique se você tem as permissões necessárias de Identity and Access Management (IAM) para usar a tela de dados do BigQuery.
- Para gerenciar os metadados da tela de dados no Dataplex, verifique se a API Dataplex está ativada no seu projeto do Google Cloud .
Funções exigidas
Para receber as permissões necessárias para usar a tela de dados do BigQuery, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Usuário do BigQuery Studio (
roles/bigquery.studioUser
) -
Usuário da Gemini para o Google Cloud (
roles/cloudaicompanion.user
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Para mais informações sobre os papéis e as permissões do IAM no BigQuery, consulte Introdução ao IAM.
Para gerenciar metadados da tela de dados no Dataplex,
verifique se você tem as funções do Dataplex necessárias e a
permissão dataform.repository.get
.
Usar a tela de dados do BigQuery
É possível usar a tela de dados do BigQuery no console do Google Cloud , em uma consulta ou em uma tabela.
Acessar a página do BigQuery.
No editor de consultas, ao lado de
Consulta SQL, clique em Criar novo e, em seguida, em Tela de dados.No campo de solicitação de linguagem natural, insira uma solicitação de linguagem natural.
Por exemplo, se você inserir
Find me tables related to trees
, a tela de dados do BigQuery retornará uma lista de tabelas possíveis, incluindo conjuntos de dados públicos, comobigquery-public-data.usfs_fia.plot_tree
oubigquery-public-data.new_york_trees.tree_species
.Selecione uma tabela.
Um nó para a tabela selecionada foi adicionada à tela de dados do BigQuery. Para acessar informações do esquema, detalhes da tabela ou visualizar os dados, selecione as várias guias no nó da tabela.
Testar exemplos de fluxos de trabalho
Confira nesta seção diferentes maneiras de usar a tela de dados do BigQuery em fluxos de trabalho de análise.
Exemplo de fluxo de trabalho: encontrar, consultar e visualizar dados
Neste exemplo, você usa comandos de linguagem natural na tela de dados do BigQuery para encontrar dados e gerar e editar uma consulta. Depois, você vai criar um gráfico.
Comando 1: Encontrar dados
No console do Google Cloud , acesse a página BigQuery.
No editor de consultas, ao lado de
Consulta SQL, clique em Criar novo e, em seguida, em Tela de dados.No campo de solicitação Natural Language, insira o seguinte comando:
Chicago taxi trips
A tela de dados do BigQuery gera uma lista de possíveis tabelas com base nos metadados do Dataplex. É possível selecionar várias tabelas.
Selecione a tabela
bigquery-public-data.chicago_taxi_trips.taxi_trips
e, em seguida, clique em Adicionar à tela.Um nó da tabela para
taxi_trips
foi adicionada à tela de dados do BigQuery. Para acessar informações do esquema, detalhes da tabela ou visualizar os dados, selecione as várias guias no nó da tabela.
Comando 2: gerar uma consulta SQL na tabela selecionada
Para gerar uma consulta SQL para a tabela bigquery-public-data.chicago_taxi_trips.taxi_trips
, faça o seguinte:
Na tela de dados, clique em Consulta.
No campo de comando Natural Language, digite o seguinte código:
Get me the 100 longest trips
A tela de dados do BigQuery gera uma consulta SQL semelhante à seguinte:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Comando 3: editar a consulta
Se quiser editar a consulta gerada, é possível editá-la manualmente ou alterar o comando de linguagem natural e gerar a consulta novamente. Neste exemplo, você usa um comando de linguagem natural para editar a consulta e selecionar apenas viagens em que o cliente pagou com dinheiro.
No campo de comando Natural Language, digite o seguinte código:
Get me the 100 longest trips where the payment type is cash
A tela de dados do BigQuery gera uma consulta SQL semelhante à seguinte:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
No exemplo anterior,
PROJECT_ID
é o ID do seu Google Cloud projeto.Para ver os resultados da consulta, clique em Executar.
Crie um gráfico
- Na tela de dados, clique em Visualizar.
Clique em Criar gráfico de barras.
A tela de dados do BigQuery cria um gráfico de barras que mostra o maior número de milhas por ID da viagem. Além de fornecer um gráfico, a tela de dados do BigQuery resume alguns dos principais detalhes dos dados que apoiam a visualização.
(Opcional) Fazer uma ou mais das seguintes ações:
- Para modificar o gráfico, clique em Editar e acesse o gráfico no painel Editar visualização.
- Para compartilhar a tela de dados, clique em Compartilhar e, em seguida, em Compartilhar link para copiar o link da tela de dados do BigQuery.
- Para limpar a tela de dados, selecione Mais ações e selecione Limpar tela. Esta etapa resulta em uma tela em branco.
Exemplo de fluxo de trabalho: mesclar tabelas
Neste exemplo, são usados comandos de linguagem natural na tela de dados do BigQuery para encontrar dados e mesclar tabelas. Em seguida, você vai exportar uma consulta como um notebook.
Comando 1: Encontrar dados
No campo de solicitação Natural Language, digite o seguinte comando:
Information about trees
A tela de dados do BigQuery sugere várias tabelas com informações sobre árvores.
Neste exemplo, selecione a tabela
bigquery-public-data.new_york_trees.tree_census_1995
e clique em Adicionar à tela.A tabela é exibida na tela.
Comando 2: mesclar as tabelas nos endereços
Na tela de dados, clique em Mesclar.
A tela de dados do BigQuery sugere tabelas a serem mescladas.
Para abrir um novo campo de comando da Natural Language, clique em Pesquisar tabelas.
No campo de solicitação Natural Language, digite o seguinte comando:
Information about trees
Selecione a tabela
bigquery-public-data.new_york_trees.tree_census_2005
e clique em Adicionar à tela.A tabela é exibida na tela.
Na tela de dados, clique em Mesclar.
Na seção Nesta tela, marque a caixa de seleção Célula da tabela e clique em OK.
No campo de solicitação Natural Language, digite o seguinte comando:
Join on address
A tela de dados do BigQuery propõe a consulta SQL para unir essas duas tabelas nos endereços delas.
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Para executar a consulta e ver os resultados, clique em Executar.
Exportar consulta como um notebook
A tela de dados do BigQuery permite exportar suas consultas como um notebook.
- Na tela de dados, clique em Exportar como notebook.
- No painel Salvar notebook, insira o nome do notebook e a região em que você quer salvá-lo.
- Clique em Salvar. O notebook foi criado.
- Opcional: para acessar o notebook criado, clique em Abrir.
Exemplo de fluxo de trabalho: editar um gráfico usando um comando
Neste exemplo, você usa comandos de linguagem natural na tela de dados do BigQuery para encontrar, consultar e filtrar dados e, em seguida, editar os detalhes da visualização.
Comando 1: Encontrar dados
Para encontrar dados sobre nomes nos EUA, insira o seguinte comando:
Find data about USA names
A tela de dados do BigQuery gera uma lista de tabelas.
Neste exemplo, selecione a tabela
bigquery-public-data.usa_names.usa_1910_current
e clique em Adicionar à tela.
Comando 2: consultar os dados
Para consultar os dados, na tela de dados, clique em Consulta e insira o seguinte comando:
Summarize this data
A tela de dados do BigQuery gera uma consulta semelhante à seguinte:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Clique em Executar. Os resultados da consulta são exibidos.
Comando 3: filtrar os dados
- Na tela de dados, clique em Consultar estes resultados.
Para filtrar os dados, no campo de comando SQL, digite este comando:
Get me the top 10 most popular names in 1980
A tela de dados do BigQuery gera uma consulta semelhante à seguinte:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Ao executar a consulta, você recebe uma tabela com os dez nomes mais comuns de crianças nascidas em 1980.
Criar e editar um gráfico
Na tela de dados, clique em Visualizar.
A tela de dados do BigQuery sugere várias opções de visualização, incluindo gráfico de barras, de pizza, de linhas e visualização personalizada.
Neste exemplo, clique em Criar gráfico de barras.
A tela de dados do BigQuery cria um gráfico de barras semelhante ao seguinte:
Além de fornecer um gráfico, a tela de dados do BigQuery resume alguns dos principais detalhes dos dados que apoiam a visualização. Para modificar o gráfico, clique em Detalhes da visualização e edite o gráfico no painel lateral.
Comando 4: editar os detalhes da visualização
No campo de solicitação Visualização, digite o seguinte código:
Create a bar chart sorted high to low, with a gradient
A tela de dados do BigQuery cria um gráfico de barras semelhante ao seguinte:
Opcional: para fazer outras mudanças, clique em Editar.
O painel Editar visualização vai aparecer. Você pode editar detalhes como o título do gráfico, nome do eixo x e nome do eixo y. Além disso, se você clicar na guia JSON Editor, poderá editar o gráfico diretamente com base nos valores JSON.
Conferir todas as telas de dados
Para conferir uma lista de todas as telas de dados no seu projeto, faça o seguinte:
No console do Google Cloud , acesse a página BigQuery.
No painel Explorer, clique em
Ver ações ao lado de Panos de dados e faça uma das seguintes ações:
- Para abrir a lista na guia atual, clique em Mostrar tudo.
- Para abrir a lista em uma nova guia, clique em Mostrar tudo em > Nova guia.
- Para abrir a lista em uma guia dividida, clique em Mostrar tudo em > Guia dividida.
Conferir metadados da tela de dados
Para conferir os metadados da tela de dados, faça o seguinte:
No console do Google Cloud , acesse a página BigQuery.
No painel Explorer, expanda seu projeto e a pasta Data canvases e, se necessário, a pasta Shared data canvases. Clique no nome da tela de dados em que você quer ver os metadados.
Confira o painel Resumo para ver informações sobre a tela de dados, como a região que ela usa e a data da última modificação.
Trabalhar com versões da tela de dados
É possível conferir, comparar e restaurar versões de uma tela de dados.
Conferir e comparar versões da tela de dados
Para conferir diferentes versões de uma tela de dados e compará-las com a versão atual, faça o seguinte:
No console do Google Cloud , acesse a página BigQuery.
No painel Explorer, expanda seu projeto e a pasta Data canvases e, se necessário, a pasta Shared data canvases. Clique no nome da tela de dados com a atividade que você quer conferir.
Clique na guia Atividade para conferir uma lista das versões da tela de dados em ordem decrescente por data.
Clique em
Conferir ações ao lado de uma versão da tela de dados e, em seguida, em Comparar. O painel de comparação é aberto, comparando a versão da tela de dados selecionada com a versão atual.Opcional: para comparar as versões inline em vez de em painéis separados, clique em Comparar e em Inline.
Restaurar uma versão da tela de dados
Use uma das opções a seguir para restaurar uma versão da tela de dados. A restauração do painel de comparação permite comparar a versão anterior da tela de dados com a versão atual antes de decidir se quer restaurá-la.
Painel de atividades
- No painel Explorer, expanda seu projeto e a pasta Data canvases e, se necessário, a pasta Shared data canvases. Clique no nome da tela de dados que você quer restaurar.
- Selecione o painel Atividade.
- Clique em Ver ações ao lado da versão da tela de dados que você quer restaurar e clique em Restaurar.
- Clique em Confirmar para confirmar a ação.
Painel de comparação
- No painel Explorer, expanda seu projeto e a pasta Data canvases e, se necessário, a pasta Shared data canvases. Clique no nome da tela de dados que você quer restaurar.
- Selecione o painel Atividade.
- Clique em Ver ações ao lado de uma versão da tela de dados e, em seguida, em Comparar. O painel de comparação é aberto, comparando a versão da tela de dados selecionada com a versão mais recente.
- Se quiser restaurar a versão anterior da tela de dados após a comparação, clique em Restaurar.
- Clique em Confirmar para confirmar a ação.
Gerenciar metadados no Dataplex
O Dataplex permite visualizar e gerenciar metadados de telas de dados. As telas de dados estão disponíveis no Dataplex por padrão, sem configuração adicional.
Você pode usar o Dataplex para gerenciar telas de dados em todos os locais do BigQuery. O gerenciamento de telas de dados no Dataplex está sujeito às cotas e limites do Dataplex e aos preços do Dataplex.
O Dataplex recupera automaticamente os seguintes metadados das telas de dados:
- Nome do recurso de dados
- Pai do recurso de dados
- Local do recurso de dados
- Tipo de recurso de dados
- Projeto Google Cloud correspondente
O Dataplex registra telas de dados como entradas com os seguintes valores de entrada:
- Grupo de entrada do sistema
- O grupo de entrada do sistema
para telas de dados é
@dataform
. Para conferir os detalhes das entradas da tela de dados no Dataplex, é necessário acessar o grupo de entrada do sistemadataform
. Para conferir instruções sobre como consultar uma lista de todas as entradas em um grupo, consulte Consultar detalhes de um grupo de entrada na documentação do Dataplex. - Tipo de entrada do sistema
- O tipo de entrada do sistema
para telas de dados é
dataform-code-asset
. Para conferir detalhes dos painéis de dados, é necessário acessar o tipo de entrada do sistemadataform-code-asset
, filtrar os resultados com um filtro baseado em aspectos e definir o campotype
dentro do aspectodataform-code-asset
comoDATA_CANVAS
. Em seguida, selecione uma entrada da tela de dados selecionada. Para instruções sobre como conferir os detalhes de um tipo de entrada selecionado, consulte Conferir os detalhes de um tipo de entrada na documentação do Dataplex. Para instruções sobre como conferir os detalhes de uma entrada selecionada, consulte Conferir os detalhes de uma entrada na documentação do Dataplex. - Tipo de aspecto do sistema
- O tipo de aspecto do sistema
para telas de dados é
dataform-code-asset
. Para fornecer mais contexto aos data canvases no Dataplex anexando anotações às entradas de data canvas com aspectos, confira o tipo de aspectodataform-code-asset
, filtre os resultados com um filtro baseado em aspectos e defina o campotype
dentro do aspectodataform-code-asset
comoDATA_CANVAS
. Para instruções sobre como anotar entradas com aspectos, consulte Gerenciar aspectos e enriquecer metadados na documentação do Dataplex. - Tipo
- O tipo de telas de dados é
DATA_CANVAS
. Esse tipo permite filtrar telas de dados no tipo de entrada do sistemadataform-code-asset
e no tipo de aspectodataform-code-asset
usando a consultaaspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS
em um filtro baseado em aspectos.
Para instruções sobre como pesquisar recursos no Dataplex, consulte Pesquisar recursos de dados no Dataplex na documentação do Dataplex.
Preços
Para saber mais sobre os preços desse recurso, consulte Visão geral dos preços do Gemini no BigQuery.
Cotas e limites
Para informações sobre cotas e limites desse recurso, consulte Cotas do Gemini no BigQuery.
Enviar feedback
Ajude a melhorar as sugestões de telas de dados do BigQuery enviando feedback ao Google. Para enviar feedback, faça o seguinte:
Na barra de ferramentas do console do Google Cloud , clique em Enviar feedback.
Opcional: para copiar as informações JSON do DAG e fornecer mais contexto ao seu feedback, clique em
Copiar.Para preencher o formulário e enviar feedback, clique em formulário.
As configurações de compartilhamento de dados se aplicam a todo o projeto e só podem ser definidas por um administrador com as permissões de IAM serviceusage.services.enable
e serviceusage.services.list
. Para mais
informações sobre o uso de dados no programa Trusted Tester, consulte
Gemini no Google Cloud Programa Trusted Tester.
Para enviar feedback direto sobre esse recurso, envie um e-mail para datacanvas-feedback@google.com.
A seguir
Saiba como escrever consultas com a assistência do Gêmeos.
Saiba como criar notebooks.