Neste documento, você verá como gravar ou salvar resultados de consulta.
Tabelas temporárias e permanentes
O BigQuery salva todos os resultados de consulta em uma tabela, que pode ser permanente ou temporária.
O BigQuery usa tabelas temporárias para armazenar em cache os resultados da consulta que não são gravados em uma tabela permanente. As tabelas são criadas em um conjunto de dados especial e nomeadas aleatoriamente. Também é possível criar tabelas temporárias para seu próprio uso. Para mais informações, consulte Tabelas temporárias.
Após o término de uma consulta, a tabela temporária existirá por até 24 horas. Para ver os dados e a estrutura da tabela, acesse o console do BigQuery, clique em Histórico de consulta e escolha a consulta que criou a tabela temporária Depois, na linha Tabela de destino, clique em Tabela temporária.
Não é possível consultar ou compartilhar tabelas temporárias, e elas não são visíveis usando qualquer lista de lista padrão ou outros métodos de manipulação de tabela. Não há cobrança pelo armazenamento de tabelas temporárias.
Uma tabela permanente pode ser uma tabela nova ou atual em qualquer conjunto de dados a que você tenha acesso. Se você gravar os resultados da consulta em uma tabela nova, será cobrado pelo armazenamento dos dados. Quando você grava os resultados da consulta em uma tabela permanente, as tabelas consultadas precisam estar no mesmo local que o conjunto de dados que contém a tabela de destino.
Permissões necessárias
Para gravar resultados de consulta em uma tabela, é necessário ter, no mínimo, as seguintes permissões:
bigquery.tables.create
para criar uma nova tabelabigquery.tables.updateData
para gravar dados em uma nova tabela, substituir uma tabela ou anexar dados a uma tabelabigquery.jobs.create
para executar um job de consulta
Outras permissões, como bigquery.tables.getData
, podem ser necessárias para acessar os dados que você está consultando.
Os seguintes papéis predefinidos do IAM incluem as permissões bigquery.tables.create
e bigquery.tables.updateData
:
bigquery.dataEditor
bigquery.dataOwner
bigquery.admin
Os seguintes papéis predefinidos do IAM incluem as permissões bigquery.jobs.create
:
bigquery.user
bigquery.jobUser
bigquery.admin
Além disso, quando um usuário tem permissões bigquery.datasets.create
e cria um conjunto de dados, ele recebe o acesso bigquery.dataOwner
ao conjunto.
O acesso bigquery.dataOwner
permite que o usuário crie e atualize tabelas no conjunto de dados.
Para mais informações sobre papéis e permissões do IAM no BigQuery, consulte Papéis e permissões predefinidos.
Como gravar resultados de consulta em uma tabela permanente
Ao gravar resultados de consulta em uma tabela permanente, é possível criar uma tabela nova, anexar os resultados a uma atual ou substituí-la. Grave os resultados da consulta em uma tabela permanente das seguintes maneiras:
- usando o Console do Cloud;
- usando o comando
bq
da ferramenta de linha de comandobq query
; - chame o método de API
jobs.insert
e configure um jobquery
; - usando bibliotecas de cliente;
Como gravar resultados de consulta
Use o procedimento a seguir para gravar os resultados da consulta em uma tabela permanente. Para ajudar a controlar custos, é possível visualizar os dados antes de executar a consulta.
Console
Abra a página do BigQuery no Console do Cloud.
Na seção Recursos do painel de navegação, amplie o projeto e selecione um conjunto de dados.
Se o editor de consultas estiver oculto, clique em Mostrar editor no canto superior direito da janela.
Insira uma consulta SQL válida na área de texto do Editor de consultas.
Clique em Mais abaixo do editor e selecione Configurações de consulta.
Marque a caixa Definir uma tabela de destino para os resultados da consulta.
Na seção Destino, selecione o Nome do projeto e o Nome do conjunto de dados em que a tabela será criada e escolha um Nome de tabela.
Na seção Preferência de gravação na tabela de destino, escolha uma das seguintes opções:
- Gravar apenas se a tabela estiver vazia: grava os resultados da consulta na tabela apenas se ela estiver vazia.
- Anexar à tabela: anexa os resultados da consulta a uma tabela atual.
- Substituir tabela: usa os resultados da consulta para substituir uma tabela atual com o mesmo nome.
(Opcional) Em Local de processamento, clique em Seleção automática e escolha o local.
Clique em Executar consulta. Isso cria um job de consulta que grava os resultados da consulta na tabela que você especificou.
Como alternativa, se você esquecer de especificar uma tabela de destino antes de executar a consulta, clique no botão Salvar resultados abaixo do editor para copiar a tabela de resultados em cache para uma tabela permanente.
SQL
Com as instruções de linguagem de definição de dados (DDL), é possível criar e modificar tabelas usando a sintaxe de consulta do SQL padrão.
Para mais informações, consulte a página de instrução CREATE TABLE
e o exemplo CREATE TABLE
: Como criar uma nova tabela a partir de uma atual.
bq
Insira o comando bq query
e especifique a sinalização --destination_table
para criar uma tabela permanente com base nos resultados da consulta. Especifique a sinalização use_legacy_sql=false
para usar a sintaxe SQL padrão. Para gravar os resultados da consulta em uma tabela que não esteja no projeto padrão, adicione o ID do projeto ao nome do conjunto de dados no seguinte formato: project_id:dataset
.
Opcional: forneça a sinalização --location
e defina o valor do
local.
Para controlar a disposição de gravação de uma tabela de destino atual, especifique uma das seguintes sinalizações opcionais:
--append_table
: se a tabela de destino existir, os resultados da consulta serão anexados a ela.--replace
: se a tabela de destino existir, ela será substituída pelos resultados da consulta.
bq --location=location query \ --destination_table project_id:dataset.table \ --use_legacy_sql=false 'query'
Substitua:
location
é o nome do local usado para processar a consulta. A sinalização--location
é opcional. Por exemplo, se estiver usando o BigQuery na região de Tóquio, é possível definir o valor da sinalização comoasia-northeast1
. É possível definir um valor padrão para o local usando o arquivo.bigqueryrc
.project_id
é o ID do projeto.dataset
é o nome do conjunto de dados que contém a tabela na qual você está gravando os resultados da consulta.table
é o nome da tabela na qual você está gravando os resultados da consulta.query
é uma consulta na sintaxe SQL padrão.
Se nenhuma sinalização de disposição de gravação for especificada, o comportamento
padrão será gravar os resultados na tabela somente se ela estiver vazia. Se a tabela existir e não estiver vazia, o seguinte erro será retornado: "BigQuery error in query operation: Error processing job project_id:bqjob_123abc456789_00000e1234f_1': Already
Exists: Table project_id:dataset.table
".
Exemplos:
Digite o comando a seguir para gravar resultados de consulta em uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está no projeto padrão.
Como nenhuma sinalização de disposição de gravação está especificada no comando, a tabela precisa ser nova ou estar vazia. Caso contrário, é retornado um erro Already exists
. A consulta
recupera dados do conjunto de dados público USA Name Data (link em inglês).
bq query \ --destination_table mydataset.mytable \ --use_legacy_sql=false \ 'SELECT name, number FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE gender = "M" ORDER BY number DESC'
Digite o comando a seguir para usar resultados da consulta e substituir uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está no projeto padrão. O comando usa a sinalização --replace
para substituir a tabela de destino.
bq query \ --destination_table mydataset.mytable \ --replace \ --use_legacy_sql=false \ 'SELECT name, number FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE gender = "M" ORDER BY number DESC'
Digite o comando a seguir para anexar resultados de consulta a uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está em my-other-project
, e não no projeto padrão. O comando usa a sinalização --append_table
para anexar os resultados da consulta na tabela de destino.
bq query \ --append_table \ --use_legacy_sql=false \ --destination_table my-other-project:mydataset.mytable \ 'SELECT name, number FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE gender = "M" ORDER BY number DESC'
A saída de cada um desses exemplos será semelhante ao seguinte. Para facilitar a leitura, ocultamos parte do resultado.
Waiting on bqjob_r123abc456_000001234567_1 ... (2s) Current status: DONE +---------+--------+ | name | number | +---------+--------+ | Robert | 10021 | | John | 9636 | | Robert | 9297 | | ... | +---------+--------+
API
Para salvar resultados de consulta em uma tabela permanente, chame o método jobs.insert
, configure um job query
e inclua um valor para a property destinationTable
. Para controlar a disposição de gravação de uma tabela de destino atual, configure a property writeDisposition
.
Para controlar o local de processamento do job de consulta, especifique a property location
na seção jobReference
do recurso do job.
Go
Antes de testar essa amostra, siga as instruções de configuração para Go no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Go.
Java
Antes de testar essa amostra, siga as instruções de configuração para Java no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Java.
Para salvar os resultados de consulta em uma tabela permanente, defina a tabela de destino como o TableId desejado em uma QueryJobConfiguration.
Node.js
Antes de testar essa amostra, siga as instruções de configuração para Node.js no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery Node.js.
Python
Antes de testar essa amostra, siga as instruções de configuração para Python no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Python.
Para salvar resultados de consulta em uma tabela permanente, crie um QueryJobConfig e defina o destino como a TableReference desejada. Transmita a configuração do job para o método de consulta (links em inglês).Como gravar resultados de consulta extensos
Normalmente, as consultas têm um tamanho máximo de resposta. Se você planeja executar uma consulta que possa retornar resultados maiores, é possível realizar uma das seguintes ações:
- especificar uma tabela de destino para os resultados da consulta no SQL padrão;
- especificar uma tabela de destino e definir a opção
allowLargeResults
no SQL legado.
Não há cobrança pelo armazenamento dos dados ao especificar uma tabela de destino para resultados de consulta extensos.
Limitações
No SQL legado, a gravação de resultados extensos está sujeita a estas limitações:
- É necessário especificar uma tabela de destino.
- Não é possível especificar uma cláusula de nível superior
ORDER BY
,TOP
ouLIMIT
. Se você fizer isso, o benefício de usarallowLargeResults
será negado, porque a saída da consulta não poderá mais ser computada em paralelo. - As funções de janela somente poderão retornar resultados de consulta extensos se usadas em conjunto com uma cláusula
PARTITION BY
.
Como gravar resultados extensos usando SQL legado
Para gravar conjuntos de resultados extensos usando SQL legado:
Console
Abra a página do BigQuery no Console do Cloud.
Clique em Escrever nova consulta.
Insira uma consulta SQL válida na área de texto do Editor de consultas. Use o prefixo
#legacySQL
ou verifique se você marcou Usar SQL legado nas configurações da consulta.Clique em Mais e selecione Configurações de consulta.
Em Destino, marque Definir uma tabela de destino para os resultados da consulta.
Em Nome do projeto, escolha o projeto em que a tabela de destino será criada.
Em Nome do conjunto de dados, escolha o conjunto de dados que armazenará a tabela.
Insira o nome da tabela no campo Nome da tabela.
Se você estiver gravando um conjunto de resultados extensos em uma tabela atual, poderá usar as opções de Preferência de gravação na tabela de destino para controlar a disposição de gravação da tabela de destino:
- Write if empty: grava os resultados da consulta na tabela apenas se ela estiver vazia.
- Anexar à tabela: anexa os resultados da consulta a uma tabela atual.
- Overwrite table: usa os resultados da consulta para substituir uma tabela atual com o mesmo nome.
Em Tamanho dos resultados, marque Permitir resultados extensos (sem limite de tamanho).
(Opcional) Em Local de processamento, clique em Seleção automática e escolha o local dos seus dados.
Clique em Salvar para atualizar as configurações da consulta.
Clique em Executar. Isso cria um job de consulta que grava os resultados extensos definidos na tabela que você especificou.
bq
Use a sinalização --allow_large_results
com a sinalização --destination_table
para criar uma tabela de destino que armazene o conjunto de resultados extensos. Como a opção --
allow_large_results
só se aplica ao SQL legado, é preciso especificar também a sinalização --use_legacy_sql=true
. Para gravar os resultados da consulta em uma tabela que não esteja no projeto padrão, adicione o ID do projeto ao nome do conjunto de dados no seguinte formato:
PROJECT_ID:DATASET
.
Forneça a sinalização --location
e defina o valor como seu local.
Para controlar a disposição de gravação de uma tabela de destino atual, especifique uma das seguintes sinalizações opcionais:
--append_table
: se a tabela de destino existir, os resultados da consulta serão anexados a ela.--replace
: se a tabela de destino existir, ela será substituída pelos resultados da consulta.
bq --location=location query \ --destination_table PROJECT_ID:DATASET.TABLE \ --use_legacy_sql=true \ --allow_large_results "QUERY"
Substitua:
LOCATION
é o nome do local usado para processar a consulta. A sinalização--location
é opcional. Por exemplo, se estiver usando o BigQuery na região de Tóquio, é possível definir o valor da sinalização comoasia-northeast1
. É possível definir um valor padrão para o local usando o arquivo.bigqueryrc
.PROJECT_ID
é o ID do projeto.DATASET
é o nome do conjunto de dados que contém a tabela na qual você está gravando os resultados da consulta.TABLE
é o nome da tabela na qual você está gravando os resultados da consulta;QUERY
é uma consulta na sintaxe do SQL legado.
Exemplos:
Digite o comando a seguir para gravar resultados de consulta extensos em uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está no projeto padrão. Como nenhuma sinalização de disposição de gravação está especificada no comando, a tabela precisa ser nova ou estar vazia. Caso contrário, é retornado um erro Already exists
. A consulta recupera dados do conjunto de dados público USA Name Data.
Essa consulta é usada apenas para fins de exemplo. O conjunto de resultados retornado não excede o tamanho máximo de resposta.
bq query \
--destination_table mydataset.mytable \
--use_legacy_sql=true \
--allow_large_results \
"SELECT
name,
number
FROM
[bigquery-public-data:usa_names.usa_1910_current]
WHERE
gender = 'M'
ORDER BY
number DESC"
Digite o comando a seguir para usar resultados de consulta extensos e substituir uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está em myotherproject
, e não no projeto padrão. O comando usa a sinalização --replace
para substituir a tabela de destino.
bq query \
--destination_table mydataset.mytable \
--replace \
--use_legacy_sql=true \
--allow_large_results \
"SELECT
name,
number
FROM
[bigquery-public-data:usa_names.usa_1910_current]
WHERE
gender = 'M'
ORDER BY
number DESC"
Digite o comando a seguir para anexar resultados de consulta extensos em uma tabela de destino chamada mytable
em mydataset
. O conjunto de dados está em myotherproject
, e não no projeto padrão. O comando usa a sinalização --append_table
para anexar os resultados da consulta na tabela de destino.
bq query \
--destination_table myotherproject:mydataset.mytable \
--append_table \
--use_legacy_sql=true \
--allow_large_results \
"SELECT
name,
number
FROM
[bigquery-public-data:usa_names.usa_1910_current]
WHERE
gender = 'M'
ORDER BY
number DESC"
API
Para gravar resultados extensos em uma tabela de destino, chame o método jobs.insert
, configure um job query
e defina a property allowLargeResults
como true
.
Especifique a tabela de destino usando a property destinationTable
. Para controlar a disposição de gravação de uma tabela de destino atual, configure a property writeDisposition
.
Especifique seu local na property location
da seção jobReference
do recurso do job.
Go
Antes de testar essa amostra, siga as instruções de configuração para Go no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Go.
Java
Para ativar resultados extensos, defina
Permitir resultados extensos
como true
e configure a tabela de
destino
como o
TableId desejado
em uma
QueryJobConfiguration.
Node.js
Antes de testar essa amostra, siga as instruções de configuração para Node.js no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery Node.js.
Python
Antes de testar essa amostra, siga as instruções de configuração para Python no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Python.
Como fazer o download e salvar resultados de consulta no Console do Cloud
Depois de executar uma consulta SQL usando o Console do Cloud, salve os resultados em outro local. Use o Console do Cloud para fazer o download dos resultados da consulta para um arquivo local, Planilhas ou Drive. Não é possível salvar os resultados em um arquivo local, no Planilhas Google ou no Google Drive usando a ferramenta de linha de comando bq
ou a API.
Limitações
As seguintes limitações podem ser aplicadas ao fazer o download dos resultados da consulta e salvá-los:
- Só é possível fazer o download dos resultados da consulta localmente no formato CSV ou JSON delimitado por linhas novas.
- Não é possível fazer o download dos resultados da consulta contendo dados aninhados e repetidos no formato CSV.
- Não é possível salvar resultados de consulta que contenham dados aninhados e repetidos no Planilhas Google.
- Para salvar os resultados da consulta no Drive usando o Console do Cloud, o conjunto de resultados precisa ter 1 GB ou menos. Se os resultados forem maiores do que 1 GB, salve-os em uma tabela.
- Só é possível salvar os resultados da consulta no Google Drive no formato CSV ou JSON delimitado por linhas novas.
Como fazer o download de resultados de consulta para um arquivo local
Não é possível fazer o download dos resultados da consulta para um arquivo local usando a ferramenta de linha de comando bq
ou a API.
Para fazer o download dos resultados da consulta como um arquivo CSV ou JSON delimitado por linhas novas, use o Console do Cloud:
Console
Abra a página do BigQuery no Console do Cloud.
Clique em Escrever nova consulta.
Insira uma consulta SQL válida na área de texto do Editor de consultas.
(Opcional) Para alterar o local de processamento, clique em Mais e selecione Configurações de consulta. Em Local de processamento, clique em Seleção automática e escolha o local dos dados.
Clique em Executar.
Quando os resultados forem retornados, clique em Salvar resultados e selecione o formato/local em que você quer salvá-los.
O arquivo é salvo no local de download padrão do navegador.
Como salvar os resultados da consulta no Google Drive
Não é possível salvar os resultados da consulta no Drive usando a ferramenta de linha de comando bq
ou a API.
Para salvar os resultados da consulta no Drive, use o Console do Cloud:
Console
Abra a página do BigQuery no Console do Cloud.
Insira uma consulta SQL válida na área de texto do Editor de consultas.
Clique em Executar.
Quando os resultados forem retornados, clique em Salvar resultados.
Selecione CSV (Google Drive) ou JSON (Google Drive). Quando você salva os resultados no Google Drive, não é possível escolher o local. Eles sempre são salvos na raiz "Meu Drive".
Pode levar alguns minutos para salvar os resultados no Google Drive. Depois que eles estiverem salvos, você receberá uma mensagem pop-up que inclui o nome do arquivo:
bq-results-[TIMESTAMP]-[RANDOM_CHARACTERS].[CSV or JSON]
.Na mensagem pop-up, clique em Abrir para abrir o arquivo. Você também pode navegar até o Google Drive e clicar em Meu Drive.
Como salvar os resultados da consulta no Planilhas Google
Não é possível salvar os resultados da consulta no Planilhas Google usando a ferramenta de linha de comando bq
ou a API.
Para salvar os resultados da consulta no Planilhas, use o Console do Cloud:
Console
Abra a página do BigQuery no Console do Cloud.
Clique em Escrever nova consulta.
Insira uma consulta SQL válida na área de texto do Editor de consultas.
(Opcional) Para alterar o local de processamento, clique em Mais e selecione Configurações de consulta. Em Local de processamento, clique em Seleção automática e escolha o local dos dados.
Clique em Executar.
Quando os resultados forem retornados, clique em Salvar resultados e selecione Planilhas Google.
Se necessário, siga as instruções para fazer login na sua Conta do Google e clique em Permitir para permitir que o BigQuery grave os dados na pasta
MY Drive
do Google Drive.Depois de seguir as instruções, você receberá um e-mail com o assunto "Ferramentas do cliente do BigQuery conectadas à sua Conta do Google". O e-mail contém informações sobre as permissões que você concedeu, além das etapas para remover essas permissões.
Depois que os resultados forem salvos, será exibida uma mensagem semelhante a esta abaixo dos resultados da consulta no Console do Cloud:
Saved to Sheets as "results-20190225-103531. Open
. Clique no link da mensagem para ver os resultados no Planilhas Google ou navegue até a pastaMy Drive
e abra o arquivo manualmente.Quando você salva os resultados da consulta no Planilhas Google, o nome do arquivo começa com
results-[DATE]
, onde[DATE]
é a data de hoje no formatoYYYYMMDD
.