Carregar e consultar dados com o console do Google Cloud
Saiba como usar o Console do Google Cloud para criar um conjunto de dados, carregar dados de amostra em uma tabela do BigQuery e consultar tabelas.
Para seguir as instruções detalhadas desta tarefa diretamente no console do Google Cloud, clique em Orientação:
Antes de começar
Antes de explorar o BigQuery, é preciso fazer login no console do Google Cloud e criar um projeto. Se você não ativar o faturamento no projeto, todos os dados de upload estarão no sandbox do BigQuery. O sandbox permite que você aprenda o BigQuery sem custos financeiros e trabalhe com um conjunto limitado de recursos do BigQuery. Para mais informações, consulte Ativar o sandbox do BigQuery.- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- Opcional: se você selecionar um projeto já existente, ative a API BigQuery. A API BigQuery é ativada automaticamente em novos projetos.
Criar um conjunto de dados do BigQuery
Use o console do Google Cloud para criar um conjunto de dados que armazena os dados.
- No console do Google Cloud, abra a página do BigQuery. Acessar o BigQuery
- No painel
Explorer , clique no nome do projeto. - Expanda Veja as ações > Criar conjunto de dados.
- Na página Criar conjunto de dados, faça o seguinte:
- Para o
ID do conjunto de dados, insira
babynames
. - Na lista Local dos dados, escolha us (várias regiões nos Estados Unidos).
Os conjuntos de dados públicos estão armazenados no
local multirregional
us
. Para simplificar, armazene seus conjuntos de dados no mesmo local. - Mantenha as configurações padrão restantes e clique em
Criar conjunto de dados .
Fazer o download do arquivo de dados de origem
Você está fazendo o download de um arquivo que tem aproximadamente 7 MB de dados com os nomes mais comuns de bebês. Ele é fornecido pela Administração da Previdência Social dos EUA.Para mais informações sobre o conjunto de dados, consulte a página de informações do conjunto de dados da Administração da Previdência Social.
Faça o download do conjunto de dados da Administração de Segurança Social dos EUA abrindo o seguinte URL em uma nova guia do navegador:
https://www.ssa.gov/OACT/babynames/names.zip
Extraia o arquivo.
Para mais informações sobre o esquema do conjunto de dados, consulte o arquivo zip
NationalReadMe.pdf
.Para conferir como são os dados, abra o arquivo
yob2014.txt
. Esse arquivo contém valores separados por vírgula para nome, sexo atribuído no nascimento e número de crianças com esse nome. O arquivo não tem linha de cabeçalho.Observe o local do arquivo
yob2014.txt
para encontrá-lo mais tarde.
Carrega dados em uma tabela
Em seguida, carregue os dados em uma nova tabela.
- No painel
Explorer , clique no nome do projeto. - Ao lado do conjunto de dados babynames, clique em Mais ações e selecione Abrir.
- No painel de detalhes, clique em
A menos que indicado de outra forma, use os valores padrão para todas as configurações.
Criar
tabela. - Na página Criar tabela, faça o seguinte:
- Na seção Origem, selecione Fazer upload em
Criar tabela na lista. - No campo Selecionar arquivo, clique em Procurar.
- Navegue até o arquivo
yob2014.txt
local e clique em Abrir. - Na lista
Formato do arquivo , selecione CSV - Na seção Destino, insira
names_2014
emNome da tabela . - Na seção Esquema, clique no botão de alternância
Editar como texto e cole a seguinte definição de esquema no campo de texto: Clique em
Criar tabela .Aguarde o BigQuery criar a tabela e carregar os dados. Quando o BigQuery terminar de carregar os dados, expanda os painéis
Histórico pessoal e Histórico do projeto para revisar os detalhes do job.
name:string,assigned_sex_at_birth:string,count:integer
Visualizar dados da tabela
Para visualizar os dados da tabela, siga estas etapas:
- No painel
Explorer , expanda o projeto e o conjunto de dadosbabynames
e selecione a tabelanames_2014
. - No painel de detalhes, clique em
Visualizar . O BigQuery mostra as primeiras linhas da tabela.
Consultar os dados da tabela
Em seguida, consulte a tabela. O processo é idêntico ao exemplo anterior, mas desta vez as consultas são feitas na sua tabela, e não em uma tabela pública.
- Clique em Escrever nova consulta. Uma nova guia Editor será aberta.
- Na
guia Editor , cole a consulta a seguir. Essa consulta retorna os cinco nomes mais comuns de bebês nos EUA que foram designados como homens no nascimento em 2014.
SELECT name, count FROM `babynames.names_2014` WHERE assigned_sex_at_birth = 'M' ORDER BY count DESC LIMIT 5;
- Clique em
Executar . Os resultados são exibidos na seção Resultados da consulta.
Você consultou uma tabela em um conjunto de dados público e depois carregou os dados de amostra no BigQuery usando o Console do Cloud.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
- No console do Google Cloud, abra a página do BigQuery. Acessar o BigQuery
- No painel Explorer, clique no conjunto de dados
babynames
que você criou. - Expanda a opção Ver ações e clique em Excluir.
- Na caixa de diálogo Excluir conjunto de dados, confirme o comando de exclusão: digite a palavra
delete
e clique em Excluir.
A seguir
- Para saber mais, consulte Como usar o console do Google Cloud.
- Saiba mais como carregar dados no BigQuery em Introdução ao carregamento de dados.
- Saiba mais como consultar dados em Visão geral de consultas de dados do BigQuery.
- Para saber como carregar um arquivo JSON com dados aninhados e repetidos, consulte Como carregar dados JSON aninhados e repetidos.
- Saiba mais sobre como acessar o BigQuery de maneira programática na referência da API REST ou na página Bibliotecas de cliente do BigQuery.