Vista geral do BigQuery

O BigQuery é uma plataforma de dados totalmente gerida e preparada para IA que ajuda a gerir e analisar os seus dados com funcionalidades integradas, como aprendizagem automática, pesquisa, análise geoespacial e Business Intelligence. A arquitetura sem servidor do BigQuery permite-lhe usar linguagens como SQL e Python para responder às perguntas mais importantes da sua organização sem precisar de qualquer gestão de infraestruturas.

O BigQuery oferece uma forma uniforme de trabalhar com dados estruturados e não estruturados, e suporta formatos de tabelas abertos, como o Apache Iceberg, o Delta e o Hudi. O streaming do BigQuery suporta a ingestão contínua de dados e a análise, enquanto o motor de análise distribuída e escalável do BigQuery permite consultar terabytes em segundos e petabytes em minutos.

O BigQuery oferece capacidades de governação incorporadas que lhe permitem descobrir e organizar dados, bem como gerir metadados e a qualidade dos dados. Através de funcionalidades como a pesquisa semântica e a linhagem de dados, pode encontrar e validar dados relevantes para análise. Pode partilhar dados e recursos de IA na sua organização com as vantagens do controlo de acesso. Estas funcionalidades são baseadas no catálogo universal do Dataplex, que é uma solução de governação unificada e inteligente para dados e recursos de IA no Google Cloud.

A arquitetura do BigQuery consiste em duas partes: uma camada de armazenamento que carrega, armazena e otimiza dados, e uma camada de computação que oferece capacidades de estatísticas. Estas camadas de computação e armazenamento funcionam de forma eficiente independente umas das outras graças à rede de petabits da Google que permite a comunicação necessária entre elas.

Normalmente, as bases de dados antigas têm de partilhar recursos entre operações de leitura e escrita e operações analíticas. Isto pode resultar em conflitos de recursos e pode tornar as consultas mais lentas enquanto os dados são escritos ou lidos do armazenamento. Os conjuntos de recursos partilhados podem ficar ainda mais sobrecarregados quando são necessários recursos para tarefas de gestão de bases de dados, como atribuir ou revogar autorizações. A separação das camadas de computação e armazenamento do BigQuery permite que cada camada aloque recursos dinamicamente sem afetar o desempenho nem a disponibilidade da outra.

A arquitetura do BigQuery separa os recursos com uma rede de petabits.

Este princípio de separação permite ao BigQuery inovar mais rapidamente porque as melhorias de armazenamento e computação podem ser implementadas de forma independente, sem tempo de inatividade nem impacto negativo no desempenho do sistema. Também é essencial para oferecer um armazém de dados sem servidor totalmente gerido no qual a equipa de engenharia do BigQuery trata das atualizações e da manutenção. O resultado é que não precisa de aprovisionar nem dimensionar manualmente os recursos, o que lhe permite concentrar-se na oferta de valor em vez das tarefas tradicionais de gestão de bases de dados.

As interfaces do BigQuery incluem a Google Cloud interface da consola e a ferramenta de linha de comandos do BigQuery. Os programadores e os cientistas de dados podem usar bibliotecas cliente com programação familiar, incluindo Python, Java, JavaScript e Go, bem como a API REST e a API RPC do BigQuery para transformar e gerir dados. Os controladores ODBC e JDBC permitem a interação com aplicações existentes, incluindo ferramentas e utilitários de terceiros.

Enquanto analista de dados, engenheiro de dados, administrador de armazém de dados ou cientista de dados, o BigQuery ajuda a carregar, processar e analisar dados para fundamentar decisões empresariais críticas.

Comece a usar o BigQuery

Pode começar a explorar o BigQuery em minutos. Aproveite o nível de utilização gratuito ou o sandbox sem custo financeiro do BigQuery para começar a carregar e consultar dados.

  1. Sandbox do BigQuery: comece a usar o sandbox do BigQuery sem riscos e sem custos.
  2. Google Cloud Início rápido da consola: Familiarize-se com o poder do BigQuery Studio.
  3. Conjuntos de dados públicos: experimente o desempenho do BigQuery explorando dados reais de grande dimensão do Public Datasets Program.

Explore o BigQuery

A infraestrutura sem servidor do BigQuery permite-lhe focar-se nos seus dados em vez da gestão de recursos. O BigQuery combina um armazém de dados baseado na nuvem e ferramentas de análise avançadas.

Armazenamento do BigQuery

O BigQuery armazena dados através de um formato de armazenamento em colunas otimizado para consultas analíticas. O BigQuery apresenta os dados em tabelas, linhas e colunas, e oferece suporte total para a semântica de transações de bases de dados (ACID). O armazenamento do BigQuery é replicado automaticamente em várias localizações para oferecer uma elevada disponibilidade.

Para mais informações, consulte o artigo Vista geral do armazenamento do BigQuery.

Análise do BigQuery

As utilizações da análise descritiva e prescritiva incluem Business Intelligence, análise ad hoc, análise geoespacial e aprendizagem automática. Pode consultar dados armazenados no BigQuery ou executar consultas em dados onde residem através de tabelas externas ou consultas federadas, incluindo o Cloud Storage, o Bigtable, o Spanner ou o Google Sheets armazenados no Google Drive.

  • Consultas SQL padrão ANSI (suporte de SQL:2011) incluindo suporte para junções, campos aninhados e repetidos, funções analíticas e de agregação, consultas com várias declarações e uma variedade de funções espaciais com estatísticas geoespaciais – Sistemas de Informação Geográfica.
  • Crie vistas para partilhar a sua análise.
  • Suporte de ferramentas de Business Intelligence, incluindo o Google Sheets e ferramentas de terceiros, como o Tableau e o Power BI. BI Engine com Looker Studio, Looker, Google Sheets, e ferramentas de terceiros, como o Tableau e o Power BI.
  • O BigQuery ML oferece aprendizagem automática e estatísticas preditivas.
  • O BigQuery Studio oferece funcionalidades como blocos de notas Python e controlo de versões para blocos de notas e consultas guardadas. Estas funcionalidades facilitam a conclusão dos seus fluxos de trabalho de análise de dados e aprendizagem automática (AA) no BigQuery.
  • Consultar dados fora do BigQuery com consultas federadas e tabelas externas.

Para mais informações, consulte o artigo Vista geral da análise do BigQuery.

Administração do BigQuery

O BigQuery oferece uma gestão centralizada dos recursos de dados e computação, enquanto a gestão de identidades e acessos (IAM) ajuda a proteger esses recursos com o modelo de acesso usado em todo o Google Cloud. As Google Cloud práticas recomendadas de segurança oferecem uma abordagem sólida, mas flexível, que pode incluir segurança de perímetro ou uma abordagem de defesa em profundidade mais complexa e detalhada.

  • Introdução à segurança e à administração de dados ajuda a compreender a administração de dados e os controlos de que pode precisar para proteger os recursos do BigQuery.
  • As tarefas são ações que o BigQuery executa em seu nome para carregar, exportar, consultar ou copiar dados.
  • As reservas permitem-lhe alternar entre preços a pedido e preços baseados na capacidade.

Para mais informações, consulte o artigo Introdução à administração do BigQuery.

Recursos do BigQuery

Explore os recursos do BigQuery:

APIs, ferramentas e referências

Materiais de referência para programadores e analistas do BigQuery:

Funcionalidades do Gemini no BigQuery

O Gemini no BigQuery faz parte da suite de produtos Gemini para Google Cloud, que oferece assistência com tecnologia de IA para ajudar a trabalhar com os seus dados.

O Gemini no BigQuery oferece assistência de IA para ajudar a fazer o seguinte:

Para saber como configurar o Gemini no BigQuery, consulte o artigo Configure o Gemini no BigQuery.

Funções e recursos do BigQuery

O BigQuery satisfaz as necessidades dos profissionais de dados nas seguintes funções e responsabilidades.

Analista de dados

Orientação de tarefas para ajudar se precisar de fazer o seguinte:

Para fazer uma visita guiada às funcionalidades de estatísticas de dados do BigQuery diretamente na Google Cloud consola, clique em Fazer visita guiada.

Fazer a visita guiada

Administrador de dados

Orientação de tarefas para ajudar se precisar de fazer o seguinte:

Para mais informações, consulte a Introdução à administração do BigQuery.

Para fazer uma visita guiada às funcionalidades de administração de dados do BigQuery diretamente na Google Cloud consola, clique em Fazer visita guiada.

Fazer a visita guiada

Cientista de dados

Orientações de tarefas para ajudar se precisar de usar a aprendizagem automática do BigQuery ML para fazer o seguinte:

Programador de dados

Orientação de tarefas para ajudar se precisar de fazer o seguinte:

Tutoriais em vídeo do BigQuery

A seguinte série de tutoriais em vídeo ajuda a começar a usar o BigQuery:

Título

Descrição

Como começar a usar o BigQuery (17:18) Uma vista geral que resume o que é o BigQuery e como o usar. Os segmentos incluem: pipelines de ETL, preços e otimização, BigQuery ML e BI Engine, e terminam com uma demonstração do BigQuery na Google Cloud consola.
O que é o BigQuery? (4:39) Uma vista geral do BigQuery que explica como o BigQuery foi concebido para carregar e armazenar grandes quantidades de dados para ajudar os analistas e os programadores
Usar o sandbox do BigQuery (3:05) Como configurar um sandbox do BigQuery, que lhe permite executar consultas sem precisar de um cartão de crédito
Fazer perguntas e executar consultas (5:11) Como escrever e executar consultas SQL na IU do BigQuery, além de escolher um número de camisola vencedor
Carregar dados para o BigQuery (5:31) Como carregar e analisar dados em tempo real ou apenas uma análise de dados em lote única, além de gatos vs. cães
Visualizar resultados da consulta (5:38) Como a visualização de dados é útil para tornar os conjuntos de dados complexos mais fáceis de compreender e interiorizar
Gerir o acesso com o IAM (5:23) Como permitir que outros utilizadores consultem os seus conjuntos de dados no BigQuery com autorizações de IAM e controlo de acesso
Guardar e partilhar consultas (6:17) Como guardar e partilhar as suas consultas no BigQuery sem problemas
Proteger dados confidenciais com vistas autorizadas (7:12) Como partilhar conjuntos de dados com diferentes utilizadores através da definição de controlos de acesso personalizados
Consultar dados externos com o BigQuery (5:49) Como configurar uma origem de dados externa no BigQuery e consultar dados do Cloud Storage, Cloud SQL, Google Drive e muito mais
O que são funções definidas pelo utilizador? (4:59) Como criar funções definidas pelo utilizador (UDFs) para analisar conjuntos de dados no BigQuery

O que se segue?