Introdução aos conjuntos de dados

Nesta página, você encontra uma visão geral dos conjuntos de dados no BigQuery.

Conjuntos de dados

Um conjunto de dados fica contido em um projeto específico. Os conjuntos de dados são contêineres de nível superior usados na organização e no controle de acesso a suas tabelas e visualizações. É obrigatório que uma tabela ou visualização pertença a um conjunto de dados, então crie pelo menos um desses conjuntos antes de carregar dados no BigQuery. Use o formato projectname.datasetname para qualificar totalmente um nome de conjunto de dados ao usar o GoogleSQL ou o formato projectname:datasetname para qualificar totalmente um nome de conjunto de dados ao usar a ferramenta de linha de comando bq.

Local do conjunto de dados

Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Para ver uma lista de locais de conjuntos de dados do BigQuery, consulte Locais do BigQuery. Depois de criar o conjunto de dados, o local não pode ser alterado. No entanto, é possível copiar conjuntos de dados para diferentes locais ou mover (recriar) manualmente um conjunto de dados em um outro local.

O BigQuery processa consultas no mesmo local em que o conjunto de dados que contém as tabelas que você está consultando. O BigQuery armazena os dados no local selecionado de acordo com os Termos de serviço específicos.

Limitações do conjunto de dados

Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:

  • O local do conjunto de dados só pode ser definido no momento da criação. Depois que um conjunto de dados é criado, o local não pode ser alterado.
  • Todas as tabelas referenciadas em uma consulta precisam ser armazenadas em conjuntos de dados no mesmo local.

  • Ao copiar uma tabela, os conjuntos de dados que contêm as tabelas de origem e de destino precisam estar no mesmo local.

  • Os conjuntos de dados de cada projeto devem ter nomes exclusivos.

Cotas de conjunto de dados

Para mais informações sobre cotas e limites de conjuntos de dados, consulte Cotas e limites.

Modelos de faturamento de armazenamento de conjuntos de dados

Quando você cria um conjunto de dados, o uso do armazenamento por esse conjunto de dados é cobrado de você usando bytes lógicos como a unidade padrão de consumo. No entanto, ao criar um conjunto de dados usando SQL ou a API BigQuery, é possível usar bytes físicos para o faturamento. Também é possível alterar o modelo de faturamento de armazenamento de um conjunto de dados existente para usar bytes físicos.

Depois de alterar o modelo de faturamento de armazenamento de um conjunto de dados para usar bytes físicos, não é possível reverter para usar bytes lógicos novamente.

Ao configurar o modelo de faturamento de armazenamento para usar bytes físicos, os custos totais de armazenamento são cobrados, incluindo os bytes usados para armazenamento de viagem no tempo. Você pode configurar a janela de tempo no deslocamento para equilibrar os custos de armazenamento com as necessidades de retenção de dados. Para mais informações sobre como prever os custos de armazenamento, consulte Previsão do faturamento do armazenamento.

Critérios de qualificação:

O modelo de faturamento de armazenamento físico só estará disponível para os conjuntos de dados se a organização não tiver nenhum compromisso ativo de slot fixo. Não será possível registrar conjuntos de dados para o faturamento de armazenamento físico até que todos os compromissos de taxa fixa da sua organização não estejam mais ativos.

Preço do conjunto de dados

Você não é cobrado por criar, atualizar ou excluir um conjunto de dados.

Para mais informações sobre os preços do BigQuery, consulte Preços.

Segurança do conjunto de dados

Para controlar o acesso a conjuntos de dados no BigQuery, consulte Como controlar o acesso a conjuntos de dados. Para saber mais sobre criptografia de dados, consulte Criptografia em repouso.

Próximas etapas