Introdução aos conjuntos de dados
Nesta página, você encontra uma visão geral dos conjuntos de dados no BigQuery.
Conjuntos de dados
Um conjunto de dados fica contido em um projeto específico. Os conjuntos de dados
são contêineres de nível superior usados na organização e no controle de acesso a suas
tabelas e visualizações. É obrigatório
que uma tabela ou visualização pertença a um conjunto de dados, então
crie pelo menos um desses conjuntos antes de
carregar dados no BigQuery.
Use o formato projectname.datasetname
para qualificar totalmente um nome de conjunto de dados ao
usar o GoogleSQL ou o formato projectname:datasetname
para qualificar totalmente
um nome de conjunto de dados ao usar a ferramenta de linha de comando bq
.
Local do conjunto de dados
Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Para ver uma lista de locais de conjuntos de dados do BigQuery, consulte Locais do BigQuery. Depois de criar o conjunto de dados, o local não pode ser alterado. No entanto, é possível copiar conjuntos de dados para diferentes locais ou mover (recriar) manualmente um conjunto de dados em um outro local.
O BigQuery processa consultas no mesmo local em que o conjunto de dados que contém as tabelas que você está consultando. O BigQuery armazena os dados no local selecionado de acordo com os Termos de serviço específicos.
Limitações do conjunto de dados
Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:
- O local do conjunto de dados só pode ser definido no momento da criação. Depois que um conjunto de dados é criado, o local não pode ser alterado.
Todas as tabelas referenciadas em uma consulta precisam ser armazenadas em conjuntos de dados no mesmo local.
Ao copiar uma tabela, os conjuntos de dados que contêm as tabelas de origem e de destino precisam estar no mesmo local.
Os conjuntos de dados de cada projeto devem ter nomes exclusivos.
Cotas de conjunto de dados
Para mais informações sobre cotas e limites de conjuntos de dados, consulte Cotas e limites.
Modelos de faturamento de armazenamento de conjuntos de dados
Quando você cria um conjunto de dados, o uso do armazenamento por esse conjunto de dados é cobrado de você usando bytes lógicos como a unidade padrão de consumo. No entanto, ao criar um conjunto de dados usando SQL ou a API BigQuery, é possível usar bytes físicos para o faturamento. Também é possível alterar o modelo de faturamento de armazenamento de um conjunto de dados existente para usar bytes físicos.
Depois de alterar o modelo de faturamento de armazenamento de um conjunto de dados para usar bytes físicos, não é possível reverter para usar bytes lógicos novamente.
Ao configurar o modelo de faturamento de armazenamento para usar bytes físicos, os custos totais de armazenamento são cobrados, incluindo os bytes usados para armazenamento de viagem no tempo. Você pode configurar a janela de tempo no deslocamento para equilibrar os custos de armazenamento com as necessidades de retenção de dados. Para mais informações sobre como prever os custos de armazenamento, consulte Previsão do faturamento do armazenamento.
Critérios de qualificação:
O modelo de faturamento de armazenamento físico só estará disponível para os conjuntos de dados se a organização não tiver nenhum compromisso ativo de slot fixo. Não será possível registrar conjuntos de dados para o faturamento de armazenamento físico até que todos os compromissos de taxa fixa da sua organização não estejam mais ativos.
Preço do conjunto de dados
Você não é cobrado por criar, atualizar ou excluir um conjunto de dados.
Para mais informações sobre os preços do BigQuery, consulte Preços.
Segurança do conjunto de dados
Para controlar o acesso a conjuntos de dados no BigQuery, consulte Como controlar o acesso a conjuntos de dados. Para saber mais sobre criptografia de dados, consulte Criptografia em repouso.
Próximas etapas
- Para mais informações sobre a criação de conjuntos de dados, consulte esta página.
- Para mais informações sobre como atribuir controles de acesso a conjuntos de dados, consulte Como controlar o acesso a conjuntos de dados.