Introdução aos conjuntos de dados
Esta página oferece uma vista geral dos conjuntos de dados no BigQuery.
Conjuntos de dados
Um conjunto de dados está contido num projeto específico. Os conjuntos de dados são contentores de nível superior usados para organizar e controlar o acesso às suas tabelas e vistas. Uma tabela ou uma vista tem de pertencer a um conjunto de dados, pelo que tem de criar, pelo menos, um conjunto de dados antes de carregar dados para o BigQuery.
Use o formato projectname.datasetname
para qualificar totalmente um nome de conjunto de dados quando usar o GoogleSQL ou o formato projectname:datasetname
para qualificar totalmente um nome de conjunto de dados quando usar a ferramenta de linha de comandos bq.
Localização
Especifica uma localização para armazenar os seus dados do BigQuery quando cria um conjunto de dados. Para ver uma lista das localizações dos conjuntos de dados do BigQuery, consulte o artigo Localizações do BigQuery. Após a criação do conjunto de dados, não é possível alterar a localização. No entanto, pode copiar conjuntos de dados para localizações diferentes ou mover (recriar) manualmente o conjunto de dados para uma localização diferente.
O BigQuery processa consultas na mesma localização que o conjunto de dados que contém as tabelas que está a consultar. O BigQuery armazena os seus dados na localização selecionada de acordo com os Termos Específicos do Serviço.
Retenção de dados
Os conjuntos de dados usam a viagem no tempo em conjunto com o período de segurança para reter dados eliminados e modificados durante um curto período, caso precise de os recuperar. Para mais informações, consulte o artigo Retenção de dados com viagem no tempo e à prova de falhas.
Modelos de faturação de armazenamento
Pode receber faturação pelo armazenamento de dados do BigQuery em bytes lógicos ou físicos (comprimidos) ou uma combinação de ambos. O modelo de faturação de armazenamento que escolher determina os seus preços de armazenamento. O modelo de faturação de armazenamento que escolhe não afeta o desempenho do BigQuery. Qualquer que seja o modelo de faturação que escolher, os seus dados são armazenados como bytes físicos.
Define o modelo de faturação de armazenamento ao nível do conjunto de dados. Se não especificar um modelo de faturação de armazenamento quando cria um conjunto de dados, este usa por predefinição a faturação de armazenamento lógico. No entanto, pode alterar o modelo de faturação de armazenamento de um conjunto de dados depois de o criar. Se alterar o modelo de faturação do armazenamento de um conjunto de dados, tem de aguardar 14 dias antes de poder alterar novamente o modelo de faturação do armazenamento.
Quando altera o modelo de faturação de um conjunto de dados, a alteração demora 24 horas a entrar em vigor. As tabelas ou as partições de tabelas no armazenamento a longo prazo não são repostas para o armazenamento ativo quando altera o modelo de faturação de um conjunto de dados. O desempenho e a latência das consultas não são afetados pela alteração do modelo de faturação de um conjunto de dados.
Os conjuntos de dados usam a viagem no tempo e o armazenamento à prova de falhas para a retenção de dados. A viagem no tempo e o armazenamento à prova de falhas são cobrados separadamente às taxas de armazenamento ativo quando usa a faturação de armazenamento físico, mas estão incluídos na taxa base que lhe é cobrada quando usa a faturação de armazenamento lógico. Pode modificar o período de deslocação no tempo que usa para um conjunto de dados de forma a equilibrar os custos de armazenamento físico com a retenção de dados. Não pode modificar o período de segurança. Para mais informações acerca da retenção de dados do conjunto de dados, consulte Retenção de dados com a funcionalidade de viagem no tempo e à prova de falhas. Para mais informações sobre a previsão dos custos de armazenamento, consulte o artigo Preveja a faturação do armazenamento.
Não pode inscrever um conjunto de dados na faturação de armazenamento físico se a sua organização tiver compromissos de slots de taxa fixa antigos localizados na mesma região que o conjunto de dados. Isto não se aplica a compromissos comprados com uma edição do BigQuery.
Conjuntos de dados externos
Além dos conjuntos de dados do BigQuery, pode criar conjuntos de dados externos, que são links para origens de dados externas:
Os conjuntos de dados externos também são conhecidos como conjuntos de dados federados. Ambos os termos são usados de forma intercambiável.
Depois de criados, os conjuntos de dados externos contêm tabelas de uma origem de dados externa referenciada. Os dados destas tabelas não são copiados para o BigQuery, mas são consultados sempre que são usados. Para mais informações, consulte o artigo Consultas federadas do Spanner.
Limitações
Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:
- A localização do conjunto de dados só pode ser definida no momento da criação. Depois de criar um conjunto de dados, não é possível alterar a respetiva localização.
- Todas as tabelas referenciadas numa consulta têm de ser armazenadas em conjuntos de dados na mesma localização.
Os conjuntos de dados externos não suportam a expiração de tabelas, as réplicas, a viagem no tempo, a ordenação predefinida, o modo de arredondamento predefinido nem a opção para ativar ou desativar nomes de tabelas não sensíveis a maiúsculas e minúsculas.
Quando copia uma tabela, os conjuntos de dados que contêm a tabela de origem e a tabela de destino têm de estar na mesma localização.
Os nomes dos conjuntos de dados têm de ser exclusivos para cada projeto.
Se alterar o modelo de faturação de armazenamento de um conjunto de dados, tem de aguardar 14 dias antes de poder alterar novamente o modelo de faturação de armazenamento.
Não pode inscrever um conjunto de dados na faturação de armazenamento físico se tiver quaisquer compromissos de slots de taxa fixaantigos existentes na mesma região que o conjunto de dados.
Quotas
Para mais informações sobre quotas e limites de conjuntos de dados, consulte o artigo Quotas e limites.
Preços
Não lhe é cobrado nenhum valor pela criação, atualização ou eliminação de um conjunto de dados.
Para mais informações sobre os preços do BigQuery, consulte a secção Preços.
Segurança
Para controlar o acesso a conjuntos de dados no BigQuery, consulte o artigo Controlar o acesso a conjuntos de dados. Para obter informações sobre a encriptação de dados, consulte o artigo Encriptação em repouso.
O que se segue?
- Para mais informações sobre como criar conjuntos de dados, consulte o artigo Criar conjuntos de dados.
- Para mais informações sobre a atribuição de controlos de acesso a conjuntos de dados, consulte o artigo Controlar o acesso a conjuntos de dados.