Locais de conjuntos de dados

Nesta página, explicamos o conceito de local de dados e os locais diferentes em que é possível criar conjuntos de dados. Para saber como definir o local para o conjunto de dados, consulte Criar e usar conjuntos de dados.

Principais conceitos

Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Depois que você cria o conjunto de dados, o local não pode ser alterado.

Existem dois tipos de locais:

  • Um local regional é um lugar geográfico específico, como Tóquio. Para mais informações, consulte Recursos regionais na página "Geografia e regiões".

  • Um local multirregional é uma área geográfica grande, como os Estados Unidos, que contém pelo menos dois lugares geográficos. Para mais informações, consulte Recursos multirregionais na página "Geografia e regiões".

O BigQuery armazena os dados no local selecionado de acordo com os Termos específicos de serviço.

Locais regionais

Nome da região Descrição da região
Ásia
asia-northeast1 Tóquio

Locais multirregionais

Nome multirregional Descrição multirregional
EU União Europeia
US Estados Unidos

Atualmente, não é possível selecionar uma região individual nos EUA ou na UE.

Como especificar o local

Se os dados estiverem em um local que não seja US ou EU multirregional, você precisará especificar o local ao realizar ações como carregar, consultar e exportar dados.

Para especificar o local:

  • Ao consultar dados usando a IU da Web do BigQuery, clique em Mostrar opções e, em Local de processamento, clique em Não especificado e escolha o local dos dados. É possível deixar o local de processamento definido como não especificado, caso os dados estejam no local multirregional US ou EU. Quando os dados estão em US ou EU, o local de processamento é detectado automaticamente.
  • Ao usar a ferramenta de linha de comando, forneça a sinalização global --location e defina o valor para seu local.
  • Ao usar a API, especifique a região na propriedade location na seção jobReference do recurso do job.

Considerações sobre o local

Ao escolher um local para os dados, pense nas seguintes opções:
  • Colocar seu conjunto de dados do BigQuery e sua fonte de dados externa.
    • Quando você consulta dados em uma fonte de dados externa, como o Cloud Storage, os dados que está consultando precisam estar no mesmo local que o conjunto de dados do BigQuery. Por exemplo, se o conjunto de dados do BigQuery estiver no local multirregional da UE, o intervalo do Cloud Storage que contém os dados que você está consultando precisa estar em um intervalo multirregional na UE. Se seu conjunto de dados estiver no local multirregional dos EUA, seu intervalo do Cloud Storage precisará estar em um intervalo multirregional nos EUA.
    • Se seu conjunto de dados estiver em um local regional, o intervalo do Cloud Storage que contém os dados que você está consultando precisará estar em um intervalo regional no mesmo local. Por exemplo, se seu conjunto de dados estiver na região de Tóquio, seu intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Se seu conjunto de dados externo estiver no Cloud Bigtable, seu conjunto de dados precisará estar nos EUA ou no local multirregional da UE. Seus dados do Cloud Bigtable precisam estar em um dos locais compatíveis com o Cloud Bigtable.
    • As considerações de localização não se aplicam às fontes de dados externas do Google Drive.
  • Colocar os intervalos do Cloud Storage para carregamento de dados.
    • Se o conjunto de dados do BigQuery estiver em um local multirregional, o intervalo do Cloud Storage que contém os dados que você está carregando precisará estar em um intervalo regional ou multirregional no mesmo local. Por exemplo, se o conjunto de dados do BigQuery estiver na UE, o intervalo do Cloud Storage precisa estar em um intervalo regional ou multirregional na UE.
    • Se seu conjunto de dados estiver em um local regional, seu intervalo do Cloud Storage precisará ser um intervalo regional no mesmo local. Por exemplo, se seu conjunto de dados estiver na região de Tóquio, seu intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Exceção: se seu conjunto de dados estiver no local multirregional dos EUA, será possível carregar dados de um intervalo do Cloud Storage em qualquer local regional ou multirregional.
  • Colocar os intervalos do Cloud Storage para exportação de dados
    • Ao exportar dados, o intervalo do Cloud Storage regional ou multirregional precisa estar no mesmo local que o conjunto de dados do BigQuery. Por exemplo, se o conjunto de dados do BigQuery estiver no local multirregional da UE, o intervalo do Cloud Storage que contém os dados que você está exportando precisará estar em um local regional ou multirregional na UE.
    • Se seu conjunto de dados estiver em um local regional, seu intervalo do Cloud Storage precisará ser um intervalo regional no mesmo local. Por exemplo, se seu conjunto de dados estiver na região de Tóquio, seu intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Exceção: se seu conjunto de dados estiver no local multirregional dos EUA, será possível exportar dados para um intervalo do Cloud Storage em qualquer local regional ou multirregional.
  • Desenvolver um plano de gerenciamento de dados.
    • Se escolher um recurso de armazenamento regional, como um conjunto de dados do BigQuery ou um intervalo do Cloud Storage, será necessário desenvolver um plano para gerenciar geograficamente seus dados.
Para mais informações sobre locais do Cloud Storage, consulte Locais de intervalos na documentação do Cloud Storage.

Como mover dados do BigQuery entre locais

Não é possível alterar o local de um conjunto de dados depois que ele foi criado. Além disso, não é possível mover um conjunto de dados de um local para outro. Se precisar mover um conjunto de dados de um local para outro, siga este processo:

  1. Exporte os dados de suas tabelas do BigQuery para um intervalo do Cloud Storage regional ou multirregional no mesmo local que seu conjunto de dados. Por exemplo, se seu conjunto de dados estiver no local multirregional da UE, exporte seus dados para um intervalo regional ou multirregional na UE.

    Não há cobranças pela exportação de dados do BigQuery, mas são cobradas taxas pelo armazenamento dos dados exportados no Cloud Storage. As exportações do BigQuery estão sujeitas aos limites de jobs de exportação.

  2. Copie ou mova os dados do seu intervalo do Cloud Storage para um intervalo regional ou multirregional no novo local. Por exemplo, se estiver movendo seus dados do local multirregional dos EUA para o local regional de Tóquio, será necessário transferir os dados para um intervalo regional em Tóquio. Para mais informações sobre como transferir objetos do Cloud Storage, consulte Como renomear, copiar e mover objetos na documentação do Cloud Storage.

    Observe que a transferência de dados entre regiões gera cobranças de saída de rede no Cloud Storage.

  3. Depois de transferir os dados para um intervalo do Cloud Storage no novo local, crie um novo conjunto de dados do BigQuery (no novo local). Em seguida, carregue seus dados do intervalo do Cloud Storage para o BigQuery.

    Não há cobrança pelo carregamento dos dados no BigQuery, mas haverá despesas para armazenar os dados no Cloud Storage até que os dados ou o intervalo sejam excluídos. Também há cobrança pelo armazenamento de dados no BigQuery depois que eles forem carregados. O carregamento de dados no BigQuery está sujeito às limitações de jobs de carregamento:

Para mais informações sobre como usar o Cloud Storage para armazenar e mover grandes conjuntos de dados, consulte Como usar o Google Cloud Storage com Big Data.

Próximas etapas

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Precisa de ajuda? Acesse nossa página de suporte.