Locais de conjuntos de dados

Nesta página, explicamos o conceito de local de dados e os locais diferentes em que é possível criar conjuntos de dados. Para saber como definir o local de um conjunto de dados, consulte Como criar conjuntos de dados.

Para ver mais informações sobre preços regionais do BigQuery, consulte a página Preços.

Principais conceitos

Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Depois que você cria o conjunto de dados, o local não pode ser alterado.

Existem dois tipos de locais:

  • Um local regional é um lugar geográfico específico, como Tóquio. Para mais informações, consulte Recursos regionais na página "Geografia e regiões".

  • Um local multirregional é uma área geográfica grande, como os Estados Unidos, que contém pelo menos dois lugares geográficos. Para mais informações, consulte Recursos multirregionais na página "Geografia e regiões".

O BigQuery armazena os dados no local selecionado de acordo com os Termos Específicos de Serviço (em inglês).

Locais regionais

Nome da região Descrição da região
Américas
us-west2 Los Angeles
northamerica-northeast1 Montreal
us-east4 Virgínia do Norte
southamerica-east1 São Paulo
Europa
europe-north1 Finlândia
europe-west2 Londres
europe-west6 Zurique
Ásia-Pacífico
asia-east2 Hong Kong
asia-south1 Mumbai
asia-northeast2 Osaka
asia-east1 Taiwan
asia-northeast1 Tóquio
asia-southeast1 Polônia
australia-southeast1 Sydney

Locais multirregionais

Nome multirregional Descrição multirregional
EU União Europeia1
US Ucrânia

1 Os dados localizados na multirregião EU não são armazenados nos data centers europe-west2 (Londres) ou europe-west6 (Zurique).

Como especificar o local

Ao carregar, consultar ou exportar dados, o BigQuery determina o local para executar o job com base nos conjuntos de dados mencionados na solicitação. Por exemplo, se uma consulta fizer referência a uma tabela em um conjunto de dados armazenado na região asia-northeast1, o trabalho de consulta será executado nessa região. Se uma consulta não fizer referência a tabelas ou a outros recursos contidos em conjuntos de dados e nenhuma tabela de destino for fornecida, o job de consulta será executado no local da reserva de taxa fixa do projeto. Se o projeto não tiver uma reserva de taxa fixa, o trabalho será executado na região US. Se mais de uma reserva de taxa fixa estiver associada ao projeto, o job será executado no local da reserva com o maior número de slots.

Para especificar o local em que um job deverá ser executado, faça o seguinte:

  • Quando consultar dados usando o Console do GCP, clique em Mais> Configurações de consulta e, em Localização de processamento, clique em Seleção automática e escolha o local dos seus dados.
  • Ao consultar dados usando a IU da Web do BigQuery, clique em Mostrar opções e, em Local de processamento, clique em Não especificado e selecione o local dos dados.
  • Ao usar a ferramenta de linha de comando, forneça a --location como sinalização global e defina o valor para seu local.
  • Ao usar a API, especifique sua região na propriedade location na seção jobReference do recurso do job.

O BigQuery retorna um erro quando o local especificado não corresponde ao local dos conjuntos de dados na solicitação.

Considerações sobre local

Ao escolher um local para os dados, pense nas seguintes opções:

  • Colocar seu conjunto de dados do BigQuery e sua fonte de dados externa.
    • Quando você consulta dados em uma fonte de dados externa, como o Cloud Storage, os dados que está consultando precisam estar no mesmo local que o conjunto de dados do BigQuery. Por exemplo, se o conjunto de dados do BigQuery estiver no local multirregional da UE, o intervalo do Cloud Storage que contém os dados que você está consultando precisará estar em um intervalo multirregional na UE. Se o conjunto de dados estiver no local multirregional dos EUA, o intervalo do Cloud Storage precisará estar em um intervalo multirregional nos EUA.
    • Se o seu conjunto de dados estiver em um local regional, o intervalo do Cloud Storage que contém os dados que você está consultando precisará estar em um intervalo regional no mesmo local. Por exemplo, se o conjunto de dados estiver na região de Tóquio, o intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Se o conjunto de dados externo estiver no Cloud Bigtable, seu conjunto de dados precisará estar nos EUA ou no local multirregional da UE. Seus dados do Cloud Bigtable precisam estar em um dos locais compatíveis com o Cloud Bigtable.
    • As considerações de localização não se aplicam às fontes de dados externas do Google Drive.
  • Colocar os intervalos do Cloud Storage para carregamento de dados.
    • Se o conjunto de dados do BigQuery estiver em um local multirregional, o intervalo do Cloud Storage que contém os dados que você está carregando precisará estar em um intervalo regional ou multirregional no mesmo local. Por exemplo, se o conjunto de dados do BigQuery estiver na UE, o intervalo do Cloud Storage precisará estar em um intervalo regional ou multirregional na UE.
    • Se o conjunto de dados estiver em um local regional, seu intervalo do Cloud Storage precisará ser um intervalo regional no mesmo local. Por exemplo, se o conjunto de dados estiver na região de Tóquio, seu intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Exceção: se o seu conjunto de dados estiver no local multirregional dos EUA, será possível carregar dados de um intervalo do Cloud Storage em qualquer local regional ou multirregional.
  • Colocar os intervalos do Cloud Storage para exportação de dados.
    • Ao exportar dados, o intervalo regional ou multirregional do Cloud Storage precisa estar no mesmo local que o conjunto de dados do BigQuery. Por exemplo, se o conjunto de dados do BigQuery estiver no local multirregional da UE, o intervalo do Cloud Storage que contém os dados que você está exportando precisará estar em um local regional ou multirregional na UE.
    • Se o conjunto de dados estiver em um local regional, seu intervalo do Cloud Storage precisará ser um intervalo regional no mesmo local. Por exemplo, se o conjunto de dados estiver na região de Tóquio, seu intervalo do Cloud Storage precisará ser um intervalo regional em Tóquio.
    • Exceção: se o seu conjunto de dados estiver no local multirregional dos EUA, será possível exportar dados para um intervalo do Cloud Storage em qualquer local regional ou multirregional.
  • Desenvolver um plano de gerenciamento de dados.
    • Se você escolher um recurso de armazenamento regional, como um conjunto de dados do BigQuery ou um intervalo do Cloud Storage, será necessário desenvolver um plano para gerenciar geograficamente seus dados.

Para saber mais informações sobre locais do Cloud Storage, consulte Locais de intervalos na documentação do Cloud Storage.

Como mover dados do BigQuery entre locais

Não é possível alterar o local de um conjunto de dados depois que ele foi criado. Além disso, não é possível mover um conjunto de dados de um local para outro. Se precisar mover um conjunto de dados de um local para outro, siga este processo:

  1. Exporte os dados de suas tabelas do BigQuery para um intervalo regional ou multirregional do Cloud Storage no mesmo local que seu conjunto de dados. Por exemplo, se o conjunto de dados estiver no local multirregional da UE, exporte os dados para um intervalo regional ou multirregional na UE.

    Não há cobranças pela exportação de dados do BigQuery, mas são cobradas taxas pelo armazenamento dos dados exportados no Cloud Storage. As exportações do BigQuery estão sujeitas aos limites de jobs de exportação.

  2. Copie ou mova os dados do seu intervalo do Cloud Storage para um intervalo regional ou multirregional no novo local. Por exemplo, se estiver movendo os dados do local multirregional dos EUA para o local regional de Tóquio, será necessário transferi-los para um intervalo regional em Tóquio. Para mais informações sobre como transferir objetos do Cloud Storage, consulte Como renomear, copiar e mover objetos na documentação do Cloud Storage.

    Observe que a transferência de dados entre regiões gera cobranças de saída de rede no Cloud Storage.

  3. Depois de transferir os dados para um intervalo do Cloud Storage no novo local, crie um novo conjunto de dados do BigQuery (no novo local). Em seguida, carregue seus dados do intervalo do Cloud Storage no BigQuery.

    Você não será cobrado pelo carregamento dos dados no BigQuery, mas haverá cobranças pelo armazenamento dos dados no Cloud Storage até que os dados ou o intervalo sejam excluídos. Também haverá cobrança pelo armazenamento de dados no BigQuery depois que eles forem carregados. O carregamento de dados no BigQuery está sujeito às limitações de jobs de carregamento:

Para mais informações sobre como usar o Cloud Storage para armazenar e mover grandes conjuntos de dados, consulte Como usar o Cloud Storage com Big Data.

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Precisa de ajuda? Acesse nossa página de suporte.