Conexão padrão do BigQuery para o Looker (núcleo do Google Cloud)

O Looker (Google Cloud Core) precisa estar conectado a um banco de dados para permitir a análise de dados. É possível criar uma conexão padrão com um banco de dados SQL padrão do BigQuery usando a conexão de início rápido do BigQuery.

Bloco "BigQuery QuickStart" em uma página inicial.

Antes de começar

A configuração de uma conexão do BigQuery QuickStart requer as seguintes permissões.

Permissões do Looker

Você pode visualizar e editar a página Conexão do BigQuery QuickStart na página Início da sua instância do Looker (núcleo do Google Cloud) se tiver uma das seguintes permissões do Looker:

Permissões do IAM

As instâncias do Looker (núcleo do Google Cloud) podem usar Application Default Credentials (ADC) para autenticação ao configurar uma conexão com o BigQuery. Quando você usa o ADC, a conexão é autenticada no banco de dados usando as credenciais da conta de serviço do Looker (núcleo do Google Cloud). A conta de serviço precisa ter as seguintes permissões do IAM para acessar o conjunto de dados do BigQuery:

Se a conta de serviço do Looker (núcleo do Google Cloud) ainda não tiver os papéis do IAM necessários, use o endereço de e-mail da conta de serviço ao conceder papéis nesse projeto. Para encontrar o endereço de e-mail da conta de serviço, acesse a página IAM no console do Google Cloud e marque a caixa de seleção Incluir concessões de função fornecidas pelo Google. O e-mail terá o formato service-<project number>@gcp-sa-looker.iam.gserviceaccount.com. Use esse e-mail para conceder os papéis adequados à conta de serviço.

Como configurar uma conexão de início rápido do BigQuery

A conexão do BigQuery Quickstart pode ser visualizada e editada por usuários com as permissões corretas na página Início ou Conexões no painel Administrador. Na página Conexões, a conexão do BigQuery QuickStart aparece com o nome Conexão padrão do BigQuery. Em uma nova instância, os campos ID do projeto de armazenamento e ID do projeto de faturamento vão ter o valor padrão Nenhum.

Na página Início, clique no botão Analisar conexão para gerenciar a conexão. Para dispensar o bloco da página Início, clique no x ou ative a opção BigQuery Quick Start na barra lateral Discover.

A conexão de início rápido do BigQuery contém as seguintes seções:

ID do projeto de faturamento

O ID do projeto serve como um identificador exclusivo para o projeto de faturamento Google Cloud . O projeto de faturamento é o Google Cloud projeto que recebe cobranças pelo uso do BigQuery, mas você ainda pode consultar conjuntos de dados em um projeto Google Cloud diferente se os desenvolvedores do LookML especificarem nomes de tabelas com escopo total no parâmetro sql_table_name das suas visualizações , Análises ou juntas do LookML. Este campo é obrigatório.

Para fazer a autenticação em um banco de dados do BigQuery usando o OAuth: para conexões do BigQuery, o Looker (Google Cloud Core) pode usar automaticamente as credenciais de aplicativo OAuth que o administrador do Looker (Google Cloud Core) usou ao criar a instância. Consulte a página Criar credenciais de autorização OAuth para uma instância do Looker (Google Cloud Core) para mais informações.

Abra a seção Detalhes do status para testar as configurações da conexão.

Conjunto de dados principal

A página Conjunto de dados principal contém as seguintes configurações.

ID do projeto de armazenamento

No campo ID do projeto do Storage, insira o ID do projeto que contém o conjunto de dados do BigQuery que você quer conectar, mesmo que seja o mesmo projeto que contém a instância do Looker (núcleo do Google Cloud). Este campo é obrigatório.

Conjunto de dados principal

O conjunto de dados principal é onde o BigQuery vai procurar tabelas se o local delas não estiver especificado no texto da consulta SQL. As consultas do Looker (Google Cloud core) podem se referir a tabelas em qualquer projeto ou conjunto de dados, desde que usem nomes de tabelas com escopo completo no formato project_id.dataset_name.table_name. A conta de serviço do Looker (núcleo do Google Cloud) também precisa das permissões do IAM adequadas para acessar as tabelas nesse local. Este campo é obrigatório.

Para saber mais sobre conjuntos de dados, consulte a página de documentação Como conectar o Looker ao BigQuery.

Abra a seção Detalhes do status para testar as configurações da conexão.

Configurações opcionais

A seção Configurações opcionais contém as seguintes opções:

  • Máximo de conexões por nó: o número máximo de conexões com o banco de dados permitidas ao mesmo tempo. Observação: essa configuração é para cada nó na implantação do Looker (núcleo do Google Cloud). O valor precisa estar entre 5 e 100 e pode ser deixado no valor padrão inicialmente. Leia mais sobre essa configuração na seção Conexões máximas por nó da página de documentação Como conectar o Looker ao seu banco de dados.

  • Tempo limite do pool de conexões: o número de segundos que uma consulta vai aguardar antes de atingir o tempo limite quando o pool de conexões estiver cheio. Pode ser deixado com o valor padrão inicialmente. Leia mais sobre essa configuração na seção Connection Pool Timeout da página de documentação Como conectar o Looker ao seu banco de dados.

  • Parâmetros JDBC adicionais: adicione outros parâmetros JDBC, como rótulos do BigQuery. Para mais informações, consulte a seção Rótulos de job e comentários de contexto para conexões do BigQuery.

  • Programação de manutenção: expressão Cron que indica a frequência máxima de verificações de gatilhos do grupo de dados e manutenção da TDP. Leia mais sobre essa configuração na documentação Programação de manutenção de grupos de dados e PDT.

  • SSL: escolha se você quer usar a criptografia SSL para proteger os dados que passam entre o Looker (núcleo do Google Cloud) e seu banco de dados. O SSL é apenas uma opção que pode ser usada para proteger seus dados. Outras opções seguras são descritas na página de documentação Ativar o acesso seguro ao banco de dados.

  • Verificar SSL: escolha se você quer exigir a verificação do certificado SSL usado pela conexão. Leia mais sobre essa configuração na seção Verificar SSL da página de documentação Como conectar o Looker ao seu banco de dados.

  • Pré-carregar tabelas e colunas: no SQL Runner, todas as informações da tabela são pré-carregadas assim que você seleciona uma conexão e um esquema. Isso permite que o SQL Runner mostre rapidamente as colunas da tabela assim que você clica no nome dela. No entanto, para conexões e esquemas com muitas tabelas ou com tabelas muito grandes, talvez você não queira que o SQL Runner pré-carregue todas as informações.

  • Buscar e armazenar em cache o esquema: para alguns recursos de gravação de SQL, como o Aggregate Awareness, o Looker (núcleo do Google Cloud) usa o esquema de informações do banco de dados para otimizar a gravação de SQL. Leia mais sobre essa configuração na seção Extrair esquema de informações para gravação de SQL da página de documentação Como conectar o Looker ao seu banco de dados.

  • Ativar TDPs: ative a opção Ativar TDPs para ativar as TDPs. Quando os PDTs estão ativados, a janela Optional settings mostra outros campos de PDT e a seção PDT Overrides.

  • Banco de dados temporário: insira o conjunto de dados no BigQuery, onde o Looker (núcleo do Google Cloud) vai criar tabelas derivadas persistentes. Configure esse conjunto de dados com antecedência, com as permissões de gravação adequadas. Este campo é obrigatório para usar PDTs.

  • Número máximo de conexões do builder da TDP: a configuração Número máximo de conexões do builder da TDP tem o padrão 1, mas pode ser definido até 10. No entanto, o valor não pode ser maior que o definido em Conexões máximas por nó. Leia mais sobre essa configuração na seção Número máximo de conexões do builder da TDP da página de documentação Como conectar o Looker ao banco de dados. Defina esse valor com cuidado. Se o valor for muito alto, seu banco de dados poderá ficar sobrecarregado. Se o valor for baixo, as PDTs de execução longa ou as tabelas agregadas podem atrasar a criação de outras tabelas persistentes ou diminuir a velocidade de outras consultas na conexão.

  • Repetir builds de TDP com falha: o botão Repetir builds de TDP com falha configura como o regerador do Looker (núcleo do Google Cloud) tenta recriar tabelas persistidas por gatilho que falharam no ciclo anterior do regenerador. Leia mais sobre essa configuração na seção Repetir builds de TDP com falha da página de documentação Como conectar o Looker ao seu banco de dados.

  • Controle da API de TDPs: o botão Controle da API de TDPs determina se as chamadas de API start_pdt_build, check_pdt_build e stop_pdt_build podem ser usadas para essa conexão. Quando o botão Controle de API de TDP estiver desativado, essas chamadas de API vão falhar quando referenciarem TDPs nessa conexão.

  • Substituições de PDT: se o banco de dados oferecer suporte a tabelas derivadas persistentes e você tiver ativado a opção Ativar PDTs nas configurações de conexão, o Looker (núcleo do Google Cloud) vai mostrar a seção Substituições de PDT. Na seção Substituições de TDP, é possível inserir parâmetros JDBC separados (host, porta, banco de dados, nome de usuário, senha, esquema, parâmetros adicionais e instruções pós-conexão) específicos para processos de TDP. Leia mais sobre essa configuração na seção Substituições de PDT da página de documentação Como conectar o Looker ao seu banco de dados.

  • Fuso horário do banco de dados: o fuso horário em que o banco de dados armazena informações baseadas em tempo. O Looker (núcleo do Google Cloud) precisa saber disso para converter os valores de tempo para os usuários, facilitando a compreensão e o uso de dados baseados em tempo. Consulte a página de documentação Como usar as configurações de fuso horário para mais informações.

  • Fuso horário da consulta: a opção Fuso horário da consulta só fica visível se você tiver desativado os Fusos horários específicos do usuário. Consulte a página de documentação Como usar as configurações de fuso horário para mais informações.

Abra a seção Detalhes do status para testar as configurações da conexão.

Revisão

Revise e modifique os detalhes de conexão que você inseriu nas seções anteriores na seção Revisão.

Abra a seção Detalhes do status para testar as configurações da conexão. Clique no ícone de edição ao lado de cada seção para voltar a ela e mudar as configurações.

Como salvar e testar a conexão

Para salvar as mudanças feitas na conexão de início rápido do BigQuery, clique em Salvar.

É possível testar as configurações de conexão em alguns lugares na interface do Looker (núcleo do Google Cloud):

  • Abra a seção Detalhes do status na parte de baixo de qualquer uma das páginas de conexão do QuickStart e clique em Testar conexão.
  • Na página Início, abra a seção Detalhes do status na parte de baixo do bloco "Conexão de início rápido" e clique em Testar conexão.
  • Na página de administrador Conexões, selecione o botão Testar ao lado da listagem da conexão, conforme descrito na página de documentação Conexões.

Depois de inserir as configurações de conexão, clique em Testar para verificar se as informações estão corretas e se o banco de dados pode se conectar.

Se a conexão não passar em um ou mais testes, confira estas opções de solução de problemas:

A seguir