Apache Spark

Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.

O Looker se conecta ao Apache Spark 3 ou mais recente por uma conexão JDBC ao servidor Spark Thrift.

Como criptografar o tráfego de rede

É recomendável criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Ativar o acesso seguro ao banco de dados.

Criar a conexão do Looker com seu banco de dados

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.

Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações. Confira a seguir algumas das configurações:

  • Nome: o nome da conexão. É assim que a conexão vai ser referenciada no modelo do LookML.
  • Dialecto: selecione Apache Spark 3+.
  • Host: o host do servidor Thrift.
  • Porta: a porta do servidor Thrift (10000 por padrão).
  • Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados for especificado para uma tabela, isso será presumido.
  • Nome de usuário: o usuário que o Looker vai autenticar.
  • Senha: a senha opcional do usuário do Looker.
  • Ativar TDPs: use essa opção para ativar as TDPs. Quando os TDPs estão ativados, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
  • Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado com antecedência, com uma instrução como CREATE SCHEMA looker_scratch;.
  • Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Hive aqui, como:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: deixe essa opção desmarcada.
  • Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Geralmente, ele pode ser deixado em branco ou definido como UTC.
  • Fuso horário da consulta: o fuso horário para mostrar dados consultados no Looker.

Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Teste de conectividade do banco de dados para informações sobre solução de problemas.

Para salvar essas configurações, clique em Conectar.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa oferecer suporte a eles.

Apache Spark 3 ou mais recente

O Apache Spark 3+ oferece suporte aos seguintes recursos a partir do Looker 25.0:

Recurso Compatível?
Nível de suporte
Compatível
Looker (Google Cloud Core)
Sim
Agregações simétricas
Sim
Tabelas derivadas
Sim
Tabelas derivadas SQL persistentes
Sim
Tabelas derivadas nativas nativas
Sim
Visualizações estáveis
Sim
Consulta de interrupção
Sim
Pivots baseados em SQL
Sim
Fusos horários
Sim
SSL
Sim
Subtotais
Sim
Parâmetros adicionais do JDBC
Sim
Diferenciar maiúsculas e minúsculas
Sim
Tipo de local
Sim
Tipo de lista
Sim
Percentil
Sim
Percentil distinto
Não
SQL Runner Show Processes
Não
Tabela de descrição do SQL Runner
Sim
Índices de exibição do SQL Runner
Não
SQL Runner Select 10
Sim
Contagem do SQL Runner
Sim
SQL Explain
Sim
Credenciais do OAuth
Não
Comentários de contexto
Sim
Pooling de conexão
Não
Esboços HLL
Não
Conscientização agregada
Sim
PDTs incrementais
Não
Milissegundos
Sim
Microssegundos
Sim
Visualizações materializadas
Não
Contagem aproximada de valores distintos
Não

Próximas etapas

Depois de criar a conexão, defina as opções de autenticação.