Apache Spark

Nesta página, você encontra informações sobre como conectar o Looker ao Apache Spark 3.

O Looker se conecta ao Apache Spark 3+ por uma conexão JDBC com o Spark Thrift Server.

Como criptografar o tráfego de rede

É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.

Como criar a conexão do Looker com seu banco de dados

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.

Preencher os detalhes de conexão. A maioria das configurações é comum à maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao banco de dados para mais informações. Algumas das configurações são descritas a seguir:

  • Nome: o nome da conexão. É assim que a conexão será referenciada no modelo LookML.
  • Dialeto: selecione Apache Spark 3+.
  • Host: é o host do servidor do Thrift.
  • Porta: a porta do servidor do Thrift (10000 por padrão).
  • Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados for especificado para uma tabela, isso será usado.
  • Nome de usuário: o usuário que fará a autenticação do Looker.
  • Senha: a senha opcional do usuário do Looker.
  • Ativar TDPs: use esse botão para ativar as tabelas derivadas persistentes. Quando as TDPs são ativadas, a janela Conexão revela outras configurações de TDP e a seção Substituições de TDP.
  • Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ela precisa ser criada com antecedência, com uma instrução como CREATE SCHEMA looker_scratch;.
  • Outros parâmetros do JDBC: adicione outros parâmetros JDBC do Hive aqui, como:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: deixe essa opção desmarcada.
  • Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Normalmente, esse campo pode ser deixado em branco ou definido como UTC.
  • Fuso horário da consulta: é o fuso horário para mostrar os dados consultados no Looker.

Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Como testar a conectividade do banco de dados para informações sobre solução de problemas.

Para salvar essas configurações, clique em Conectar.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.

Apache Spark 3 ou mais recente

O Apache Spark 3+ oferece suporte aos seguintes recursos a partir do Looker 24.10:

Engenharia de Compatível?
Nível do suporte
Compatível
Looker (Google Cloud Core)
Sim
Agregações simétricas
Sim
Tabelas derivadas
Sim
Tabelas derivadas de SQL persistentes
Sim
Tabelas derivadas nativas nativas
Sim
Visualizações estáveis
Sim
Eliminação de consultas
Sim
Dinâmicas baseadas em SQL
Sim
Fusos horários
Sim
SSL
Sim
Subtotais
Sim
Parâmetros adicionais do JDBC
Sim
Diferenciar maiúsculas e minúsculas
Sim
Tipo de local
Sim
Tipo de lista
Sim
Percentil
Sim
Percentil distinto
No
Processos de exibição do SQL Runner
No
Tabela de descrição do executor do SQL
Sim
Mostrar índices do SQL Runner
No
Seleção do SQL Runner 10
Sim
Contagem de executores do SQL
Sim
Explicação do SQL
Sim
Credenciais OAuth
No
Comentários de contexto
Sim
Pool de conexão
No
Esboços do HLL
No
Agregar reconhecimento
Sim
TDPs incrementais
No
Milissegundos
Sim
Microssegundos
Sim
Visualizações materializadas
No
Contagem aproximada diferente
No

Próximas etapas

Depois de criar a conexão, defina as opções de autenticação.