Apache Spark

Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.

O Looker se conecta ao Apache Spark 3 ou mais recente por uma conexão JDBC com o servidor Thrift do Spark.

Criptografar o tráfego de rede

É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.

Criar a conexão do Looker com seu banco de dados

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.

Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Conectar o Looker ao seu banco de dados para mais informações. Algumas das configurações são descritas a seguir:

Nome: o nome da conexão. É assim que a conexão será referida no modelo do LookML.
Dialeto: selecione Apache Spark 3 ou mais recente.
Host: o host do servidor Thrift.
Porta: a porta do servidor Thrift (10000 por padrão).
Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados é especificado para uma tabela, esse é o padrão.
Nome de usuário: o usuário que o Looker vai autenticar.
Senha: a senha opcional do usuário do Looker.
Ativar TDPs: use essa opção para ativar as tabelas derivadas persistentes. Quando as TDPs estão ativadas, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado antes, com uma instrução como CREATE SCHEMA looker_scratch;.
Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Hive aqui, como:
- ;spark.sql.inMemoryColumnarStorage.compressed=true
- ;auth=noSasl
SSL: deixe essa opção desmarcada.
Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Normalmente, ele pode ser deixado em branco ou definido como UTC.
Fuso horário da consulta: o fuso horário para mostrar os dados consultados no Looker.

Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.

Para salvar essas configurações, clique em Conectar.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.

Apache Spark 3 ou mais recente

O Apache Spark 3+ é compatível com os seguintes recursos a partir do Looker 25.16:

Recurso	Compatível?
Nível de suporte	Com suporte
Looker (Google Cloud Core)	Sim
Agregações simétricas	Sim
Tabelas derivadas	Sim
Tabelas derivadas persistentes do SQL	Sim
Tabelas derivadas nativas persistentes	Sim
Visualizações estáveis	Sim
Interrupção de consultas	Sim
Tabelas dinâmicas baseadas em SQL	Sim
Fusos horários	Sim
SSL	Sim
Subtotais	Sim
Parâmetros adicionais do JDBC	Sim
Diferenciação entre maiúsculas e minúsculas	Sim
Tipo de local	Sim
Tipo de lista	Sim
Percentil	Sim
Percentil distinto	Não
Mostrar processos do SQL Runner	Não
Descrever tabela do SQL Runner	Sim
Mostrar índices do SQL Runner	Não
Selecionar 10 no SQL Runner	Sim
Contagem do SQL Runner	Sim
Explicação do SQL	Sim
Credenciais do OAuth 2.0	Não
Comentários de contexto	Sim
Pooling de conexão	Não
Esboços HLL	Não
Reconhecimento agregado	Sim
TDPs incrementais	Não
Milissegundos	Sim
Microssegundos	Sim
Visualizações materializadas.	Não
Medidas de comparação de períodos	Não
Contagem aproximada aproximada	Não

Próximas etapas

Depois de criar a conexão, defina as opções de autenticação.