Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.
O Looker se conecta ao Apache Spark 3 ou mais recente por uma conexão JDBC ao servidor Spark Thrift.
Como criptografar o tráfego de rede
É recomendável criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Ativar o acesso seguro ao banco de dados.
Criar a conexão do Looker com seu banco de dados
Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.
Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações. Confira a seguir algumas das configurações:
- Nome: o nome da conexão. É assim que a conexão vai ser referenciada no modelo do LookML.
- Dialecto: selecione Apache Spark 3+.
- Host: o host do servidor Thrift.
- Porta: a porta do servidor Thrift (10000 por padrão).
- Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados for especificado para uma tabela, isso será presumido.
- Nome de usuário: o usuário que o Looker vai autenticar.
- Senha: a senha opcional do usuário do Looker.
- Ativar TDPs: use essa opção para ativar as TDPs. Quando os TDPs estão ativados, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
- Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado com antecedência, com uma instrução como
CREATE SCHEMA looker_scratch;
. - Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Hive aqui, como:
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL: deixe essa opção desmarcada.
- Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Geralmente, ele pode ser deixado em branco ou definido como UTC.
- Fuso horário da consulta: o fuso horário para mostrar dados consultados no Looker.
Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Teste de conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Conectar.
Suporte a recursos
Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa oferecer suporte a eles.
Apache Spark 3 ou mais recente
O Apache Spark 3+ oferece suporte aos seguintes recursos a partir do Looker 25.0:
Recurso | Compatível? |
---|---|
Nível de suporte | Compatível |
Looker (Google Cloud Core) | Sim |
Agregações simétricas | Sim |
Tabelas derivadas | Sim |
Tabelas derivadas SQL persistentes | Sim |
Tabelas derivadas nativas nativas | Sim |
Visualizações estáveis | Sim |
Consulta de interrupção | Sim |
Pivots baseados em SQL | Sim |
Fusos horários | Sim |
SSL | Sim |
Subtotais | Sim |
Parâmetros adicionais do JDBC | Sim |
Diferenciar maiúsculas e minúsculas | Sim |
Tipo de local | Sim |
Tipo de lista | Sim |
Percentil | Sim |
Percentil distinto | Não |
SQL Runner Show Processes | Não |
Tabela de descrição do SQL Runner | Sim |
Índices de exibição do SQL Runner | Não |
SQL Runner Select 10 | Sim |
Contagem do SQL Runner | Sim |
SQL Explain | Sim |
Credenciais do OAuth | Não |
Comentários de contexto | Sim |
Pooling de conexão | Não |
Esboços HLL | Não |
Conscientização agregada | Sim |
PDTs incrementais | Não |
Milissegundos | Sim |
Microssegundos | Sim |
Visualizações materializadas | Não |
Contagem aproximada de valores distintos | Não |
Próximas etapas
Depois de criar a conexão, defina as opções de autenticação.