Databricks

Criar um usuário do Looker

O Looker faz a autenticação no Databricks usando tokens de acesso pessoais. Siga a documentação do Databricks para criar um token de acesso pessoal e usá-lo no Looker.

Adicione permissões a este usuário com o GRANT.

No mínimo, o usuário do Looker precisa ter SELECT e READ_METADATA.

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

Informações do servidor

Siga a documentação do Databricks para encontrar o caminho HTTP para seu cluster do Databricks. Ele será chamado de <YOUR_HTTP_PATH> nesta página.

Como configurar tabelas derivadas permanentes

Para usar tabelas derivadas permanentes, crie um banco de dados separado.

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

Isso também exigirá que outras permissões do usuário com base em gravação sejam concedidas.

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

Como criar a conexão do Looker com seu banco de dados

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.

Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações. Algumas das configurações são descritas a seguir:

  • Nome: especifique o nome da conexão. É assim que você vai se referir à conexão em projetos do LookML.
  • Dialeto: especifique o dialeto Databricks.
  • Host: especifique o nome do host.
  • Porta: especifique a porta do banco de dados. O padrão é 443.
  • Banco de dados: especifique o nome do banco de dados. O padrão é default.
  • Nome de usuário: insira o valor token (não insira o e-mail do usuário do Databricks neste campo).
  • Senha: digite o token de acesso pessoal criado anteriormente.
  • Ativar TDPs: use este botão para ativar as tabelas derivadas permanentes. Quando as TDPs estão ativadas, a janela Conexão mostra as outras configurações e a seção Modificações de TDP.
  • Banco de dados temporário: insira o banco de dados que você quer usar para armazenar PDTs.
  • Número máximo de conexões do PDT Builder: especifique o número de criações simultâneas de PDT simultâneas nessa conexão. Definir esse valor muito alto pode afetar negativamente os tempos de consulta. Para mais informações, consulte a página de documentação Como conectar o Looker ao seu banco de dados.
  • Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Spark.

  • Programação de manutenção de PDT e grupo de dados: uma expressão cron que indica quando o Looker deve verificar grupos de dados e as tabelas derivadas permanentes. Leia mais sobre essa configuração na documentação Programação de manutenção do PDT e do grupo de dados.

  • SSL: marque para usar conexões SSL.

  • Verificar SSL: marque para aplicar a verificação de certificado SSL rigorosa.

  • Máximo de conexões por nó: você pode manter essa configuração com o valor padrão inicialmente. Leia mais sobre essa configuração na seção Máximo de conexões por nó da página de documentação Como conectar o Looker ao seu banco de dados.

  • Tempo limite do pool de conexões: é possível deixar essa configuração com o valor padrão inicialmente. Leia mais sobre essa configuração na seção Tempo limite do pool de conexões da página de documentação Como conectar o Looker ao seu banco de dados.

  • Pré-cache do SQL Runner: para fazer com que o SQL Runner não pré-carregue as informações da tabela e carregue as informações dela apenas quando uma tabela estiver selecionada, desmarque essa opção. Leia mais sobre essa configuração na seção Pré-cache do SQL Runner da página de documentação Como conectar o Looker ao seu banco de dados.

  • Fuso horário do banco de dados: especifique o fuso horário usado no banco de dados. Deixe esse campo em branco se você não quiser a conversão de fuso horário. Consulte a página de documentação Como usar configurações de fuso horário para mais informações.

Clique em Test para testar a conexão e confirmar que ela está configurada corretamente. Se aparecer a opção Pode conectar, pressione Conectar. Isso executa o restante dos testes de conexão para verificar se a conta de serviço foi configurada corretamente e com os papéis adequados. Consulte a página de documentação Como testar a conectividade do banco de dados para ver informações sobre solução de problemas.

Funcionalidade do Looker com o Databricks Unity Catalog

O Looker não é compatível com o catálogo do Unity do Databricks. Para conexões do Looker com um banco de dados do Databricks com o Unity Catalog ativado, a maioria das funcionalidades do Looker vai acessar os esquemas somente do catálogo padrão, como nos seguintes cenários:

  • Ao gerar um novo projeto LookML a partir do esquema de banco de dados, o Looker criará os arquivos do projeto com base nas tabelas do catálogo padrão do Unity Catalog.
  • Para projetos existentes, ao usar o ambiente de desenvolvimento integrado do Looker para criar uma visualização a partir de uma tabela, o Looker só pode criar arquivos de visualização a partir das tabelas no catálogo padrão do Unity Catalog.
  • Ao usar o SQL Runner, você pode selecionar apenas esquemas do catálogo padrão do Unity Catalog.

Suporte a recursos

Para que o Looker seja compatível com alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.

O Databricks oferece suporte aos seguintes recursos do Looker 23.8:

Recurso Compatível?
Nível do suporte
Compatível
Looker (Google Cloud Core)
Sim
Agregados simétricos
Sim
Tabelas derivadas
Sim
Tabelas derivadas do SQL permanente
Sim
Tabelas derivadas nativas nativas
Sim
Visualizações estáveis
Sim
Eliminação de consultas
Sim
Tabelas dinâmicas baseadas em SQL
Sim
Fusos horários
Sim
SSL
Sim
Subtotais
Sim
Parâmetros adicionais de JDBC
Sim
Diferenciar maiúsculas e minúsculas
Sim
Tipo de local
Sim
Tipo de lista
Sim
Percentil
Sim
Percentil distinto
Não
Processos do SQL Runner Show
Não
Tabela de descrição do SQL Runner
Sim
Índices do SQL Runner Show
Não
SQL Runner Select 10
Sim
Contagem de executores do SQL
Sim
Explicação do SQL
Sim
Credenciais do OAuth
Não
Comentários de contexto
Sim
Pool de conexão
Não
HLL Sketches
Não
Reconhecimento agregado
Sim
PDTs incrementais
Sim
Milissegundos
Sim
Microssegundos
Sim
Visualizações materializadas
Não
Contagem aproximada diferente
Não