O Looker oferece suporte a conexões com o Amazon Athena, um serviço de consulta interativa que facilita a análise de dados no Amazon S3 usando o SQL padrão. O Amazon Athena não tem servidor, então não há infraestrutura para gerenciar. Você só vai receber cobranças pelas consultas que forem executadas.
Como criptografar o tráfego de rede
É recomendável criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Ativar o acesso seguro ao banco de dados.
Como configurar uma conexão do Amazon Athena
Esta página descreve como conectar o Looker a uma instância do Amazon Athena.
Verifique se você tem o seguinte:
- Um par de chaves de acesso da Amazon AWS.
O bucket do S3 que contém os dados que você quer consultar no Looker com o Amazon Athena. As chaves de acesso da Amazon AWS precisam ter acesso de leitura e gravação a esse bucket.
O Amazon Athena precisa ter acesso a esse bucket do S3 por uma função ou um conjunto de permissões, bem como por regras de firewall. Não adicione regras de segurança ao bucket do S3 para o IP do Looker, porque isso pode bloquear inadvertidamente o acesso do Amazon Athena ao bucket do S3. Para outros dialetos além do Amazon Athena, os usuários podem querer limitar o acesso aos dados da camada de rede com uma lista de permissões de IP, conforme descrito na página de documentação Ativar o acesso seguro ao banco de dados.
Saber onde estão os dados da sua instância do Amazon Athena. O nome da região pode ser encontrado na parte superior direita do console da Amazon.
Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.
Preencha os detalhes da conexão:
- Nome: especifique o nome da conexão. É assim que você vai se referir à conexão nos projetos do LookML.
- Dialecto: selecione Amazon Athena.
- Host e Porta: especifique o nome do host e da porta, conforme descrito na documentação do Athena sobre o formato de URL JDBC. O host precisa ser um endpoint válido da Amazon (como
athena.eu-west-1.amazonaws.com
), e a porta precisa permanecer em443
. Uma lista atualizada de endpoints com suporte ao Athena pode ser encontrada nesta página de referência geral da AWS. - Banco de dados: especifique o banco de dados padrão que você quer modelar. Outros bancos de dados podem ser acessados, mas o Looker trata esse banco de dados como o padrão.
- Nome de usuário: especifique o ID da chave de acesso da AWS.
- Senha: especifique a chave de acesso secreta da AWS.
- Ativar TDPs: use essa opção para ativar as tabelas derivadas persistentes (TDPs). Ativar as TDPs revela outros campos de TDP e a seção Substituições de TDP para a conexão.
- Banco de dados temporário: especifique o nome do diretório de saída no bucket do S3 em que você quer que o Looker grave as PDTs. O caminho completo para o diretório de saída precisa ser especificado no campo Parâmetros JDBC adicionais. Consulte a seção Como especificar seu bucket do S3 para saída de resultados de consulta e PDTs nesta página.
- Número máximo de conexões do builder da TDP: especifique o número de builds simultâneos de TDP possíveis nessa conexão. Definir esse valor muito alto pode afetar negativamente os tempos de consulta. Para mais informações, consulte a página de documentação Como conectar o Looker ao seu banco de dados.
- Parâmetros JDBC adicionais: especifique outros parâmetros para a conexão:
- O parâmetro
s3_staging_dir
é o bucket do S3 que o Looker precisa usar para a saída de resultados de consulta e PDTs. Consulte a seção Como especificar seu bucket do S3 para saída de resultados de consulta e PDTs nesta página. - Sinalização para resultados de streaming. Se você tiver a política
athena:GetQueryResultsStream
anexada ao usuário do Athena, adicione;UseResultsetStreaming=1
ao final dos parâmetros JDBC adicionais para melhorar significativamente o desempenho da extração de conjuntos de resultados grandes. Esse parâmetro é definido como0
por padrão. - Parâmetros adicionais opcionais para adicionar à string de conexão JDBC.
- O parâmetro
- SSL: ignore. Por padrão, todas as conexões com a API da AWS serão criptografadas.
- Conexões máximas por nó: por padrão, esse valor é definido como 5. É possível aumentar esse valor para até 20 se o Looker for o mecanismo de consulta principal executado no Athena. Consulte a documentação sobre os limites de serviço do Athena para mais detalhes. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações.
- Tempo limite do pool de conexões: especifique o tempo limite do pool de conexões. Por padrão, o tempo limite é definido como 120 segundos. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações.
- Pré-cache do SQL Runner: desmarque essa opção se preferir que o SQL Runner carregue as informações da tabela somente quando uma tabela for selecionada. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações.
- Fuso horário do banco de dados: especifique o fuso horário usado no banco de dados. Deixe esse campo em branco se você não quiser a conversão de fuso horário. Consulte a página de documentação Como usar as configurações de fuso horário para mais informações.
Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Teste de conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Conectar.
Como especificar o bucket do S3 para a saída de resultados de consulta e PDTs
Use o campo Parâmetros JDBC adicionais da página Conexões para configurar o caminho para o bucket do S3 que o Looker vai usar para armazenar a saída dos resultados da consulta e especificar o nome do diretório de saída no bucket do S3 em que você quer que o Looker grave os PDTs. Especifique essas informações usando o parâmetro s3_staging_dir
.
O parâmetro JDBC s3_staging_dir
é uma maneira alternativa de configurar a propriedade S3OutputLocation
do Amazon Athena, que é necessária para conexões JDBC do Athena. Consulte a documentação do Athena sobre as opções de driver JDBC para mais informações e uma lista de todas as opções de driver JDBC disponíveis.
No campo Parâmetros JDBC adicionais, especifique o parâmetro s3_staging_dir
usando o seguinte formato:
`s3_staging_dir=s3://<s3-bucket>/<output-path>`
Em que:
<s3-bucket>
é o nome do bucket do S3.<output-path>
é o caminho em que o Looker vai gravar a saída dos resultados da consulta.
O par de chaves de acesso da AWS precisa ter permissões de gravação no diretório
<s3-bucket>
.
Para configurar o diretório em que o Looker vai gravar os PDTs, insira o caminho do diretório no bucket do S3 no campo Banco de dados temporário.
Por exemplo, se você quiser que o Looker grave PDTs em s3://<s3-bucket>/looker_scratch
, insira o seguinte no campo Banco de dados temporário:
`looker_scratch`
Insira apenas o caminho do diretório. O Looker recebe o nome do bucket do S3 do parâmetro s3_staging_dir
que você insere no campo Parâmetros JDBC adicionais.
Considerações sobre buckets do S3
É recomendável configurar os ciclos de vida de objetos do Amazon S3 para limpar periodicamente os arquivos desnecessários no bucket do S3 especificado. Há alguns motivos para isso:
- O Athena armazena os resultados de cada consulta em um bucket do S3. Consulte Consultas do Athena.
- Se você tiver PDTs ativados, quando um PDT for criado, os metadados sobre a tabela criada serão armazenados no bucket do S3.
Recursos
- Documentação do Amazon Athena
- Console da Amazon Web Services para Athena (requer login na AWS)
- Referência do SQL e HiveQL do Amazon Athena
Depuração
A Amazon oferece opções de driver JDBC LogLevel
e LogPath
para depurar conexões. Para usá-los, adicione ;LogLevel=DEBUG;LogPath=/tmp/athena_debug.log
ao final do campo Parâmetros JDBC adicionais e teste a conexão novamente.
Se o Looker estiver hospedando a instância, o suporte do Looker ou seu analista precisará recuperar esse arquivo para continuar a depuração.
Suporte a recursos
Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa oferecer suporte a eles.
O Amazon Athena oferece suporte aos seguintes recursos a partir do Looker 25.4:
Recurso | Compatível? |
---|---|
Nível de suporte | Compatível |
Looker (Google Cloud Core) | Sim |
Agregações simétricas | Sim |
Tabelas derivadas | Sim |
Tabelas derivadas persistentes do SQL | Sim |
Tabelas derivadas nativas nativas | Sim |
Visualizações estáveis | Sim |
Consultas interrompidas | Sim |
Pivots baseados em SQL | Sim |
Fusos horários | Sim |
SSL | Sim |
Subtotais | Não |
Parâmetros adicionais do JDBC | Sim |
Diferenciar maiúsculas e minúsculas | Sim |
Tipo de local | Sim |
Tipo de lista | Sim |
Percentil | Sim |
Percentil distinto | Não |
SQL Runner Show Processes | Não |
Tabela de descrição do SQL Runner | Sim |
Índices de exibição do SQL Runner | Não |
SQL Runner Select 10 | Sim |
Contagem do SQL Runner | Sim |
SQL Explain | Não |
Credenciais do OAuth | Não |
Comentários de contexto | Sim |
Pooling de conexão | Não |
Esboços HLL | Sim |
Conscientização agregada | Sim |
PDTs incrementais | Não |
Milissegundos | Sim |
Microssegundos | Não |
Visualizações materializadas | Não |
Contagem aproximada de valores distintos | Sim |
Próximas etapas
Depois de concluir a conexão com o banco de dados, configure as opções de autenticação.