Amazon Athena

O Looker suporta ligações ao Amazon Athena, um serviço de consultas interativo que facilita a análise de dados no Amazon S3 através do SQL padrão. O Amazon Athena é sem servidor, pelo que não existe infraestrutura para gerir. Só lhe são cobradas as consultas executadas.

Encriptar o tráfego de rede

É uma prática recomendada encriptar o tráfego de rede entre a aplicação Looker e a sua base de dados. Considere uma das opções descritas na página de documentação Ativar o acesso seguro à base de dados.

Configurar uma ligação do Amazon Athena

Esta página descreve como associar o Looker a uma instância do Amazon Athena.

  1. Certifique-se de que tem o seguinte:

    • Um par de chaves de acesso do Amazon AWS.
    • O contentor do S3 que contém os dados que quer consultar no Looker com o Amazon Athena. As chaves de acesso do Amazon AWS têm de ter acesso de leitura/escrita a este contentor.

      O Amazon Athena tem de ter acesso a este contentor do S3 através de uma função ou de um conjunto de autorizações, bem como de regras de firewall. Não adicione regras de segurança ao contentor do S3 para o IP do Looker, uma vez que isto pode bloquear inadvertidamente o acesso do Amazon Athena ao contentor do S3. (Para outros dialetos além do Amazon Athena, os utilizadores podem querer limitar o acesso aos dados a partir da camada de rede com uma lista de IPs permitidos, conforme descrito na página de documentação Ativar o acesso seguro à base de dados.)

    • Conhecimento da localização dos dados da instância do Amazon Athena. Pode encontrar o nome da região na parte superior direita da consola da Amazon.

  2. Na secção Administração do Looker, selecione Ligações e, de seguida, clique em Adicionar ligação.

  3. Preencha os detalhes da associação:

Para verificar se a associação foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conetividade da base de dados para ver informações de resolução de problemas.

Para guardar estas definições, clique em Associar.

Especificar o seu contentor do S3 para a saída dos resultados das consultas e os PDTs

Use o campo Additional JDBC parameters (Parâmetros JDBC adicionais) da página Connections (Ligações) para configurar o caminho para o contentor do S3 que o Looker vai usar para armazenar a saída dos resultados das consultas e para especificar o nome do diretório de saída no contentor do S3 onde quer que o Looker escreva PDTs. Especifique estas informações através do parâmetro s3_staging_dir.

O parâmetro JDBC s3_staging_dir é uma forma alternativa de configurar a propriedade S3OutputLocation do Amazon Athena, que é necessária para as ligações JDBC do Athena. Consulte a documentação do Athena sobre as opções do controlador JDBC para ver mais informações e uma lista de todas as opções do controlador JDBC disponíveis.

No campo Parâmetros JDBC adicionais, especifique o parâmetro s3_staging_dir com o seguinte formato:

`s3_staging_dir=s3://<s3-bucket>/<output-path>`

Onde:

  • <s3-bucket> é o nome do contentor do S3.
  • <output-path> é o caminho onde o Looker escreve o resultado da consulta.

O par de chaves de acesso da AWS tem de ter autorizações de escrita no diretório <s3-bucket>.

Para configurar o diretório onde o Looker vai escrever PDTs, introduza o caminho do diretório no contentor do S3 no campo Base de dados temporária. Por exemplo, se quiser que o Looker escreva PDTs em s3://<s3-bucket>/looker_scratch, introduza o seguinte no campo Base de dados temporária:

`looker_scratch`

Introduza apenas o caminho do diretório. O Looker obtém o nome do contentor do S3 a partir do parâmetro s3_staging_dir que introduz no campo Parâmetros JDBC adicionais.

Considerações sobre o contentor do S3

Recomendamos que configure os ciclos de vida dos objetos do Amazon S3 para limpar periodicamente os ficheiros desnecessários no contentor do S3 especificado. Existem motivos para tal:

  • O Athena armazena os resultados das consultas para cada consulta num contentor do S3. Consulte Consultas do Athena.
  • Se tiver PDTs ativadas, quando uma PDT é criada, os metadados sobre a tabela criada são armazenados no contentor do S3.

Recursos

Depuração

A Amazon oferece opções de controladores JDBC LogLevel e LogPath para depurar ligações. Para os usar, adicione ;LogLevel=DEBUG;LogPath=/tmp/athena_debug.log ao final do campo Parâmetros JDBC adicionais e teste a ligação novamente.

Se o Looker estiver a alojar a instância, o apoio técnico do Looker ou o seu analista tem de obter este ficheiro para continuar a depuração.

Suporte de funcionalidades

Para que o Looker suporte algumas funcionalidades, o dialeto da base de dados também tem de as suportar.

O Amazon Athena suporta as seguintes funcionalidades a partir do Looker 25.14:

Funcionalidade Compatível?
Nível de apoio técnico
Suportado
Looker (Google Cloud Core)
Sim
Dados agregados simétricos
Sim
Tabelas derivadas
Sim
Tabelas derivadas SQL persistentes
Sim
Tabelas derivadas nativas persistentes
Sim
Vistas estáveis
Sim
Interrupção de consultas
Sim
Tabelas dinâmicas baseadas em SQL
Sim
Fusos horários
Sim
SSL
Sim
Subtotais
Não
Parâmetros JDBC adicionais
Sim
Sensível a maiúsculas e minúsculas
Sim
Tipo de localização
Sim
Tipo de lista
Sim
Percentil
Sim
Percentil distinto
Não
Execução de SQL Mostrar processos
Não
Execução de SQL Describe Table
Sim
Execução de SQL Mostrar índices
Não
Execução de SQL Select 10
Sim
Contagem da execução de SQL
Sim
SQL Explain
Não
Credenciais do OAuth 2.0
Não
Comentários de contexto
Sim
Agrupamento de ligações
Não
Esboços HLL
Sim
Notoriedade agregada
Sim
PDTs incrementais
Não
Milissegundos
Sim
Microssegundos
Não
Vistas materializadas
Não
Medidas de comparação de períodos
Não
Contagem distinta aproximada
Sim

Passos seguintes

Depois de concluir a ligação à base de dados, configure as opções de autenticação.