Monitoraggio di Looker

Sebbene possa sembrare che il monitoraggio delle applicazioni Looker sia strettamente richiesto, è molto importante configurarlo. Nel raro caso in cui si verifichi un problema con il tuo server, spesso è molto più difficile o impossibile per Looker aiutarti a risolvere il problema, a meno che tu non fornisca informazioni di monitoraggio appropriate a partire dal momento dell'incidente.

Monitoraggio delle applicazioni

URL

Esistono due modi semplici per verificare l'esecuzione dell'istanza di Looker.

  1. Aggiungi /alive all'URL dell'istanza di Looker in questo modo:

    https://instance_name.looker.com/alive

    Se l'istanza è in grado di rispondere a una richiesta web, riceverai un codice di stato HTTP 200 OK.

  2. Aggiungi /availability all'URL dell'istanza di Looker in questo modo:

    https://instance_name.looker.com/availability

    Questo URL esegue un controllo più completo di diversi sottosistemi sottostanti e risponderà anche con un codice di stato HTTP 200 OK, se tutto è in regola.

JMX

La macchina virtuale Java che esegue Looker può essere monitorata tramite JMX.

Molte applicazioni di monitoraggio, come Zabbix e Nagios, supportano JMX. Per saperne di più, consulta la documentazione dell'applicazione di monitoraggio.

Modifica lo script di avvio di Looker

Per abilitare il monitoraggio JMX, devi modificare lo script di avvio di Looker. Per impostazione predefinita, è denominato:

/home/looker/looker/looker

Cerca i parametri di avvio di Java:

java \
  -XX:+UseG1GC -XX:MaxGCPauseMillis=2000 \
  -Xms$JAVAMEM -Xmx$JAVAMEM \
  -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps \
  -Xloggc:/tmp/gc.log  ${JAVAARGS} \
  -jar looker.jar start ${LOOKERARGS}

A partire da Looker 6.18, il file JAR di Looker è stato suddiviso in due file JAR separati: il file JAR di base di Looker e un file JAR di dipendenze Looker. All'avvio, il file JAR principale avvia automaticamente il file JAR delle dipendenze. Entrambi i file JAR devono trovarsi nella stessa directory in modo che il file JAR principale possa trovare e avviare correttamente il file JAR delle dipendenze.

Per impostazione predefinita, l'opzione di avvio --no-daemonise non è configurata. Se non hai impostato l'opzione --no-daemonise, aggiungi una sezione seguendo la riga che inizia con -Xms$JAVAMEM:

  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.port=9910 \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.ssl=false \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.local.only=false \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.authenticate=true \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.access.file=${HOME}/.lookerjmx/jmxremote.access \
  -Dcom.sun.akuma.jvmarg.com.sun.management.jmxremote.password.file=${HOME}/.lookerjmx/jmxremote.password \

Se hai impostato l'opzione di avvio --no-daemonise, aggiungi una sezione seguendo la riga che inizia con -Xms$JAVAMEM:

  -Dcom.sun.management.jmxremote \
  -Dcom.sun.management.jmxremote.port=9910 \
  -Dcom.sun.management.jmxremote.ssl=false \
  -Dcom.sun.management.jmxremote.local.only=false \
  -Dcom.sun.management.jmxremote.authenticate=true \
  -Dcom.sun.management.jmxremote.access.file=${HOME}/.lookerjmx/jmxremote.access \
  -Dcom.sun.management.jmxremote.password.file=${HOME}/.lookerjmx/jmxremote.password \

Crea la directory .lookerjmx

Quindi, crea la directory .lookerjmx nella home directory dell'utente Looker e imposta le autorizzazioni:

sudo su - looker
mkdir ~/.lookerjmx
chmod 700 ~/.lookerjmx
cd ~/.lookerjmx

Crea i file JMX

Utilizzando il tuo editor di testo preferito, crea un file nella nuova directory denominato jmxremote.access con il seguente contenuto (potrai personalizzare in base all'ambiente):

monitorRole   readonly
controlRole   readwrite \
              create javax.management.monitor.*,javax.management.timer.* \
              unregister

Quindi, crea un file denominato jmxremote.password nella stessa directory con il seguente contenuto, utilizzando le tue password sicure:

monitorRole   some_password_here
controlRole   some_password_here

Impostazione delle autorizzazioni

Assicurati che Java (e quindi Looker) non si avvii se le autorizzazioni dei file consentono a chiunque tranne che a quello di Looker di leggere il file delle password.

chmod 400 jmxremote.*

Riavvia Looker

È necessario riavviare Looker per attivare JMX. Assicurati di eseguire questa esecuzione *come utente Looker e non root*:

cd ~/looker
./looker restart

La tua istanza Looker è ora configurata per il monitoraggio JMX remoto della porta 9910, utilizzando la password fornita. Potresti dover modificare le impostazioni del firewall o gli ACL di rete per consentire al server di monitoraggio di accedere alla rete su questa porta.

Monitoraggio dell'host

Per ogni host che esegue l'applicazione Looker, ti consigliamo di raccogliere, creare grafici e creare avvisi per almeno le seguenti metriche relative alle prestazioni:

  • Utilizzo della CPU: carico e percentuale di CPU utilizzata
  • Utilizzo della memoria: totale utilizzato e scambio utilizzato.
  • Utilizzo del disco

Soglie di avviso

Per stabilire delle buone soglie di avviso, devi prima stabilire una base di riferimento. Raccogli dati sulle prestazioni con l'istanza di Looker in esecuzione con un carico normale. Dai un'occhiata ai grafici del rendimento e osserva i picchi. Il periodo di tempo necessario per stabilire i valori di riferimento dipende dalla tua attività e dai pattern di utilizzo di Looker. Alcune aziende possono utilizzare Looker in modo stabile e ripetibile ogni settimana durante l'orario di lavoro. Altri utilizzano maggiormente Looker in orari specifici (ad esempio, la fine di ogni mese).

In generale, gli avvisi devono essere inviati solo per gli eventi strategici. L'invio di avvisi quando non è necessario fare nulla maschera l'importanza degli avvisi importanti.

Le seguenti soglie possono essere utilizzate come punto di partenza per gli avvisi. Se vengono superati i seguenti valori per 15 minuti o più, potrebbe essere necessario un intervento manuale.

Metrica Avviso Critico Commenti
Carico CPU 2 4 Il carico generalmente deve essere 1 o meno per un sistema single-core. Un carico elevato e prolungato comporta prestazioni scadenti.
% di CPU utilizzata 80 90 Un elevato utilizzo della CPU porta a prestazioni scadenti.
% di memoria utilizzata 60 70 Un utilizzo elevato della memoria può indicare troppa memoria allocata a Java.
% di disco utilizzata 80 90 Assicurati che il disco non sia pieno.

Note aggiuntive

  • I sistemi con più di un core possono gestire carichi di CPU elevati senza prestazioni ridotte. La regola generale è che il carico sostenuto non deve essere maggiore del numero di core del processore.
  • La percentuale del tempo totale di CPU in uso prima che un sistema subisca un peggioramento delle prestazioni rispetto al numero di core CPU nel sistema. In altre parole, un sistema single-core può avere prestazioni scadenti quando la CPU viene utilizzata all'80%, mentre un host a sedici core può comunque essere utilizzabile al 95% di utilizzo.
  • Un elevato utilizzo sostenuto della CPU può essere corretto aggiornando l'hardware host o eseguendo l'upgrade a un'istanza più grande. A volte un numero elevato di Look pianificati o tabelle derivate con query lunghe può essere ridotto o reso più efficiente per migliorare le prestazioni.

Passaggi successivi

Dopo aver configurato il monitoraggio, puoi configurare i backup di Looker.