Migrazione del database di backend di Looker a MySQL

Per impostazione predefinita, Looker utilizza un database in-memory HyperSQL per archiviare la configurazione, gli utenti e altri dati. In un'istanza con un carico elevato, questo database può raggiungere dimensioni di diversi gigabyte, il che può causare problemi di prestazioni, utilizzo intensivo della memoria Java e tempi di avvio lunghi.

In un'istanza ospitata dal cliente, ti consigliamo di sostituire il database HyperSQL con un backend del database MySQL completo quando il database HyperSQL interno supera i 600 MB di dimensioni. Per controllare le dimensioni del database HyperSQL, visualizza le dimensioni del file looker.script:

cd looker
cd .db
ls -lah

Se il file looker.script supera i 600 MB di dimensioni, segui le procedure riportate di seguito per eseguire la migrazione a un database MySQL esterno.

Esegui il provisioning di un'istanza MySQL

Esegui il provisioning di un'istanza MySQL 8.0.x da utilizzare come backend. Le versioni di MySQL precedenti alla 8.0 non sono supportate.

In AWS RDS, un'istanza di classe db.m5.large è probabilmente sufficiente come backend per una singola istanza Looker. Anche se l'utilizzo effettivo del database sarà probabilmente compreso tra 5 e 10 GB, è consigliabile eseguire il provisioning di 100-150 GB di spazio di archiviazione SSD perché le IOPS sottoposte a provisioning si basano sulla quantità di spazio di archiviazione richiesta.

MySQL 8.0.X: modifica del plug-in di autenticazione predefinito

In MySQL 8.0.X, il plug-in di autenticazione predefinito è caching_sha2_password. Looker utilizza il plug-in mysql_native_password per tentare di autenticarsi nei database MySQL tramite il driver JDBC. Affinché questa versione di MySQL funzioni correttamente, devi eseguire i seguenti passaggi aggiuntivi:

  1. Configura il database MySQL in modo da utilizzare il plug-in mysql_native_password. Questa operazione può essere eseguita in diversi modi e dipenderà da come è stato implementato il database MySQL 8 e dal tipo di accesso che hai alla configurazione:

    • Avvia la procedura con il flag --default-auth=mysql_native_password

    • Imposta la proprietà nel file di configurazione my.cnf:

      [mysqld]
      default-authentication-plugin=mysql_native_password
      
    • Se l'istanza di database è ospitata tramite AWS RDS, imposta il parametro default_authentication_plugin tramite un gruppo di parametri RDS applicato a questa istanza di database.

  2. Esegui le seguenti istruzioni, sostituendo some_password_here con una password univoca e sicura:

    CREATE USER looker IDENTIFIED WITH mysql_native_password BY 'some_password_here';
    GRANT SELECT ON database_name.* TO 'looker'@'%';
    

Ottimizzare MySQL

Modifica le seguenti impostazioni nell'istanza MySQL.

Aumentare la dimensione massima del pacchetto

La dimensione predefinita di max_allowed_packet di MySQL è troppo piccola per la migrazione del database e può causare un errore di PACKET_TOO_LARGE. Imposta max_allowed_packet sul valore massimo consentito di 1073741824:

max_allowed_packet = 1073741824

Imposta l'algoritmo della tabella temporanea

MySQL 8 gestisce le tabelle temporanee interne in modo diverso rispetto alle versioni precedenti. Le impostazioni predefinite possono causare problemi di esecuzione di alcune delle query necessarie per l'esecuzione di Looker, in particolare per le istanze di Looker con molti utenti e progetti. La best practice consiste nell'impostare la seguente impostazione del server globale:

internal_tmp_mem_storage_engine = MEMORY

Configurare i set di caratteri

Imposta i seguenti parametri predefiniti per utilizzare UTF8mb4, che supporta i set di caratteri UTF8. Leggi l'articolo In MySQL, non utilizzare mai "utf8". Utilizza "utf8mb4". Scopri perché consigliamo di utilizzare UTF8mb4, non UTF8, con MySQL.

character_set_client = utf8mb4
character_set_results = utf8mb4
character_set_connection = utf8mb4
character_set_database = utf8mb4
character_set_server = utf8mb4
collation_connection = utf8mb4_general_ci
collation_server = utf8mb4_general_ci

Nelle istanze Amazon RDS, puoi applicare questa impostazione creando o modificando un gruppo di parametri e modificando le impostazioni appropriate. Ti consigliamo di copiare il gruppo di parametri corrente e di apportare le modifiche alla copia, soprattutto se condividi gruppi di parametri in più istanze RDS. Dopo aver salvato il gruppo di parametri, applicalo all'istanza RDS. Potrebbe essere necessario riavviare il dispositivo.

Impostare lo schema di replica

Looker si basa su funzionalità che richiedono un log bin mixed o row. Se ospiti la tua istanza MySQL, imposta binlog_format su mixed o row emettendo uno dei seguenti comandi:

SET GLOBAL binlog_format = 'MIXED';

o

SET GLOBAL binlog_format = 'ROW';

Crea un database e un utente

Crea un utente e un database nell'istanza di database, sostituendo <DB_username>, <DB_name> e <DB_password> con i valori effettivi dell'utente e del database. Sostituisci anche <DB_charset> e <DB_collation> con il set di caratteri e le regole di confronto scelti che corrispondono alle impostazioni del gruppo di parametri dell'istanza RDS (per il supporto completo di UTF-8, consigliamo utf8mb4 e utf8mb4_general_ci).

create user <DB_username>;
set password for <DB_username> = password ('<DB_password>');
create database <DB_name> default character set <DB_charset> default collate <DB_collation>;
grant all on <DB_name>.* to <DB_username>@'%';
grant all on looker_tmp.* to '<DB_username>'@'%';

Il database looker_tmp nell'ultima riga non deve necessariamente esistere, ma l'istruzione grant è necessaria per i report interni.

Crea un file delle credenziali del database

Looker deve sapere con quale database MySQL comunicare e quali credenziali utilizzare. Nella directory di Looker, crea un file denominato looker-db.yml con i seguenti contenuti, sostituendo <DB_hostname>, <DB_username>, <DB_password> e <DB_name> con i valori per il tuo database:

dialect: mysql
host: <DB_hostname>
username: <DB_username>
password: <DB_password>
database: <DB_name>
port: 3306

Se il database MySQL richiede una connessione SSL, aggiungi la seguente riga a looker-db.yml:

ssl: true

Se vuoi attivare anche la verifica del certificato SSL, aggiungi la seguente riga a looker-db.yml:

verify_ssl: true

Se vuoi, puoi anche specificare altri parametri JDBC aggiuntivi supportati dal driver JDBC MariaDB aggiungendo jdbc_additional_params. Ad esempio, se devi utilizzare un file del magazzino attendibile specifico, puoi aggiungere il seguente parametro alla stringa di connessione JDBC di MySQL:

jdbc_additional_params: trustStore=/path/to/my/truststore.jks&keyStore=/path/to/my/keystore.jks

Per le installazioni ospitate dal cliente, puoi specificare facoltativamente il numero massimo di connessioni che Looker può stabilire con il tuo database aggiungendo max_connections. Ad esempio, per limitare a 10 il numero di connessioni simultanee al database, aggiungi quanto segue:

max_connections: 10

Secondo lo schema di crittografia di Looker, tutti i dati sensibili nel database vengono criptati quando sono inattivi. Anche se qualcuno dovesse ottenere l'accesso alle credenziali del database in testo non cifrato e accedere al database, Looker cripta o sottopone ad hashing i dati sensibili prima di archiviarli. Questo vale per password, credenziali del database di analisi, cache delle query e così via. Tuttavia, se non vuoi memorizzare la password in testo normale per questa configurazione nel file looker-db.yml su disco, puoi configurare la variabile di ambiente LOOKER_DB in modo che contenga un elenco di chiavi/valori per ogni riga del file looker-db.yml. Ad esempio:

export LOOKER_DB="dialect=mysql&host=localhost&username=root&password=&database=looker&port=3306"

Esegui il backup della directory .db

Esegui il backup della directory .db, che contiene i file necessari per creare il database HyperSQL in memoria, nel caso in cui tu debba ripristinare HyperSQL:

cp -r .db .db-backup
tar -zcvf db-backup.tar.gz ./.db-backup

Esegui la migrazione del database

La migrazione del database a MySQL può richiedere ore su un'istanza di medie o grandi dimensioni, soprattutto se il database HyperSQL è di almeno 1 GB. Ti consigliamo di eseguire temporaneamente l'upgrade dell'istanza EC2 a un'istanza m5.2xlarge (con 32 GB di RAM per consentire l'heap di 26 GB specificato nei passaggi) durante la migrazione, il che riduce il tempo necessario a circa 10 minuti.

  1. Nell'host di Looker:

    cd looker
    ./looker stop
    vi looker
    
  2. Nello script di avvio di Looker, crea una nuova seconda riga nel file:

    exit
    
  3. Arresta l'istanza nella console AWS. Una volta interrotta, modifica le dimensioni dell'istanza EC2 in m5.2xlarge. Quindi, riavvia l'istanza.

  4. Esegui SSH all'host come utente Looker. Innanzitutto assicurati che Java non sia in esecuzione, quindi esegui:

    cd looker
    java -Xms26000m -Xmx26000m -jar looker.jar migrate_internal_data  looker-db.yml
    

    Quando esegui il passaggio migrate_internal_data, libcrypt potrebbe non essere trovato e verrà visualizzata una traccia dello stack che inizia con:

    NotImplementedError: getppid unsupported or native support failed to load
    ppid at org/jruby/RubyProcess.java:752
    ppid at org/jruby/RubyProcess.java:749
    

    In questo caso, imposta LD_LIBRARY_PATH manualmente prima di eseguire il comando Java:

    export LD_LIBRARY_PATH=$HOME/looker/.tmp/:$LD_LIBRARY_PATH
    
  5. Al termine dell'operazione, interrompi l'istanza dalla console AWS.

  6. Ora puoi ripristinare le dimensioni originali dell'istanza.

  7. Riavvia l'istanza.

Avvia Looker

  1. Modifica lo script di avvio di Looker ed elimina la riga exit aggiunta in precedenza.

  2. Assicurati che non siano presenti argomenti definiti in LOOKERARGS nello script di avvio. Gli eventuali argomenti devono essere spostati nel file lookerstart.cfg in modo che non vengano sovrascritti dalle nuove versioni dello script di avvio. Salva ed esci dallo script di avvio.

  3. Modifica lookerstart.cfg. Dovrebbe avere il seguente aspetto:

    LOOKERARGS="-d looker-db.yml"
    

    Se nello script di avvio di Looker sono presenti altri argomenti, aggiungili al file lookerstart.cfg.

  4. Archivia la directory .db, se non è già archiviata.

    mv .db .db-backup
    tar -zcvf db-backup.tar.gz ./.db-backup
    rm -rf ./.db-backup/
    
  5. Avvia Looker:

    ./looker start
    

Verificare che Looker utilizzi il nuovo database

Se Looker utilizza correttamente il backend MySQL, dovresti vedere le connessioni di rete tra l'istanza Looker e la nuova istanza del database. Per verificare, esegui il seguente comando sull'istanza di Looker:

netstat -na | grep 3306

Dovresti vedere alcune connessioni all'istanza di database. Di seguito è riportato un output di esempio che mostra un'istanza DB all'indirizzo IP 10.0.3.155:

looker@instance1:~$ netstat -na | grep 3306
tcp6       0      0 10.0.5.131:56583        10.0.3.155:3306         ESTABLISHED
tcp6       0      0 10.0.5.131:56506        10.0.3.155:3306         ESTABLISHED
tcp6       0      0 10.0.5.131:56582        10.0.3.155:3306         ESTABLISHED
tcp6       0      0 10.0.5.131:56508        10.0.3.155:3306         ESTABLISHED

Eseguire il backup di Looker

Dopo la migrazione a un backend MySQL, i backup automatici di S3 di Looker non funzioneranno più. Consigliamo almeno i backup notturni del database MySQL e i backup notturni del file system della directory di lavoro di Looker. La directory looker/log/ potrebbe essere esclusa dai backup del file system. Per ulteriori informazioni, consulta la pagina della documentazione relativa alla creazione dei backup.