Se usó la API de Cloud Translation para traducir esta página.

Agrupamiento de Looker

En este instructivo, se explica el método recomendado para crear una configuración de Looker en clústeres para instancias alojadas por el cliente.

Descripción general

Las implementaciones de Looker alojadas por el cliente pueden ejecutar un solo nodo o un clúster:

Una aplicación de Looker de un solo nodo, la configuración predeterminada, tiene todos los servicios que componen la aplicación de Looker que se ejecutan en un solo servidor.
Una configuración de Looker en clúster es más compleja y, por lo general, incluye servidores de bases de datos, balanceadores de cargas y varios servidores que ejecutan la aplicación de Looker. Cada nodo de una aplicación de Looker agrupada es un servidor que ejecuta una sola instancia de Looker.

Existen dos motivos principales por los que una organización querría ejecutar Looker como un clúster:

Balanceo de cargas
Mejora de la disponibilidad y la conmutación por error

Según los problemas de escalamiento, es posible que un Looker agrupado no proporcione la solución. Por ejemplo, si una pequeña cantidad de consultas grandes agotan la memoria del sistema, la única solución es aumentar la memoria disponible para el proceso de Looker.

Alternativas de balanceo de cargas

Antes de balancear la carga de Looker, considera aumentar la memoria y, posiblemente, el recuento de CPU de un solo servidor que ejecute Looker. Looker recomienda configurar una supervisión detallada del rendimiento para el uso de la memoria y la CPU, de modo que se garantice que el servidor de Looker tenga el tamaño adecuado para su carga de trabajo.

Las consultas grandes necesitan más memoria para un mejor rendimiento. El agrupamiento en clústeres puede proporcionar mejoras en el rendimiento cuando muchos usuarios ejecutan consultas pequeñas.

Para las configuraciones con hasta 50 usuarios que usan Looker de forma esporádica, Looker recomienda ejecutar un solo servidor equivalente a una instancia de EC2 de AWS de tamaño grande (M4.large: 8 GB de RAM, 2 núcleos de CPU). En el caso de las configuraciones con más usuarios o muchos usuarios avanzados activos, observa si la CPU tiene picos o si los usuarios notan lentitud en la aplicación. Si es así, mueve Looker a un servidor más grande o ejecuta una configuración de Looker en clúster.

Mejora de la disponibilidad y la conmutación por error

Ejecutar Looker en un entorno agrupado puede mitigar el tiempo de inactividad en caso de una interrupción. La alta disponibilidad es especialmente importante si la API de Looker se usa en sistemas empresariales centrales o si Looker está integrado en productos orientados al cliente.

En una configuración de Looker en clúster, un servidor proxy o un balanceador de cargas redireccionará el tráfico cuando determine que un nodo está inactivo. Looker controla automáticamente los nodos que se unen al clúster y los que lo abandonan.

Componentes obligatorios

Se requieren los siguientes componentes para una configuración de Looker en clúster:

Base de datos de la aplicación de MySQL
Nodos de Looker (servidores que ejecutan el proceso de Java de Looker)
Balanceador de cargas
Sistema de archivos compartido
Versión correcta de los archivos JAR de la aplicación de Looker

En el siguiente diagrama, se ilustra cómo interactúan los componentes. A un nivel general, un balanceador de cargas distribuye el tráfico de red entre los nodos de Looker agrupados en clústeres. Cada nodo se comunica con una base de datos de aplicaciones de MySQL compartida, un directorio de almacenamiento compartido y los servidores de Git para cada proyecto de LookML.

Base de datos de la aplicación de MySQL

Looker usa una base de datos de aplicaciones (a menudo llamada base de datos interna) para almacenar datos de aplicaciones. Cuando Looker se ejecuta como una aplicación de un solo nodo, normalmente usa una base de datos HyperSQL en memoria.

En una configuración de Looker en clúster, la instancia de Looker de cada nodo debe apuntar a una base de datos transaccional compartida (la base de datos interna o de la aplicación compartida). La compatibilidad con la base de datos de la aplicación para Looker en clústeres es la siguiente:

Solo se admite MySQL para la base de datos de la aplicación en instancias de Looker agrupadas. No se admiten Amazon Aurora ni MariaDB.
Se admiten las versiones 5.7 y 8.0 de MySQL.
No se admiten las bases de datos agrupadas, como Galera.

Looker no administra el mantenimiento ni las copias de seguridad de esa base de datos. Sin embargo, dado que la base de datos aloja casi todos los datos de configuración de la aplicación de Looker, se debe aprovisionar como una base de datos de alta disponibilidad y se debe crear una copia de seguridad al menos a diario.

Nodos de Looker

Cada nodo es un servidor con el proceso de Java de Looker en ejecución. Los servidores del clúster de Looker deben poder comunicarse entre sí y con la base de datos de la aplicación de Looker. Los puertos predeterminados se indican en Abre los puertos para que se comuniquen los nodos en esta página.

Balanceador de cargas

Para balancear la carga o redireccionar las solicitudes a los nodos disponibles, se requiere un balanceador de cargas o un servidor proxy (por ejemplo, NGINX o AWS ELB) para dirigir el tráfico a cada nodo de Looker. El balanceador de cargas controla las verificaciones de estado. En caso de falla de un nodo, el balanceador de cargas debe configurarse para redirigir el tráfico a los nodos en buen estado restantes.

Cuando elijas y configures el balanceador de cargas, asegúrate de que se pueda configurar para que funcione solo como capa 4. El ELB clásico de Amazon es un ejemplo de ello. Además, el balanceador de cargas debe tener un tiempo de espera largo (3,600 segundos) para evitar que se eliminen las consultas.

Sistema de archivos compartido

Debes usar un sistema de archivos compartido compatible con POSIX (como NFS, AWS EFS, Gluster, BeeGFS, Lustre o muchos otros). Looker usa el sistema de archivos compartido como un repositorio para varias partes de la información que usan todos los nodos del clúster.

Aplicación de Looker (ejecutable JAR)

Debes usar un archivo JAR de la aplicación de Looker que sea de Looker 3.56 o una versión posterior.

Looker recomienda encarecidamente que cada nodo de un clúster ejecute la misma versión de lanzamiento y parche de Looker, como se explica en Cómo iniciar Looker en los nodos en esta página.

Configura el clúster

Se requieren las siguientes tareas:

Instala Looker
Configura una base de datos de aplicaciones de MySQL
Configura el sistema de archivos compartido
Comparte el repositorio de claves SSH (según tu situación).
Abre los puertos para que se comuniquen los nodos
Cómo iniciar Looker en los nodos

Instala Looker

Asegúrate de tener instalado Looker en cada nodo con los archivos JAR de la aplicación de Looker y las instrucciones de la página de documentación Pasos para la instalación alojada por el cliente.

Cómo configurar una base de datos de aplicaciones de MySQL

Para una configuración de Looker en clúster, la base de datos de la aplicación debe ser una base de datos de MySQL. Si tienes una instancia de Looker existente no agrupada que usa HyperSQL para la base de datos de la aplicación, debes migrar los datos de la aplicación de los datos de HyperSQL a tu nueva base de datos de la aplicación de MySQL compartida.

Consulta la página de documentación Migración a MySQL para obtener información sobre cómo crear una copia de seguridad de Looker y, luego, migrar la base de datos de la aplicación de HyperSQL a MySQL.

Cómo configurar el sistema de archivos compartido

Solo los tipos de archivos específicos (archivos de modelos, claves de implementación, complementos y, posiblemente, archivos de manifiesto de la aplicación) pertenecen al sistema de archivos compartido. Para configurar el sistema de archivos compartido, haz lo siguiente:

En el servidor que almacenará el sistema de archivos compartido, verifica que tengas acceso a otra cuenta que pueda hacer su a la cuenta de usuario de Looker.
En el servidor del sistema de archivos compartido, accede a la cuenta de usuario de Looker.
Si Looker está en ejecución, cierra la configuración de Looker.
Si antes agrupabas los datos con secuencias de comandos de inotify de Linux, detén esas secuencias de comandos, quítalas de cron y bórralas.
Crea un recurso compartido de red y actívalo en cada nodo del clúster. Asegúrate de que esté configurado para que se monte automáticamente en cada nodo y de que el usuario de Looker pueda leer y escribir en él. En el siguiente ejemplo, el recurso compartido de red se llama /mnt/looker-share.
En un nodo, copia tus claves de implementación y mueve tus complementos y los directorios looker/models y looker/models-user-*, que almacenan tus archivos del modelo, a tu recurso compartido de red. Por ejemplo:
```
mv looker/models /mnt/looker-share/
mv looker/models-user-* /mnt/looker-share/
```
Nota: Tus claves de implementación deben copiarse en el almacenamiento compartido y en cada nodo del clúster.
Para cada nodo, agrega el parámetro de configuración --shared-storage-dir a LOOKERARGS. Especifica el recurso compartido de red, como se muestra en este ejemplo:
```
--shared-storage-dir /mnt/looker-share
```
LOOKERARGS se debe agregar a $HOME/looker/lookerstart.cfg para que la configuración no se vea afectada por las actualizaciones. Si tus LOOKERARGS no aparecen en ese archivo, es posible que alguien los haya agregado directamente al secuencia de comandos de shell $HOME/looker/looker.

Cada nodo del clúster debe escribir en un directorio /log único o, al menos, en un archivo de registro único.

Cómo compartir el repositorio de claves SSH

Estás creando un clúster de sistema de archivos compartido a partir de una configuración de Looker existente.
Tienes proyectos que se crearon en Looker 4.6 o versiones anteriores.

Configura el repositorio de claves SSH para que se comparta:

En el servidor de archivos compartido, crea un directorio llamado ssh-share. Por ejemplo: /mnt/looker-share/ssh-share.

Asegúrate de que el directorio ssh-share sea propiedad del usuario de Looker y de que los permisos sean 700. Además, asegúrate de que los directorios que se encuentran sobre el directorio ssh-share (como /mnt y /mnt/looker-share) no admitan la escritura grupal ni pública.
En un nodo, copia el contenido de $HOME/.ssh en el nuevo directorio ssh-share. Por ejemplo:

cp $HOME/.ssh/* /mnt/looker-share/ssh-share
Para cada nodo, haz una copia de seguridad del archivo SSH existente y crea un vínculo simbólico al directorio ssh-share. Por ejemplo:
```
cd $HOME
mv .ssh .ssh_bak
ln -s /mnt/looker-share/ssh-share .ssh
```
Asegúrate de realizar este paso para cada nodo.

Abre los puertos para que se comuniquen los nodos

Los nodos de Looker agrupados en clústeres se comunican entre sí a través de HTTPS con certificados autofirmados y un esquema de autenticación adicional basado en secretos rotativos en la base de datos de la aplicación.

Los puertos predeterminados que deben estar abiertos entre los nodos del clúster son 1551 y 61616. Estos puertos se pueden configurar con las marcas de inicio que se indican aquí. Te recomendamos que restrinjas el acceso a la red a estos puertos para permitir el tráfico solo entre los hosts del clúster.

Cómo iniciar Looker en los nodos

Reinicia el servidor en cada nodo con las marcas de inicio requeridas.

Marcas de inicio disponibles

En la siguiente tabla, se muestran las marcas de inicio disponibles, incluidas las que se requieren para iniciar un clúster o unirse a uno:

Marcar	¿Es obligatorio?	Valores	Objetivo
`--clustered`	Sí		Se agregó una marca para especificar que este nodo se ejecuta en modo agrupado.
`-H` o `--hostname`	Sí	`10.10.10.10`	Es el nombre de host que usan otros nodos para comunicarse con este, como la dirección IP del nodo o su nombre de host del sistema. Debe ser diferente de los nombres de host de todos los demás nodos del clúster.
`-n`	No	`1551`	Es el puerto para la comunicación entre nodos. El valor predeterminado es 1551. Todos los nodos deben usar el mismo número de puerto para la comunicación entre nodos.
`-q`	No	`61616`	Es el puerto para poner en cola los eventos de todo el clúster. El valor predeterminado es 61616.
`-d`	Sí	`/path/to/looker-db.yml`	Ruta de acceso al archivo que contiene las credenciales de la base de datos de la aplicación de Looker.
`--shared-storage-dir`	Sí	`/path/to/mounted/shared/storage`	La opción debe apuntar al directorio compartido que se configuró anteriormente en esta página y que contiene los directorios `looker/model` y `looker/models-user-*`.

Ejemplo de `LOOKERARGS` y especificación de credenciales de la base de datos

Coloca las marcas de inicio de Looker en un archivo lookerstart.cfg, ubicado en el mismo directorio que los archivos JAR de Looker.

Por ejemplo, podrías querer indicarle a Looker lo siguiente:

Para usar el archivo llamado looker-db.yml para sus credenciales de base de datos,
que es un nodo agrupado en clústeres
que los demás nodos del clúster deben comunicarse con este host en la dirección IP 10.10.10.10.

Especificarías lo siguiente:

LOOKERARGS="-d looker-db.yml --clustered -H 10.10.10.10"

El archivo looker-db.yml contendría las credenciales de la base de datos, como las siguientes:

host: your.db.hostname.com
username: db_user
database: looker
dialect: mysql
port: 3306
password: secretPassword

Además, si tu base de datos MySQL requiere una conexión SSL, el archivo looker-db.yml también requiere lo siguiente:

ssl: true

Si no quieres almacenar la configuración en el archivo looker-db.yml del disco, puedes configurar la variable de entorno LOOKER_DB para que contenga una lista de claves y valores para cada línea del archivo looker-db.yml. Por ejemplo:

export LOOKER_DB="dialect=mysql&host=localhost&username=root&password=&database=looker&port=3306"

Cómo encontrar tus claves de implementación SSH de Git

El lugar donde Looker almacena las claves de implementación SSH de Git depende de la versión en la que se creó el proyecto:

En el caso de los proyectos creados antes de Looker 4.8, las claves de implementación se almacenan en el directorio SSH integrado del servidor, ~/.ssh.
En el caso de los proyectos creados en Looker 4.8 o versiones posteriores, las claves de implementación se almacenan en un directorio controlado por Looker, ~/looker/deploy_keys/PROJECT_NAME.

Cómo modificar un clúster de Looker

Después de crear un clúster de Looker, puedes agregar o quitar nodos sin realizar cambios en los demás nodos agrupados.

Actualiza un clúster a una nueva versión de Looker

Las actualizaciones pueden implicar cambios de esquema en la base de datos interna de Looker que no serían compatibles con versiones anteriores de Looker. Existen dos métodos para actualizar Looker.

Método más seguro

Crea una copia de seguridad de la base de datos de la aplicación.
Detén todos los nodos del clúster.
Reemplaza los archivos JAR en cada servidor.
Inicia cada nodo de a uno.

Método más rápido

Para actualizar con este método más rápido, pero menos completo, haz lo siguiente:

Crea una réplica de la base de datos de la aplicación de Looker.
Inicia un clúster nuevo que apunte a la réplica.
Dirige el servidor proxy o el balanceador de cargas a los nodos nuevos, después de lo cual podrás detener los nodos anteriores.