En esta página, se incluye información para conectar Looker a Apache Spark 3.
Looker se conecta a Apache Spark 3 y versiones posteriores a través de una conexión JDBC al servidor Spark Thrift.
Encripta el tráfico de red
Se recomienda encriptar el tráfico de red entre la aplicación de Looker y tu base de datos. Considera una de las opciones que se describen en la página de documentación Habilita el acceso seguro a la base de datos.
Cómo crear la conexión de Looker a tu base de datos
En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
Completa los detalles de la conexión. La mayoría de los parámetros de configuración son comunes en la mayoría de los dialectos de bases de datos. Consulta la página de documentación Cómo conectar Looker a tu base de datos para obtener información. A continuación, se describen algunos de los parámetros de configuración:
- Nombre: Es el nombre de la conexión. Así es como se hará referencia a la conexión en el modelo de LookML.
- Dialecto: Selecciona Apache Spark 3 y versiones posteriores.
- Host: Es el host del servidor Thrift.
- Puerto: Es el puerto del servidor Thrift (10000 de forma predeterminada).
- Base de datos: Es el esquema o la base de datos predeterminados que se modelarán. Cuando no se especifica una base de datos para una tabla, se supone que es esta.
- Nombre de usuario: Es el usuario con el que Looker se autenticará.
- Contraseña: Es la contraseña opcional para el usuario de Looker.
- Habilitar PDT: Usa este botón de activación para habilitar las tablas derivadas persistentes. Cuando se habilitan los PDT, la ventana Connection muestra la configuración adicional de PDT y la sección PDT Overrides.
- Base de datos temporal: Es un esquema o una base de datos temporal para almacenar PDT. Se debe crear de antemano, con una sentencia como
CREATE SCHEMA looker_scratch;
. - Parámetros adicionales de JDBC: Agrega aquí cualquier parámetro adicional de JDBC de Hive, como los siguientes:
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL: No marques esta opción.
- Zona horaria de la base de datos: Es la zona horaria de los datos almacenados en Spark. Por lo general, se puede dejar en blanco o configurar en UTC.
- Zona horaria de la consulta: Es la zona horaria para mostrar los datos consultados en Looker.
Para verificar que la conexión se haya establecido correctamente, haz clic en Probar. Consulta la página de documentación Cómo probar la conectividad de la base de datos para obtener información sobre la solución de problemas.
Para guardar esta configuración, haz clic en Conectar.
Compatibilidad de características
Para que Looker admita algunas funciones, el dialecto de tu base de datos también debe admitirlas.
Apache Spark 3 y versiones posteriores
Apache Spark 3 y versiones posteriores admiten las siguientes funciones a partir de Looker 24.20:
Atributo | ¿Es compatible? |
---|---|
Nivel de asistencia | Admitido |
Looker (Google Cloud Core) | Sí |
Agregaciones simétricas | Sí |
Tablas derivadas | Sí |
Tablas derivadas de SQL persistentes | Sí |
Tablas derivadas persistentes nativas | Sí |
Vistas estables | Sí |
Eliminación de consultas | Sí |
Pivotes basados en SQL | Sí |
Zonas horarias | Sí |
SSL | Sí |
Subtotales | Sí |
Parámetros adicionales de JDBC | Sí |
Distingue mayúsculas de minúsculas | Sí |
Tipo de ubicación | Sí |
Tipo de lista | Sí |
Percentil | Sí |
Percentil de valores distintos | No |
Cómo mostrar procesos en el Ejecutor de SQL | No |
Tabla de descripción de SQL Runner | Sí |
Índices de Show de SQL Runner | No |
SQL Runner Select 10 | Sí |
Cantidad de Ejecutor de SQL | Sí |
Explicación de SQL | Sí |
Credenciales de OAuth | No |
Comentarios contextuales | Sí |
Agrupación de conexiones | No |
Esbozos de HLL | No |
Aggregate Awareness | Sí |
PDT incrementales | No |
Milisegundos | Sí |
Microsegundos | Sí |
Vistas materializadas | No |
Distinción de recuento aproximado | No |
Próximos pasos
Después de crear la conexión, establece las opciones de autenticación.