Ten en cuenta que estás viendo la documentación de Looker. Para obtener documentación de Looker Studio, visita https://support.google.com/looker-studio.

Apache Spark

Looker se conecta a Apache Spark a través de una conexión de JDBC al servidor de recursos de Spark.

Crea la conexión de Looker a tu base de datos

En la sección Administrador de Looker, seleccione Conexiones y, luego, haga clic en Agregar conexión.

Completa los detalles de la conexión. La mayoría de las opciones de configuración son comunes en la mayoría de los dialectos de las bases de datos. Consulta la página de documentación Conecta Looker a tu base de datos para obtener más información. Algunos de los parámetros de configuración se describen a continuación:

Nombre: Es el nombre de la conexión. Así es como se referirá a la conexión en el modelo LookML.
Dialect: Selecciona Apache Spark 1.5+, Apache Spark 2+ o Apache Spark 3+.
Host: El host del servidor de Thrift.
Puerto: El puerto del servidor de Thrift (10,000 de forma predeterminada)
Base de datos: Es el esquema o la base de datos predeterminados que se modelarán. Cuando no se especifica una base de datos para una tabla, se supone que es así.
Nombre de usuario: Es el usuario que autenticará Looker.
Contraseña: La contraseña opcional para el usuario de Looker.
Habilitar PDT: Usa este botón de activación para habilitar las tablas derivadas persistentes. Cuando las PDT están habilitadas, la ventana Connection muestra la configuración adicional de PDT y la sección Overrides PDT.
Base de datos temporal: Es un esquema o una base de datos temporales para almacenar PDT. Debe crearse de antemano, con una declaración como CREATE SCHEMA looker_scratch;.
Parámetros adicionales de JDBC: Agrega los parámetros adicionales de JDBC de Hive aquí, como los siguientes: ;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
SSL: Deje esta opción sin marcar.
Zona horaria de la base de datos: la zona horaria de los datos almacenados en Spark. Por lo general, se puede dejar en blanco o establecerse en UTC.
Query Time Zone: Es la zona horaria para mostrar los datos consultados en Looker.

Para verificar que la conexión se realice de forma correcta, haz clic en Probar. Consulta la página de documentación sobre cómo probar la conectividad de la base de datos para obtener información sobre la solución de problemas.

Para guardar esta configuración, haz clic en Conectar.

Compatibilidad de características

Para que Looker admita algunas funciones, tu dialecto de base de datos también debe admitirlas.

Apache Spark 1.5+

Apache Spark 1.5+ es compatible con las siguientes funciones a partir de Looker 23.8:

Atributo	¿Es compatible?
Nivel de asistencia	Integración
Looker (Google Cloud Core)	No
Agregaciones simétricas	Sí
Tablas derivadas	Sí
Tablas derivadas de SQL persistente	Sí
Tablas derivadas persistentes nativas	Sí
Vistas estables	Sí
Asesinato de consultas	Sí
Pivotes basados en SQL	Sí
Zonas horarias	Sí
SSL	Sí
Subtotales	Sí
Parámetros adicionales de JDBC	Sí
Distingue mayúsculas de minúsculas	Sí
Tipo de ubicación	Sí
Tipo de lista	Sí
Percentil	Sí
Percentil distintivo	No
Procesos de Show del ejecutor de SQL	No
Tabla de descripción del ejecutor de SQL	Sí
Índices de SQL Runner Show	Sí
Ejecutor de SQL Select 10	Sí
Recuento de ejecutores de SQL	Sí
Explicación de SQL	Sí
Credenciales de OAuth	No
Comentarios de contexto	Sí
Agrupación de conexiones	No
Bocetos de HLL	No
Reconocimiento global	Sí
PDT incrementales	No
Milisegundos	Sí
Microsegundos	Sí
Vistas materializadas	No
Distinto del recuento aproximado	No

Apache Spark 2.0

Apache Spark 2.0 admite las siguientes funciones a partir de Looker 23.8:

Atributo	¿Es compatible?
Nivel de asistencia	Admitido
Looker (Google Cloud Core)	No
Agregaciones simétricas	Sí
Tablas derivadas	Sí
Tablas derivadas de SQL persistente	Sí
Tablas derivadas persistentes nativas	Sí
Vistas estables	Sí
Asesinato de consultas	Sí
Pivotes basados en SQL	Sí
Zonas horarias	Sí
SSL	Sí
Subtotales	Sí
Parámetros adicionales de JDBC	Sí
Distingue mayúsculas de minúsculas	Sí
Tipo de ubicación	Sí
Tipo de lista	Sí
Percentil	Sí
Percentil distintivo	No
Procesos de Show del ejecutor de SQL	No
Tabla de descripción del ejecutor de SQL	Sí
Índices de SQL Runner Show	No
Ejecutor de SQL Select 10	Sí
Recuento de ejecutores de SQL	Sí
Explicación de SQL	Sí
Credenciales de OAuth	No
Comentarios de contexto	Sí
Agrupación de conexiones	No
Bocetos de HLL	No
Reconocimiento global	Sí
PDT incrementales	No
Milisegundos	Sí
Microsegundos	Sí
Vistas materializadas	No
Distinto del recuento aproximado	No

Apache Spark 3+

Apache Spark 3+ es compatible con las siguientes funciones a partir de Looker 23.8:

Atributo	¿Es compatible?
Nivel de asistencia	Admitido
Looker (Google Cloud Core)	Sí
Agregaciones simétricas	Sí
Tablas derivadas	Sí
Tablas derivadas de SQL persistente	Sí
Tablas derivadas persistentes nativas	Sí
Vistas estables	Sí
Asesinato de consultas	Sí
Pivotes basados en SQL	Sí
Zonas horarias	Sí
SSL	Sí
Subtotales	Sí
Parámetros adicionales de JDBC	Sí
Distingue mayúsculas de minúsculas	Sí
Tipo de ubicación	Sí
Tipo de lista	Sí
Percentil	Sí
Percentil distintivo	No
Procesos de Show del ejecutor de SQL	No
Tabla de descripción del ejecutor de SQL	Sí
Índices de SQL Runner Show	No
Ejecutor de SQL Select 10	Sí
Recuento de ejecutores de SQL	Sí
Explicación de SQL	Sí
Credenciales de OAuth	No
Comentarios de contexto	Sí
Agrupación de conexiones	No
Bocetos de HLL	No
Reconocimiento global	Sí
PDT incrementales	No
Milisegundos	Sí
Microsegundos	Sí
Vistas materializadas	No
Distinto del recuento aproximado	No

Próximos pasos

Después de crear la conexión, establece las opciones de autenticación.