Encripta el tráfico de red
Una práctica recomendada es encriptar el tráfico de red entre la aplicación de Looker y tu base de datos. Considera una de las opciones que se describen en la página de documentación Habilita el acceso seguro a la base de datos.
Crea un usuario de Looker
Looker se autentica en Databricks mediante tokens de acceso personal. Sigue la documentación de Databricks y crea un token de acceso personal para que un usuario de Databricks lo use en Looker.
Agrega permisos a este usuario con GRANT
.
Como mínimo, el usuario de Looker debe tener SELECT
y READ_METADATA
.
GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
Información del servidor
Sigue la documentación de Databricks para encontrar la ruta de HTTP para tu clúster de Databricks. En esta página, se denominará <YOUR_HTTP_PATH>
.
Configura tablas derivadas persistentes
Para utilizar tablas derivadas persistentes, crea una base de datos separada.
CREATE DATABASE <YOUR_SCRATCH_DATABASE>
Esto también requerirá que se otorguen permisos de usuario adicionales basados en escritura.
GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
Creando la conexión de Looker a tu base de datos
En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
Completa los detalles de la conexión. La mayoría de los parámetros de configuración son comunes en la mayoría de los dialectos de bases de datos. Consulta la página de documentación Cómo conectar Looker a tu base de datos para obtener más información. A continuación, se describen algunos de los parámetros de configuración:
- Nombre: Especifica el nombre de la conexión. Así es como harás referencia a la conexión en los proyectos de LookML.
- Dialecto: Especifica el dialecto Databricks.
- Host: Especifica el nombre de host.
- Puerto: especifica el puerto de la base de datos. El valor predeterminado es 443.
- Base de datos: Especifica el nombre de la base de datos. El valor predeterminado es
default
. - Nombre de usuario: Ingresa el valor
token
(no ingreses el correo electrónico del usuario de Databricks en este campo). - Password (Contraseña): Ingresa el token de acceso personal que creaste anteriormente.
- Habilitar PDT: Usa este botón de activación para habilitar tablas derivadas persistentes. Cuando las PDT están habilitadas, la ventana Connection muestra parámetros de configuración adicionales de PDT y la sección PDT Overrides.
- Temp Database: Ingresa la base de datos que deseas usar para almacenar las PDT.
- Cantidad máxima de conexiones del compilador de PDT: Especifica la cantidad de compilaciones de PDT simultáneas posibles en esta conexión. Si estableces este valor demasiado alto, es posible que se vean afectados los tiempos de las búsquedas. Para obtener más información, consulta la página de documentación Cómo conectar Looker a tu base de datos.
Parámetros adicionales de JDBC: Agrega cualquier parámetro de JDBC de Spark adicional.
Programa de mantenimiento de PDT y grupos de datos: Es una expresión
cron
que indica cuándo Looker debe verificar grupos de datos y tablas derivadas persistentes. Obtén más información sobre esta configuración en la documentación del Programa de mantenimiento de grupos de datos y PDT.SSL: marca esta opción para usar conexiones SSL.
Verificar SSL: Marca esta opción para aplicar una verificación estricta de certificados SSL.
Cantidad máxima de conexiones por nodo: Inicialmente, puedes dejar esta configuración con el valor predeterminado. Obtén más información sobre este parámetro de configuración en la sección Cantidad máxima de conexiones por nodo de la página de documentación Cómo conectar Looker a tu base de datos.
Tiempo de espera del grupo de conexiones: Inicialmente, puedes dejar esta configuración con el valor predeterminado. Obtén más información sobre este parámetro de configuración en la sección Tiempo de espera del grupo de conexiones de la página de documentación Conecta Looker a tu base de datos.
Precaché del Ejecutor de SQL: Para que el Ejecutor de SQL no cargue previamente la información de la tabla y la cargue solo cuando una tabla esté seleccionada, desmarca esta opción. Obtén más información sobre este parámetro de configuración en la sección Precache de SQL Runner de la página de documentación Conecta Looker a tu base de datos.
Zona horaria de la base de datos: especifica la zona horaria de la base de datos. Deja este campo en blanco si no deseas que se realice la conversión de zona horaria. Consulta la página de documentación Usa la configuración de zona horaria para obtener más información.
Haz clic en Probar para probar la conexión y asegurarte de que esté configurada correctamente. Si ves la opción Can Connect, presiona Conectar. Esto ejecuta el resto de las pruebas de conexión para verificar que la cuenta de servicio se haya configurado correctamente y con los roles correspondientes. Consulta la página de documentación Prueba la conectividad de la base de datos para obtener información sobre la solución de problemas.
Funcionalidad de Looker con el catálogo de Databricks Unity
En el caso de las conexiones de Looker a una base de datos de Databricks con el catálogo de Unity habilitado, la mayoría de las funciones de Looker solo accederán a esquemas del catálogo predeterminado, como en los siguientes casos:
- Cuando generes un proyecto de LookML nuevo a partir del esquema de la base de datos, Looker creará los archivos del proyecto en función de las tablas del catálogo predeterminado de Unity Catalog.
- En el caso de proyectos existentes, cuando se usa el IDE de Looker para crear una vista a partir de una tabla, Looker puede crear archivos de vista solo de las tablas del catálogo predeterminado de Unity Catalog.
- Cuando usas el Ejecutor de SQL, puedes seleccionar solo esquemas del catálogo predeterminado del catálogo de Unity.
Compatibilidad de características
Para que Looker admita algunas funciones, el dialecto de la base de datos también debe admitirlas.
A partir de Looker 24.6, Databricks admite las siguientes funciones:
Atributo | ¿Es compatible? |
---|---|
Nivel de asistencia | Admitido |
Looker (Google Cloud Core) | Sí |
Agregados simétricos | Sí |
Tablas derivadas | Sí |
Tablas derivadas de SQL persistentes | Sí |
Tablas derivadas persistentes nativas | Sí |
Vistas estables | Sí |
Finalización de consultas | Sí |
Tablas dinámicas basadas en SQL | Sí |
Zonas horarias | Sí |
SSL | Sí |
Subtotales | Sí |
Parámetros adicionales de JDBC | Sí |
Distingue mayúsculas de minúsculas | Sí |
Tipo de ubicación | Sí |
Tipo de lista | Sí |
Percentil | Sí |
Percentil distinto | No |
Procesos de presentación del ejecutor de SQL | No |
Tabla de descripción del ejecutor de SQL | Sí |
Mostrar índices del ejecutor de SQL | No |
Selector de SQL 10 Select | Sí |
Recuento de ejecutores de SQL | Sí |
Explicación de SQL | Sí |
Credenciales de OAuth | No |
Comentarios de contexto | Sí |
Agrupación de conexiones | No |
Bocetos HLL | No |
Reconocimiento agregado | Sí |
PDT incrementales | Sí |
Milisegundos | Sí |
Microsegundos | Sí |
Vistas materializadas | No |
Recuento aproximado de valores distintos | No |