Conexión predeterminada de BigQuery para Looker (núcleo de Google Cloud)

Looker (Google Cloud Core) debe estar conectado a una base de datos para habilitar la exploración de datos. Con la conexión de Quickstart de BigQuery, puedes crear una conexión predeterminada de BigQuery que pueda usar las Credenciales predeterminadas de la aplicación.

El mosaico de la guía de inicio rápido de BigQuery en una página principal.

Antes de comenzar

Para configurar una conexión de Quickstart de BigQuery, se requieren los siguientes permisos.

Permisos de Looker (Google Cloud Core)

Puedes ver y editar la página Conexión de inicio rápido de BigQuery en la página principal de tu instancia de Looker (Google Cloud Core) si tienes uno de los siguientes permisos:

Permisos de BigQuery

Las instancias de Looker (Google Cloud Core) pueden usar las credenciales predeterminadas de la aplicación (ADC) para autenticarse cuando configuras una conexión a una base de datos de SQL estándar de BigQuery. Cuando uses ADC, la conexión se autenticará en la base de datos con las credenciales de la cuenta de servicio del proyecto de Looker (Google Cloud Core).

Si la cuenta de servicio de Looker (núcleo de Google Cloud) aún no tiene roles de IAM en el proyecto que contiene el conjunto de datos de BigQuery, para otorgar roles de IAM nuevos al agente de servicio, deberás poder modificar las políticas de IAM en la consola de Google Cloud siguiendo los pasos que se indican a continuación.

  1. Accede a la consola de Google Cloud y navega al proyecto en el que quieras otorgar roles nuevos.
  2. Copia el identificador principal y agrégalo como principal en IAM.
  3. Asigna los dos siguientes roles a la principal que agregaste:
    • Service Usage Consumer
    • BigQuery Jobs User

Si tu instancia de Looker (Google Cloud Core) usa tablas derivadas persistentes con un conjunto de datos de BigQuery, también debes otorgarle el rol de IAM de Editor de datos de BigQuery a la cuenta de servicio de Looker (Google Cloud Core).

Cómo configurar una conexión de inicio rápido de BigQuery

La conexión de la Guía de inicio rápido de BigQuery contiene las siguientes secciones.

Visualiza la conexión

Los usuarios con los permisos correctos pueden ver y editar la conexión de la Guía de inicio rápido de BigQuery desde la página Página principal o la página Conexiones en el panel Administrador. En la página Conexiones, la conexión de la guía de inicio rápido de BigQuery aparece debajo del nombre Conexión predeterminada de BigQuery. En una instancia nueva, los campos ID del proyecto de almacenamiento e ID del proyecto de facturación se establecerán de forma predeterminada en Ninguno.

En la página principal, haz clic en el botón Revisar conexión para administrar la conexión. Para descartar la tarjeta de la página Página principal, haz clic en la x o activa la opción Inicio rápido de BigQuery en la barra lateral de Descubre.

La conexión de la guía de inicio rápido de BigQuery contiene las siguientes secciones.

ID del proyecto de facturación

El ID del proyecto funciona como identificador único para el proyecto de facturación de Google Cloud. El proyecto de facturación es el proyecto de Google Cloud que se factura, pero aún puedes consultar conjuntos de datos en un proyecto de Google Cloud diferente si tus desarrolladores de LookML especifican nombres de tablas con permisos completos en el parámetro sql_table_name de tus vistas, Exploraciones o uniones de LookML. Este es un campo obligatorio.

Para autenticarte en una base de datos de BigQuery con OAuth: En el caso de las conexiones de BigQuery, Looker (Google Cloud Core) puede usar automáticamente las credenciales de la aplicación de OAuth que usó tu administrador de Looker (Google Cloud Core) cuando creó la instancia. Consulta la página Crea credenciales de autorización de OAuth para una instancia de Looker (Google Cloud Core) para obtener más información.

Expande la sección Detalles del estado para probar la configuración de tu conexión.

Conjunto de datos principal

La página Conjunto de datos principal contiene la siguiente configuración.

ID del proyecto de almacenamiento

Si usas un proyecto que no es el de BigQuery en el que se encuentra Looker (núcleo de Google Cloud), ingresa el ID del proyecto de almacenamiento. Este es un campo obligatorio.

Para encontrar el ID de tu proyecto de almacenamiento, sigue estos pasos:

  1. Abra la consola de Google Cloud.
  2. En la lista de proyectos, selecciona Todos. Se muestran los nombres y los IDs de todos los proyectos de los que eres miembro.
  3. Copia el ID del proyecto de almacenamiento del proyecto que contiene los datos que deseas conectar a Looker (Google Cloud Core).

Conjunto de datos principal

El conjunto de datos principal es donde BigQuery buscará tablas si no se especifica su ubicación en el texto de la consulta en SQL. Ten en cuenta que las consultas de Looker (núcleo de Google Cloud) pueden hacer referencia a tablas de cualquier proyecto o conjunto de datos, siempre y cuando las consultas usen nombres de tabla con alcance completo con el formato project_id.dataset_name.table_name. El agente de servicio de Looker (Google Cloud Core) también necesitará los permisos de IAM adecuados para acceder a las tablas de esa ubicación. Este campo es obligatorio.

Para obtener más información sobre los conjuntos de datos, consulta la página de documentación Conecta Looker a BigQuery.

Expande la sección Detalles del estado para probar la configuración de tu conexión.

Configuración opcional

La sección Optional Settings contiene las siguientes opciones:

  • Cantidad máxima de conexiones por nodo: Es la cantidad máxima de conexiones a la base de datos que se permiten a la vez. Nota: Este parámetro de configuración se aplica a cada nodo de la implementación de Looker (Google Cloud Core). El valor debe estar entre 5 y 100, y se puede dejar en el valor predeterminado inicialmente. Obtén más información sobre este parámetro de configuración en la sección Max connections per node de la página de documentación Cómo conectar Looker a tu base de datos.

  • Tiempo de espera del grupo de conexiones: Es la cantidad de segundos que esperará una consulta antes de que se agote el tiempo de espera del grupo de conexiones. Se puede dejar con el valor predeterminado al principio. Obtén más información sobre este parámetro de configuración en la sección Tiempo de espera del grupo de conexiones de la página de documentación Conecta Looker a tu base de datos.

  • Parámetros de JDBC adicionales: Agrega cualquier parámetro de JDBC adicional, como etiquetas de BigQuery (consulta la sección Etiquetas de trabajo y comentarios de contexto para conexiones de BigQuery en esta página para obtener más información).

  • Programa de mantenimiento: Expresión de cron que indica la frecuencia máxima de las comprobaciones de activación de grupos de datos y el mantenimiento de PDT. Obtén más información sobre esta configuración en la documentación del Programa de mantenimiento de grupos de datos y PDT.

  • SSL: Elige si deseas usar la encriptación SSL para proteger los datos a medida que pasan entre Looker (núcleo de Google Cloud) y tu base de datos. SSL es solo una opción que se puede usar para proteger tus datos. En la página de documentación Habilita el acceso seguro a la base de datos, se describen otras opciones seguras.

  • Verificar SSL: Elige si deseas solicitar la verificación del certificado SSL que usa la conexión. Obtén más información sobre este parámetro de configuración en la sección Verificar SSL de la página de documentación Conecta Looker a tu base de datos.

  • Almacena previamente en caché las tablas y las columnas: En el Ejecutor de SQL, toda la información de la tabla se precarga en cuanto seleccionas una conexión y un esquema. Esto permite que SQL Runner muestre rápidamente las columnas de la tabla en cuanto haces clic en el nombre de una tabla. Sin embargo, para las conexiones y los esquemas con muchas tablas o con tablas muy grandes, es posible que no quieras que SQL Runner cargue previamente toda la información.

  • Recupera y almacena en caché el esquema: Para algunas funciones de escritura de SQL, como el conocimiento agregado, Looker (núcleo de Google Cloud) usa el esquema de información de tu base de datos para optimizar la escritura de SQL. Obtén más información sobre este parámetro de configuración en la sección Esquema de recuperación de información para escribir en SQL de la página de documentación Conecta Looker a tu base de datos.

  • Habilitar PDT: Activa el botón de activación Habilitar PDT para habilitar tablas derivadas persistentes. Cuando se habilitan los PDT, la ventana Configuración opcional muestra campos de PDT adicionales y la sección Anulaciones de PDT.

  • Temp database: Ingresa el conjunto de datos en BigQuery en el que Looker (Google Cloud Core) creará tablas derivadas persistentes. Debes configurar este conjunto de datos con anticipación, con los permisos de escritura adecuados. Este campo es obligatorio para usar las PDT.

  • Cantidad máxima de conexiones del compilador de PDT: El parámetro de configuración Cantidad máxima de conexiones del compilador de PDT tiene el valor predeterminado 1, pero se puede establecer hasta en 10. Sin embargo, el valor no puede ser superior al valor establecido en Conexiones máximas por nodo. Obtén más información sobre este parámetro de configuración en la sección Cantidad máxima de conexiones del compilador de PDT de la página de documentación Cómo conectar Looker a tu base de datos. Establece este valor con cuidado. Si el valor es demasiado alto, es posible que sobrecargues la base de datos. Si el valor es bajo, las PDT de larga duración o las tablas agregadas pueden retrasar la creación de otras tablas persistentes o ralentizar otras consultas en la conexión.

  • Retry failed PDT builds: El botón de activación Retry failed PDT builds configura la forma en que el regenerador de Looker (núcleo de Google Cloud) intenta volver a compilar las tablas persistentes activadas que fallaron en el ciclo de regenerador anterior. Obtén más información sobre este parámetro de configuración en la sección Retry failed PDT builds de la página de documentación Cómo conectar Looker a tu base de datos.

  • Control de la API de PDT: El botón de activación Control de la API de PDT determina si se pueden usar las llamadas a la API de start_pdt_build, check_pdt_build y stop_pdt_build para esta conexión. Cuando se inhabilita el botón de activación Control de API de PDT, estas llamadas a la API fallarán cuando hagan referencia a PDT en esta conexión.

  • Anulaciones de PDT: Si tu base de datos admite tablas derivadas persistentes y activaste el botón de activación Habilitar PDT en la configuración de la conexión, Looker (Google Cloud Core) muestra la sección Anulaciones de PDT. En la sección Anulaciones de PDT, puedes ingresar parámetros de JDBC separados (host, puerto, base de datos, nombre de usuario, contraseña, esquema, parámetros adicionales y sentencias posteriores a la conexión) que son específicos de los procesos de PDT. Obtén más información sobre este parámetro de configuración en la sección Anulaciones de PDT de la página de documentación Cómo conectar Looker a tu base de datos.

  • Zona horaria de la base de datos: Es la zona horaria en la que tu base de datos almacena información basada en el tiempo. Looker (Google Cloud Core) debe saber esto para poder convertir valores de tiempo para los usuarios, lo que facilita la comprensión y el uso de datos basados en el tiempo. Consulta la página de documentación Cómo usar la configuración de zona horaria para obtener más información.

  • Zona horaria de la consulta: La opción Zona horaria de la consulta solo se muestra si inhabilitaste Zonas horarias específicas del usuario. Consulta la página de documentación Cómo utilizar la configuración de zona horaria para obtener más información.

Expande la sección Status Details para probar la configuración de tu conexión.

Revisar

Revisa y modifica los detalles de la conexión que ingresaste en las secciones anteriores en la sección Revisar.

Expande la sección Detalles del estado para probar la configuración de tu conexión. Haz clic en el ícono de edición junto a cada sección para volver a ella y cambiar la configuración.

Cómo guardar y probar la conexión

Haz clic en el botón Guardar para guardar los cambios realizados en la conexión de inicio rápido de BigQuery.

Puedes probar tu configuración de conexión desde algunos lugares en la IU de Looker (Google Cloud Core):

  • Expande la sección Detalles del estado en la parte inferior de cualquiera de las páginas de conexión de QuickStart y haz clic en Probar conexión.
  • En la página Página principal, expande la sección Detalles del estado en la parte inferior de la tarjeta de conexión de QuickStart y haz clic en Probar conexión.
  • En la Página de administrador de Conexiones, selecciona el botón Probar junto a la ficha de la conexión, como se describe en la página de documentación de Conexiones.

Una vez que ingreses la configuración de conexión, haz clic en Probar para verificar que la información sea correcta y que la base de datos pueda conectarse.

Si tu conexión no pasa una o más pruebas, estas son algunas opciones para solucionar el problema:

¿Qué sigue?