Cómo incorporar SQL y hacer referencia a objetos de LookML

Para escribir LookML potente, debes poder hacer referencia a dimensiones, medidas, vistas o tablas derivadas existentes, incluso si no están en el alcance actual. También debes hacer referencia a las columnas de la tabla subyacente y usar las llamadas a función de tu dialecto de base de datos para manipular esos valores.

Operador de sustitución ($)

El operador de sustitución, $, hace que el código de LookML sea más reutilizable y modular, lo que te permite hacer referencia a otras vistas y tablas derivadas, columnas en una tabla de SQL o dimensiones y medidas de LookML. Esto es bueno por dos razones. En primer lugar, es posible que ya hayas definido una dimensión o una medida realmente complicada, y no necesitarás volver a escribir toda la complejidad. En segundo lugar, si cambias algo en una dimensión o métrica, ese cambio se puede propagar a todo lo que depende de ella.

Existen varias formas de usar el operador de sustitución:

${TABLE}.column_name hace referencia a una columna de la tabla que está conectada a la vista en la que estás trabajando. Por ejemplo:

dimension: customer_id {
  type: number
  sql: ${TABLE}.customer_id ;;
}

${field_name} hace referencia a una dimensión o medición dentro de la vista en la que estás trabajando. Por ejemplo:

measure: total_population {
  type: sum
  sql: ${population} ;;
}

${view_name.field_name} hace referencia a una dimensión o medida de otra vista. Por ejemplo:

dimension: lifetime_orders {
  type: number
  sql: ${user_order_facts.lifetime_orders} ;;
}

${view_name.SQL_TABLE_NAME} hace referencia a otra vista o tabla derivada. Ten en cuenta que SQL_TABLE_NAME en esta referencia es una cadena literal; no es necesario que la reemplaces por nada. Por ejemplo:

explore: trips {
  view_label: "Long Trips"
  # This will ensure that we only see trips that are longer than average!
  sql_always_where: ${trips.trip_duration}>=(SELECT tripduration FROM ${average_trip_duration.SQL_TABLE_NAME});;
}

${view_name.SQL_TABLE_NAME} no funciona con el parámetro sql_trigger que se usa con datagroups.

Alcance y nombres

Puedes nombrar exploraciones, vistas, campos y conjuntos. Estos identificadores de Looker se escriben sin comillas.

Los campos y conjuntos de LookML tienen nombres completos y nombres cortos:

  • Los nombres completos tienen el formato <view>.<field-name | set-name>. El lado izquierdo indica el alcance, que es la vista que contiene el campo o el conjunto. En el lado derecho, se especifica el campo particular o el nombre del conjunto.
  • Los nombres cortos tienen el formato <field-name | set-name>, sin puntos de separación. Looker expande los nombres cortos en nombres completos usando el alcance en el que se usan.

A continuación, se muestra un ejemplo que muestra muchas formas de nombres y alcances. Este es un grupo de campos poco realista, pero se muestra para demostrar una variedad de expresiones de alcance posibles.

view: orders {                   # "orders" becomes the containing scope
  measure: count {               # short name, equivalent to orders.count
    type: count
  }
  dimension: customer_id {       # short name, equivalent to orders.customer_id
    type: number
    sql: ${TABLE}.customer_id ;;
  }
  dimension: customer_address {  # short name, equivalent to orders.customer_address
    sql: ${customer.address} ;;  # full name, references a field defined in the "customer" view
  }
  set: drill_fields {            # short name, equivalent to orders.drill_fields
    fields: [
      count,                     # short name, equivalent to orders.count
      customer.id                # full name, references a field defined in the "customer" view
    ]
  }
}

En la declaración dimension: customer_address, ten en cuenta que la vista subyacente del bloque SQL (customer) es diferente del alcance de la vista envolvente (orders). Esto puede ser útil cuando necesitas comparar campos entre dos vistas diferentes.

Cuando una vista (que denominaremos "vista A") se refiere a un campo definido en una vista diferente (la llamaremos "vista B"), hay algunos aspectos que debes tener en cuenta:

  1. El archivo de la vista B debe incluirse en el mismo modelo que la vista A, mediante el parámetro include.
  2. La vista B debe unirse a la vista A en una o más exploraciones. Consulta nuestra página Trabaja con uniones en LookML para obtener más información.

Dialecto de SQL

Looker admite muchos tipos de bases de datos, como MySQL, Postgres, Redshift, BigQuery, etcétera. Cada base de datos admite un conjunto de funciones ligeramente diferente con nombres de funciones diferentes, denominado dialecto de SQL.

LookML está diseñado para funcionar con todos los dialectos de SQL y no prefiere uno sobre el otro. Sin embargo, deberás incluir expresiones de código SQL (conocidas como bloques de SQL) en ciertos parámetros de LookML. Con estos parámetros, Looker pasa la expresión SQL directamente a tu base de datos, por lo que debes usar el dialecto de SQL que coincida con tu base de datos. Por ejemplo, si usas una función de SQL, esta debe ser una función que admita tu base de datos.

Bloques de SQL

Algunos parámetros de LookML requieren que proporciones expresiones SQL sin procesar para que Looker pueda comprender cómo recuperar datos de tu base de datos.

Los parámetros de LookML que comienzan con sql_ esperan una expresión SQL de alguna forma. Algunos ejemplos son sql_always_where, sql_on y sql_table_name. El parámetro más común de LookML para bloques de SQL es sql, que se usa en las definiciones de los campos de dimensión y medición para especificar la expresión en SQL que define la dimensión o la medida.

El código que especificas en un bloque de SQL puede ser tan simple como el nombre de un solo campo o tan complejo como una subselección correlacionada. El contenido puede ser bastante complejo y adaptarse a casi cualquier necesidad que puedas tener para expresar la lógica de consulta personalizada en SQL sin procesar. Ten en cuenta que el código que uses en los bloques de SQL debe coincidir con el dialecto SQL que usa la base de datos.

Ejemplos de bloques de SQL para dimensiones y mediciones

A continuación, se muestran ejemplos de bloques de SQL para dimensiones y mediciones. El operador de sustitución de LookML ($) puede hacer que estas declaraciones sql parezcan engañosamente distintas de SQL. Sin embargo, después de que se produce la sustitución, la cadena resultante es SQL pura, que Looker inserta en la cláusula SELECT de la consulta.

dimension: id {
  primary_key: yes
  sql: ${TABLE}.id ;;   # Specify the primary key, id
}
measure: average_cost {
  type: average
  value_format: "0.00"
  sql: ${order_items.cost} ;;   # Specify the field that you want to average
}
dimension: name {
  sql: CONCAT(${first_name}, ' ', ${last_name}) ;;
}
dimension: days_in_inventory {
  type: int
  sql: DATEDIFF(${sold_date}, ${created_date}) ;;
}

Como se muestra en las últimas dos dimensiones, los bloques de SQL pueden usar funciones compatibles con la base de datos subyacente (como las funciones CONCAT y DATEDIFF de MySQL en este ejemplo).

Ejemplo de bloque de SQL con una subselección correlacionada

Puedes colocar cualquier instrucción de SQL en el bloque SQL de un campo, incluida una subselección correlacionada. A continuación, se muestra un ejemplo:

view: customers {
  dimension: id {
    primary_key: yes
    sql: ${TABLE}.id ;;
  }
  dimension: first_order_id {
    sql: (SELECT MIN(id) FROM orders o WHERE o.customer_id=customers.id) ;;
         # correlated subselect to derive the value for "first_order_id"
  }
}

Ejemplo de bloque de SQL para tablas derivadas

Las tablas derivadas usan el bloque de SQL para especificar la consulta que deriva la tabla. A continuación, se muestra un ejemplo:

view: user_order_facts {
  derived_table: {
    sql:            # Get the number of orders for each user
      SELECT
        user_id
        , COUNT(*) as lifetime_orders
      FROM orders
      GROUP BY 1 ;;
  }
  # later, dimension declarations reference the derived column(s)

  dimension: lifetime_orders {
    type: number
  }
}

Referencias de tipos de campos de LookML

Cuando haces referencia a un campo LookML existente dentro de otro campo, puedes indicarle a Looker que trate el campo al que se hace referencia como un tipo de datos específico con dos puntos (::) seguidos del tipo deseado. Por ejemplo, si haces referencia a la dimensión orders.created_date dentro de otro campo, puedes usar la sintaxis ${orders.created_date::date} para asegurarte de que el campo created_date se trate como un campo de fecha en SQL que genere Looker, en lugar de convertirse en una cadena.

El tipo de datos que puedes usar en una referencia depende del tipo de datos del campo original al que te refieres. Por ejemplo, si haces referencia a un campo de cadena, el único tipo de datos que puedes especificar es ::string. Esta es la lista completa de referencias de tipos de campos permitidos que puedes usar para cada tipo de campo:

  • En una referencia a un campo de cadena, puedes usar ::string.
  • En una referencia a un campo numérico, puedes usar ::string y ::number.
  • En una referencia a un campo de fecha o de hora, puedes usar ::string, ::date y ::datetime.

    Las referencias que usan ::string y ::date muestran datos en la zona horaria de la consulta, mientras que las que usan ::datetime muestran datos en la zona horaria de la base de datos.
  • En una referencia a un campo de sí o no, puedes usar ::string, ::number y ::boolean.

    Las referencias de campo que usan el tipo ::boolean no están disponibles para los dialectos de bases de datos que no admiten el tipo de datos booleano.
  • En una referencia a un campo de ubicación, puedes usar ::latitude y ::longitude.

Usa referencias de tipo de campo de LookML con campos de fecha

Como ejemplo, supongamos que tienes una dimensión enrollment_month y una dimensión graduation_month, que se crearon dentro de grupos de dimensiones de type: time. En este ejemplo, la dimensión enrollment_month es producida por el siguiente grupo de dimensiones de type: time:


dimension_group: enrollment {
  type: time
  timeframes: [time, date, week, month, year, raw]
  sql: ${TABLE}.enrollment_date ;;
}

Del mismo modo, el siguiente grupo de dimensiones de type: time crea la dimensión graduation_month:


dimension_group: graduation {
  type: time
  timeframes: [time, date, week, month, year, raw]
  sql: ${TABLE}.graduation_date ;;
}

Con las dimensiones enrollment_month y graduation_month, puedes calcular cuántos meses o años transcurrieron entre la inscripción y la graduación de un estudiante creando un grupo de dimensiones de type: duration. Sin embargo, como algunos campos de fecha se transmiten como cadenas en el SQL que genera Looker, configurar las dimensiones enrollment_month y graduation_month como los valores de sql_start y sql_end puede generar un error.

Para evitar un error resultante de la conversión de estos campos de tiempo como cadenas, una opción es crear un grupo de dimensiones de type: duration, que haga referencia a los períodos de tiempo raw de los grupos de dimensiones enrollment y graduation en los parámetros sql_start y sql_end:


dimension_group: enrolled {
  type: duration
  intervals: [month, year]
  sql_start: ${enrollment_raw} ;;
  sql_end: ${graduation_raw} ;;
}

En la IU de Explorar, esto genera un grupo de dimensiones llamado Duración de la inscripción, con las dimensiones individuales Meses de inscripción y Años de inscripción.

Una alternativa más sencilla al uso del período raw en un grupo de dimensiones de type: duration es especificar el tipo de referencia ::date o ::datetime para los campos a los que se hace referencia en los parámetros sql_start y sql_end.


dimension_group: enrolled {
  type: duration
  intervals: [month, year]
  sql_start: ${enrollment_month::date} ;;
  sql_end: ${graduation_month::date} ;;
}

El código LookML de este ejemplo también crea un grupo de dimensiones Duración inscrita, pero usar la referencia ::date permite que se usen las dimensiones enrollment_month y graduation_month sin usar un período raw ni transmitirlas como cadenas con SQL.

Para ver un ejemplo adicional de cómo se pueden usar las referencias de tipo de campo de LookML para crear grupos de dimensiones personalizadas de type: duration, consulta la página de documentación del parámetro dimension_group.

Esta sintaxis no está disponible con medidas de type: list, a las que no se puede hacer referencia a partir de Looker 6.8.

Constantes de LookML

El parámetro constant te permite especificar una constante que puedes usar en todo un proyecto de LookML. Con las constantes de LookML, puedes definir un valor una vez y hacer referencia a él en cualquier parte de tu proyecto que acepte cadenas, lo que reduce la repetición en tu código de LookML.

Las constantes deben declararse dentro de un archivo de manifiesto del proyecto, y su valor debe ser una string. Por ejemplo, puedes definir una constante city con el valor "Okayama" de la siguiente manera:

constant: city {
  value: "Okayama"
}

Luego, se puede hacer referencia a la constante city en todo el proyecto con la sintaxis @{city}. Por ejemplo, puedes usar la constante city con el parámetro label en users Explorar:


explore: users {
  label: "@{city} Users"
}

Luego, Looker muestra Usuarios de Okayama en el menú Explorar y en el título de Explorar, en lugar de la opción predeterminada Usuarios.

Para obtener más información y ejemplos sobre cómo puedes usar constantes de LookML para escribir código reutilizable, consulta la página de documentación del parámetro constant.