Binning dans Looker

Lorsque vous êtes autorisé à créer des champs personnalisés, vous pouvez créer des groupes personnalisés ad hoc pour les dimensions sans utiliser de fonctions logiques dans les expressions Looker, ni développer de logique CASE WHEN dans les paramètres sql ou les champs type: case.
Vous pouvez également créer des bins personnalisés ad hoc pour les dimensions de type numérique sans avoir à utiliser de fonctions logiques dans les expressions Looker ni à développer des champs LookML type: tier lorsque vous êtes autorisé à créer des champs personnalisés.

Le binning peut être très utile pour créer des dimensions de regroupement personnalisées dans Looker.

Il existe trois façons de créer des buckets dans Looker:

  1. Utiliser le type dimension tier
  2. Utiliser le paramètre case
  3. Utiliser une instruction SQL CASE WHEN dans le paramètre SQL d'un champ LookML

Utiliser tier pour le binning

Pour créer des buckets d'entiers, nous pouvons simplement définir le type dimension sur tier:

dimension: users_lifetime_orders_tier {
  type: tier
  tiers: [0,1,2,5,10]
  sql: ${users_lifetime_orders} ;;
}

Le paramètre style vous permet de personnaliser l'affichage de vos niveaux. Les quatre options pour style sont les suivantes:

  1. classic
  2. integer
  3. interval
  4. relational

Exemple :

dimension: age_tier {
  type: tier
  tiers: [0,10,20,30,40,50,60,70,80]
  style: integer
  sql: ${age} ;;
}

Le paramètre style classic est la valeur par défaut et prend le format Tx[x,x], avec Tx indiquant le numéro de niveau et [x,x] indiquant la plage. L'image suivante est un tableau de données d'exploration avec le champ Nombre d'utilisateurs regroupé par Âge des utilisateurs:

La tranche d'âge la plus élevée dans le tableau de données est T02[10,20]. Elle indique un nombre de 808 utilisateurs âgés de 10 à 20 ans.

L'image suivante montre des exemples des autres options de paramètre style:

  • interval : au format [x,x], qui indique la valeur la plus faible et la valeur la plus élevée d'un niveau.
  • integer : au format x to x, qui indique la valeur la plus faible et la valeur la plus élevée d'un niveau.
  • relational : au format >= x and <x, qui indique qu'une valeur est supérieure ou égale à la valeur de niveau la plus basse et inférieure à la valeur de niveau le plus élevée.

Éléments à prendre en compte

L'utilisation de tier conjointement avec le remplissage des dimensions peut entraîner des buckets de niveau inattendus.

Par exemple, une dimension type: tier, Tranche d'âge, affiche les ensembles de niveaux pour Inférieur à 0 et 0 à 9 lorsque le remplissage de la dimension est activé, bien que les données n'incluent pas de valeurs d'âge pour ces ensembles:

Lorsque le remplissage des dimensions est désactivé pour la tranche d'âge, les ensembles reflètent plus précisément les valeurs d'âge disponibles dans les données, en commençant par l'ensemble 10 à 19:

Pour activer ou désactiver le remplissage des dimensions, pointez sur le nom de la dimension dans l'exploration, cliquez sur l'icône en forme de roue dentée au niveau du champ, puis sélectionnez Supprimer les valeurs de niveau renseignées pour la désactiver ou Remplir les valeurs de niveau manquantes pour l'activer.

Pour en savoir plus sur Looker tiers, consultez la page de documentation Types de dimensions, de filtres et de paramètres.

Utiliser case pour le binning

Le paramètre case vous permet de créer des buckets avec un nom personnalisé et un tri personnalisé. Le paramètre case est recommandé pour un ensemble fixe de buckets, car il permet de contrôler la façon dont les valeurs sont présentées, ordonnées et utilisées dans les filtres et les visualisations de l'interface utilisateur. Par exemple, avec case, un utilisateur pourra sélectionner uniquement les valeurs de bucket définies dans un filtre.

Pour créer des buckets avec case, vous pouvez définir une dimension, comme un bucket pour les montants des commandes:

  dimension: order_amount_bucket {
    case: {
      when: {
        sql: ${order_amount} <= 50;;
        label: "Small"
      }
      when: {
        sql: ${order_amount} > 50 AND ${order_amount} <= 150;;
        label: "Medium"
      }
      when: {
        sql: ${order_amount} > 150;;
        label: "Large"
      }
      else:"Unknown"
    }
  }

Le paramètre case trie généralement les valeurs dans l'ordre dans lequel les buckets sont listés. Pour la dimension order_amount_bucket, l'ordre des buckets est Petit, Moyen et Grand:

Si vous souhaitez effectuer un tri alphanumérique, ajoutez le paramètre alpha_sort à la dimension, comme suit:

  dimension: order_amount_bucket {
    alpha_sort: yes
    case: {
      when: {
        sql: ${order_amount} <= 50;;
        label: "Small"
      }
      when: {
        sql: ${order_amount} > 50 AND ${order_amount} <= 150;;
        label: "Medium"
      }
      when: {
        sql: ${order_amount} > 150;;
        label: "Large"
      }
      else:"Unknown"
    }
  }

Pour les dimensions dont la sortie doit comporter de nombreuses valeurs distinctes (vous devrez définir chaque sortie avec une instruction WHEN ou ELSE), ou lorsque vous souhaitez implémenter une instruction ELSE plus complexe, nous vous recommandons d'utiliser un CASE WHEN SQL, décrit dans la section suivante.

Pour en savoir plus sur le paramètre case, consultez la page de documentation Paramètres de champ.

Utiliser SQL CASE WHEN pour le binning

Il est recommandé d'utiliser une instruction SQL CASE WHEN pour des binnings plus complexes ou pour implémenter une instruction ELSE plus nuancée.

Par exemple, vous pouvez utiliser différentes méthodes de binning en fonction de la destination d'une commande. Vous pouvez utiliser une instruction SQL CASE WHEN pour créer une dimension de bucket composée, où l'instruction THEN renvoie des dimensions plutôt que des chaînes:

dimension: compound_buckets {
  sql:
    CASE
      WHEN ${orders.destination} = 'US' THEN ${us_buckets}
      WHEN ${orders.destination} = 'CA' THEN ${canada_buckets}
    ELSE ${intl_buckets}
    END ;;
}