ネイティブ派生テーブルの作成

派生テーブルとは、クエリ結果をデータベース内の実際のテーブルのように使用できるクエリのことです。ネイティブ派生テーブルは、LookML 用語を使用して定義したクエリに基づいています。これは、SQL 用語を使用して定義したクエリに基づく SQL ベースの派生テーブルとは異なります。SQLベースの派生テーブルと比較すると、ネイティブ派生テーブルでは、データをモデル化するときの読みやすさと理解しやすさが向上します。 詳しくは、Looker の派生テーブルのドキュメント ページにあるネイティブ派生テーブルと SQL ベースの派生テーブルセクションをご覧ください。

ネイティブ派生テーブルと SQL ベースの派生テーブルはどちらも、ビューレベルで derived_table パラメータを使用して LookML で定義されます。ただし、ネイティブ派生テーブルでは、SQLクエリを作成する必要がありません。 代わりに、explore_source パラメータを使用して、派生テーブル、目的の列、その他の目的の特性のベースとなる Explore を指定します。

SQL Runner を使用して派生テーブルを作成するドキュメント ページに説明されている方法で、Looker で SQL Runner クエリから派生テーブル LookML を作成することもできます。

Exploreを使用したネイティブ派生テーブルの定義の開始

Exploreで開始すると、Lookerは大半の派生テーブルのLookMLを生成できます。 まずはExploreを作成し、派生テーブルに含めるすべてのフィールドを選択します。 その後、次の方法でネイティブ派生テーブルLookMLを生成します。

  1. [Explore アクション] の歯車アイコンを選択し、[Get LookML] を選択します。

  2. [派生テーブル] タブをクリックすると、Explore のネイティブ派生テーブルを作成するための LookML が表示されます。

  3. そのLookMLをコピーします。

生成されたLookMLをコピーしたら、ビューファイルにペーストします。

  1. Development Mode で、プロジェクト ファイルに移動します。

  2. Looker IDEのプロジェクトファイルリストの上部にある [+] をクリックし、[ビューを作成] を選択します。または、フォルダのメニューをクリックしてメニューから [ビューを作成] を選択し、フォルダ内にファイルを作成することもできます。

  3. 内容がわかりやすいビュー名を設定します。

  4. 必要に応じて、列名の変更、派生列の指定、フィルタの追加を行います。

Explore で type: countmeasure を使用する場合、可視化された値には、Count という単語ではなく、ビュー名でラベルが付けられます。混乱を避けるために、ビュー名は複数形で設定することを推奨します。ビジュアリゼーション設定の [シリーズ] で [完全なフィールド名を表示] を選択するか、ビュー名を複数形にした view_label を使用します。

LookMLでのネイティブ派生テーブルの定義

SQL とネイティブ LookML のいずれの方法で宣言された派生テーブルを使用する場合でも、derived_table クエリの出力は一連の列を含むテーブルになります。派生テーブルがSQLで記述される場合、出力列名はSQLクエリによって暗黙的に示されます。 たとえば、次の SQL クエリの出力列は、user_idlifetime_number_of_orderslifetime_customer_value です。

SELECT
  user_id
  , COUNT(DISTINCT order_id) as lifetime_number_of_orders
  , SUM(sale_price) as lifetime_customer_value
FROM order_items
GROUP BY 1

Lookerでは、クエリはExploreに基づき、メジャーフィールドとディメンションフィールドが含まれます。また、適用可能なフィルタも追加され、ソート順を指定することもできます。 ネイティブ派生テーブルには、これらすべての要素に加え、その列の出力名が含まれます。

以下の簡単な例では、user_idlifetime_customer_valuelifetime_number_of_orders の 3 つの列を含む派生テーブルを生成します。クエリを SQL で手動で記述する必要はありません。代わりに、Looker が指定の Explore order_items と Explore のフィールドの一部(order_items.user_idorder_items.total_revenueorder_items.order_count)を使用してクエリを作成します。

view: user_order_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: lifetime_number_of_orders {
        field: order_items.order_count
      }
      column: lifetime_customer_value {
        field: order_items.total_revenue
      }
    }
  }
  # Define the view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: lifetime_number_of_orders {
    type: number
  }
  dimension: lifetime_customer_value {
    type: number
  }
}

include ステートメントを使用した参照フィールドの有効化

ネイティブ派生テーブルのビューファイルで、explore_source パラメータを使用して Explore を指し、ネイティブ派生テーブルに必要な列やその他の特性を定義します。ネイティブ派生テーブルのビューファイル内から Explore を指すため、Explore の定義を含むファイルも含める必要があります。Exploreは通常、モデルファイル内で定義されますが、ネイティブ派生テーブルの場合は .explore.lkml ファイル拡張子を使用して Explore 用に別のファイルを作成する方が明確になります。詳しくは、Explore ファイルの作成のドキュメントを参照してください。この方法によって、ネイティブ派生テーブルのビューファイル内に、モデルファイル全体ではなく、単一のExploreファイルを含めることができます。 この場合、次のようになります。

  • ネイティブ派生テーブルのビューファイルには次のように Explore のファイルを含める必要があります。例:
    include: "/explores/order_items.explore.lkml"
  • Explore のファイルには次のように必要なビューファイルを含める必要があります。例:
    include: "/views/order_items.view.lkml"
    include: "/views/users.view.lkml"
  • モデルには次のように Explore のファイルを含める必要があります。例:
    include: "/explores/order_items.explore.lkml"

Explore ファイルは、自身を含んでいるモデルの接続をリッスンします。Explore ファイルの親モデルとは異なる接続を使って構成されているモデルに Explore ファイルを含める場合は、この点を考慮してください。Explore ファイルを含むモデルの接続スキーマが親モデルの接続スキーマと異なる場合、クエリエラーが発生する可能性があります。

ネイティブ派生テーブルの列の定義

上の例に示すように、column を使用して派生テーブルの出力列を指定します。

列名の指定

user_id 列については、列名は元の Explore 内の指定されたフィールド名に一致します。

元のExploreのフィールド名ではなく、出力テーブルの別の列名を使用したい場合もよくあることでしょう。 上の例では、order_items Explore を使用してユーザー別のライフタイム バリューの計算を生成しています。出力テーブルでは、total_revenue は実際には顧客の lifetime_customer_value です。

column 宣言では、入力フィールドとは異なる出力名の宣言に対応しています。たとえば、次のコードは、「フィールド order_items.total_revenue から lifetime_value という名前の出力列を作成します」ということを表しています。

column: lifetime_value {
  field: order_items.total_revenue
}

暗黙的な列名

field パラメータが列宣言から除外されている場合、<explore_name>.<field_name> とみなされます。たとえば、explore_source: order_items を指定した場合、

column: user_id {
  field: order_items.user_id
}

上記は次と等しくなります。

column: user_id {}

計算値の派生列の作成

derived_column パラメータを追加して、explore_source パラメータの Explore に存在しない列を指定できます。各 derived_column パラメータには、値の作成方法を指定する sql パラメータがあります。

sql 計算では、column パラメータで指定した任意の列を使用できます。派生列に集計関数を含めることはできませんが、テーブルの単一行に対して実行される計算を含めることができます。

次の例では、前の例と同じ派生テーブルを生成します。ただし、計算された average_customer_order 列が追加されます。この列は、ネイティブ派生テーブルの lifetime_customer_value 列と lifetime_number_of_orders 列から計算されています。

view: user_order_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: lifetime_number_of_orders {
        field: order_items.order_count
      }
      column: lifetime_customer_value {
        field: order_items.total_revenue
      }
      derived_column: average_customer_order {
        sql:  lifetime_customer_value / lifetime_number_of_orders ;;
      }
    }
  }
  # Define the view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: lifetime_number_of_orders {
    type: number
  }
  dimension: lifetime_customer_value {
    type: number
  }
  dimension: average_customer_order {
    type: number
  }
}

SQLウィンドウ関数の使用

一部のデータベース言語はウィンドウ関数をサポートしており、特にシーケンス番号、主キー、実行中の累積合計、その他の便利な複数行の計算を行うことができます。プライマリクエリが実行された後、derived_column 宣言が個別に実行されます。

データベースダイアレクトがウィンドウ関数に対応している場合には、ネイティブ派生テーブルでこれを使用できます。 目的のウィンドウ関数を含む sql パラメータで derived_column パラメータを作成します。値を参照する際には、ネイティブ派生テーブルで定義された列名を使用する必要があります。

次の例では、user_idorder_idcreated_time の各列を含むネイティブ派生テーブルを作成します。その後、SQL ROW_NUMBER() ウィンドウ関数を含む派生列を使用して、お客様の注文のシーケンス番号を含む列を計算します。

view: user_order_sequences {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: order_id {
        field: order_items.order_id
      }
      column: created_time {
        field: order_items.created_time
      }
      derived_column: user_sequence {
        sql: ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_time) ;;
      }
    }
  }
  dimension: order_id {
    hidden: yes
  }
  dimension: user_sequence {
    type: number
  }
}

ネイティブ派生テーブルへのフィルタの追加

過去 90 日間のお客様の値の派生テーブルを作成するとします。と同じ計算を行いますが、過去 90 日間の購入のみを含めます。

過去 90 日間のトランザクションをフィルタするフィルタを derived_table に追加するだけです。派生テーブルの filters パラメータは、フィルタされたメジャーの作成に使用するものと同じ構文を使用します。

view: user_90_day_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: number_of_orders_90_day {
        field: order_items.order_count
      }
      column: customer_value_90_day {
        field: order_items.total_revenue
      }
      filters: [order_items.created_date: "90 days"]
    }
  }
  # Add define view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: number_of_orders_90_day {
    type: number
  }
  dimension: customer_value_90_day {
    type: number
  }
}

Looker が派生テーブルの SQL を書き込むと、フィルタが WHERE 句に追加されます。

また、explore_sourcedev_filters サブパラメータを、ネイティブ派生テーブルとともに使用できます。dev_filters パラメータを使用すると、Looker が派生テーブルの開発バージョンにのみ適用するフィルタを指定できます。つまり、変更を行うたびにテーブル全体のビルドが完了するのを待たずに、フィルタリングされたバージョンのテーブルを繰り返してテストできます。

dev_filters パラメータは filters パラメータと連動して動作し、すべてのフィルタがテーブルの開発バージョンに適用されるようになります。dev_filtersfilters の両方が同じ列のフィルタを指定した場合、テーブルの開発バージョンには dev_filters が優先されます。

詳しくは、Development Mode での作業の高速化をご覧ください。

テンプレートフィルタの使用

bind_filters を使用して、テンプレート フィルタを含めることができます。

bind_filters: {
  to_field: users.created_date
  from_field: filtered_lookml_dt.filter_date
}

これは基本的に sql ブロックで次のコードを使用する場合と同じです。

{% condition filtered_lookml_dt.filter_date %} users.created_date {% endcondition %}

to_field は、フィルタの適用先のフィールドです。to_field は、基盤となる explore_source のフィールドである必要があります。

実行時にフィルタが存在する場合、from_field はフィルタの取得先のフィールドを指定します。

上記の bind_filters の例では、Looker は、filtered_lookml_dt.filter_date フィールドに適用されたフィルタを取得して users.created_date フィールドに適用します。

また、explore_sourcebind_all_filters サブパラメータを使用して、すべてのランタイム フィルタを Explore からネイティブ派生テーブルのサブクエリに渡すこともできます。詳細については、explore_source パラメータのドキュメント ページをご覧ください。

ネイティブ派生テーブルのソートおよび制限

派生テーブルは必要に応じて並べ替え制限が可能です。

sorts: [order_items.count: desc]
limit: 10

Exploreでは基礎となるソートと異なる順で行が表示される場合があるので注意してください。

ネイティブ派生テーブルの異なるタイムゾーンへの変換

timezone サブパラメータを使用して、ネイティブ派生テーブルのタイムゾーンを指定できます。

timezone: "America/Los_Angeles"

timezone サブパラメータを使用すると、ネイティブ派生テーブルのすべての時間ベースのデータが指定したタイムゾーンに変換されます。サポートされているタイムゾーンのリストについては、timezoneのドキュメント ページをご覧ください。

ネイティブ派生テーブルの定義でタイムゾーンを指定しない場合、ネイティブ派生テーブルは時間ベースのデータに対してタイムゾーン変換を行いません。代わりに、時間ベースのデータがデータベースのタイムゾーンのデフォルトとなります。

ネイティブ派生テーブルが永続的ではない場合、タイムゾーン値を "query_timezone" に設定して、現在実行中のクエリのタイムゾーンを自動的に使用できます。