您正在查看 Looker 22.16 的文档。最新的文档可在此处找到。

创建原生派生表

派生表是一种查询，其结果就像是在数据库中使用物理表一样。原生派生表基于您使用 LookML 术语定义的查询。这与基于 SQL 的派生表不同，后者基于您使用 SQL 术语定义的查询。与基于 SQL 的派生表相比，在为数据建模时，原生派生表更易于阅读和理解。如需了解详情，请参阅 Looker 中的派生表文档页面的原生派生表和基于 SQL 的派生表部分。

原生和基于 SQL 的派生表在视图级别使用 derived_table 参数在 LookML 中定义。不过，对于原生派生表，您无需创建 SQL 查询。不过，您可以使用 explore_source 参数来指定派生表格所依据的“探索”，以及所需的列和其他特征。

您还可以让 Looker 根据 SQL Runner 查询创建派生表 LookML，如使用 SQL Runner 创建派生表文档页面中所述。

使用“探索”功能开始定义原生派生表

从探索开始，Looker 可以为所有或大多数派生表生成 LookML。只需创建“探索”功能并选择要在派生表格中包含的所有字段。然后，生成原生派生表 LookML：

点击“探索”的齿轮菜单，然后选择获取 LookML。
点击 Derived Table 标签页，查看用于为探索创建原生派生表的 LookML。
复制 LookML。

现在，您已复制生成的 LookML，请将其粘贴到视图文件中：

在开发模式中，转到项目文件。
在 Looker IDE 中，点击项目文件列表顶部的 +，然后选择 Create View。或者，点击文件夹的菜单，然后从菜单中选择创建视图，在该文件夹中创建文件。
将视图名称设置为有意义的名称。
（可选）更改列名称、指定派生列和添加过滤条件。

当您在探索中使用 type: count 的衡量方法时，可视化图表会使用视图名称（而不是单词 Count）来标记结果值。为避免混淆，我们建议将视图名称复数，在可视化设置中选择系列下的显示完整字段名称，或使用 view_label 及视图名称的复数形式。

在 LookML 中定义原生派生表

无论您使用 SQL 中声明的派生表还是原生 LookML，derived_table&s 查询的输出都是一个包含一组列的表。如果派生表以 SQL 表示，则 SQL 查询会暗示输出列名称。例如，以下 SQL 查询将包含输出列 user_id、lifetime_number_of_orders 和 lifetime_customer_value：

SELECT
  user_id
  , COUNT(DISTINCT order_id) as lifetime_number_of_orders
  , SUM(sale_price) as lifetime_customer_value
FROM order_items
GROUP BY 1

在 Looker 中，查询基于“探索”，包括测量值和维度字段，添加任何适用的过滤条件，还可以指定排序顺序。原生派生表包含所有这些元素以及列的输出名称。

下面的简单示例会生成一个包含三列的派生表：user_id、lifetime_customer_value 和 lifetime_number_of_orders。您无需使用 SQL 手动编写查询 - Looker 会使用指定的“探索”order_items 和其中一些“探索”字段（order_items.user_id、order_items.total_revenue 和 order_items.order_count）为您创建查询。

view: user_order_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: lifetime_number_of_orders {
        field: order_items.order_count
      }
      column: lifetime_customer_value {
        field: order_items.total_revenue
      }
    }
  }
  # Define the view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: lifetime_number_of_orders {
    type: number
  }
  dimension: lifetime_customer_value {
    type: number
  }
}

使用 `include` 语句启用引用字段

在原生派生表的视图文件中，您可以使用 explore_source 参数来指向“探索”，并为原生派生表定义所需的列和其他所需的特征。由于您是在原生派生表的视图文件中指向“探索”，因此您还必须包含包含“探索”定义的文件。探索通常在模型文件内定义，但对于原生派生表，使用 .explore.lkml 文件扩展名为探索创建单独的文件会更加简洁，如创建探索文件文档中所述。这样，您就可以在原生派生表视图文件中添加一个探索文件，而非整个模型文件。在这种情况下：

原生派生表的视图文件应包含探索文件。例如：
include: "/explores/order_items.explore.lkml"
“探索”文件应包含所需的视图文件。例如：
include: "/views/order_items.view.lkml"
include: "/views/users.view.lkml"
模型应包含“探索”文件。例如：
include: "/explores/order_items.explore.lkml"

探索文件将监听其所属的模型所属的连接。当您在探索时使用的文件配置不同于“探索”文件的父级模型的连接时，请考虑这一点。如果包含模型的连接架构与父模型的连接架构不同，则可能会导致查询错误。

定义原生派生表列

如上面的示例所示，您可以使用 column 指定派生表的输出列。

指定列名称

对于 user_id 列，列名称与原始“探索”中指定字段的名称一致。

通常，您需要输出表中的列名称与原始“探索”中的字段名称不同。在上面的示例中，我们使用 order_items Discover 计算了生命周期价值。在输出表中，total_revenue 实际上是客户的 lifetime_customer_value。

column 声明支持声明与输入字段不同的输出名称。例如，以下代码显示“从 order_items.total_revenue 字段输出名为 lifetime_value 的输出列”：

column: lifetime_value {
  field: order_items.total_revenue
}

暗示列名称

如果 field 参数未包含在列声明中，则系统会假定它为 <explore_name>.<field_name>。例如，如果您指定了 explore_source: order_items，则

column: user_id {
  field: order_items.user_id
}

等效于

column: user_id {}

为计算值创建派生列

您可以添加 derived_column 参数来指定“explore_source”的参数“探索”中不存在的列。每个 derived_column 参数都有一个 sql 参数，用于指定如何构造该值。

sql 计算可使用您使用 column 参数指定的任何列。派生列不能包含聚合函数，但可以对表中的一行执行计算。

以下示例生成的派生表与之前的示例相同，只不过它添加了一个计算出的 average_customer_order 列，该列是根据原生派生表的 lifetime_customer_value 和 lifetime_number_of_orders 列计算得出的。

view: user_order_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: lifetime_number_of_orders {
        field: order_items.order_count
      }
      column: lifetime_customer_value {
        field: order_items.total_revenue
      }
      derived_column: average_customer_order {
        sql:  lifetime_customer_value / lifetime_number_of_orders ;;
      }
    }
  }
  # Define the view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: lifetime_number_of_orders {
    type: number
  }
  dimension: lifetime_customer_value {
    type: number
  }
  dimension: average_customer_order {
    type: number
  }
}

使用 SQL 窗口函数

某些数据库方言支持窗口函数，尤其是用于创建序列号、主键、运行和累计总计以及其他有用的多行计算。执行主要查询后，任何 derived_column 声明都将在单独的卡券中执行。

如果您的数据库方言支持窗口函数，那么您可以在原生派生的表中使用这些函数。使用包含所需窗口函数的 sql 参数创建一个 derived_column 参数。引用值时，您应该使用原生派生表中定义的列名称。

以下示例会创建一个原生派生表，其中包含 user_id、order_id 和 created_time 列。然后，它会使用包含 SQL ROW_NUMBER() 窗口函数的派生列来计算包含客户订单序列号的列。

view: user_order_sequences {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: order_id {
        field: order_items.order_id
      }
      column: created_time {
        field: order_items.created_time
      }
      derived_column: user_sequence {
        sql: ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_time) ;;
      }
    }
  }
  dimension: order_id {
    hidden: yes
  }
  dimension: user_sequence {
    type: number
  }
}

向原生派生表添加过滤条件

假设我们想构建一个客户过去 90 天的衍生表。我们希望和上文所述的计算一样，但我们希望只纳入过去 90 天的购买交易。

我们刚刚为 derived_table 添加了一个过滤条件，用于过滤过去 90 天的交易。派生表格的 filters 参数使用的语法与创建过滤后的衡量结果时所使用的语法相同。

view: user_90_day_facts {
  derived_table: {
    explore_source: order_items {
      column: user_id {
        field: order_items.user_id
      }
      column: number_of_orders_90_day {
        field: order_items.order_count
      }
      column: customer_value_90_day {
        field: order_items.total_revenue
      }
      filters: [order_items.created_date: "90 days"]
    }
  }
  # Add define view's fields as desired
  dimension: user_id {
    hidden: yes
  }
  dimension: number_of_orders_90_day {
    type: number
  }
  dimension: customer_value_90_day {
    type: number
  }
}

当 Looker 为派生表编写 SQL 时，系统会向 WHERE 子句添加过滤条件。

此外，您还可以将 explore_source 的 dev_filters 子参数与原生派生表搭配使用。通过 dev_filters 参数，您可以指定 Looker 仅应用于派生表的开发版本的过滤条件。这意味着，您可以构建过滤后较小的表版本来迭代和测试，而无需等待每个更改完成后构建整个表。

dev_filters 参数可与 filters 参数结合使用，以便将所有过滤条件应用于表的开发版本。如果 dev_filters 和 filters 都为同一列指定了过滤条件，则 dev_filters 的优先级高于该表的开发版本。

如需了解详情，请参阅在开发模式下更快速地工作。

使用模板化过滤条件

您可以使用 bind_filters 添加模板化过滤条件：

bind_filters: {
  to_field: users.created_date
  from_field: filtered_lookml_dt.filter_date
}

这基本上与在 sql 代码块中使用以下代码相同：

{% condition filtered_lookml_dt.filter_date %} users.created_date {% endcondition %}

to_field 是应用过滤条件的字段。to_field 必须是底层 explore_source 中的字段。

from_field 指定从哪个字段获取过滤器（如果在运行时存在过滤器）。

在上面的 bind_filters 示例中，Looker 会将任何应用于 filtered_lookml_dt.filter_date 字段的过滤条件应用于 users.created_date 字段。

您还可以使用 explore_source 的 bind_all_filters 子参数将来自“探索”的所有运行时过滤条件传递到原生派生表子查询。如需了解详情，请参阅 explore_source 参数文档页面。

对原生派生表进行排序和限制

如果需要，您还可以对生成的表进行排序和限制：

sorts: [order_items.count: desc]
limit: 10

请注意，探索可能会以不同于底层排序的顺序显示行。

将原生派生表转换为不同时区

您可以使用 timezone 子参数指定原生派生表的时区：

timezone: "America/Los_Angeles"

当您使用 timezone 子参数时，原生派生表中的所有基于时间的数据都将转换为您指定的时区。如需查看受支持时区的列表，请参阅 timezone 值文档页面。

如果您未在原生派生表定义中指定时区，则原生派生表不会对基于时间的数据执行任何时区转换，而基于时间的数据将默认采用您的数据库时区。

如果原生派生表不是永久性的，您可以将时区值设置为 "query_timezone" 以自动使用当前正在运行的查询的时区。