APPROX_COUNT_DISTINCT
APPROX_COUNT_DISTINCT 函数用于计算字段中唯一项的大致数量。
语法
APPROX_COUNT_DISTINCT(X)
参数
field_expression- 包含要统计的项目数的字段或表达式。
APPROX_COUNT_DISTINCT 函数的运作方式
APPROX_COUNT_DISTINCT 函数接受一个参数,该参数可以是指标、维度或任何类型的表达式的名称。APPROX_COUNT_DISTINCT 返回相应字段或表达式中唯一项的大致数量。
在查询处理方面,APPROX_COUNT_DISTINCT 比 COUNT_DISTINCT 更高效,但返回的结果不太精确。如果您的数据集非常大,或者报告的性能比确切的计数更重要,请考虑使用 APPROX_COUNT_DISTINCT。使用 APPROX_COUNT_DISTINCT 而不是 COUNT_DISTINCT 也有助于在使用 BigQuery 数据源时降低查询费用。
如需深入了解近似聚合的工作原理,请参阅 BigQuery 文档。
示例
APPROX_COUNT_DISTINCT(Page)- 统计网页维度中唯一值的大致数量。
APPROX_COUNT_DISTINCT 的限制
APPROX_COUNT_DISTINCT函数仅在与 BigQuery 数据源搭配使用时可用。对于不支持
APPROX_COUNT_DISTINCT的数据源,APPROX_COUNT_DISTINCT的行为将与COUNT_DISTINCT类似。您无法将此函数应用于预先聚合的指标(聚合类型为 自动),也无法应用于作为其他聚合函数结果的表达式。例如,Google Analytics 数据源中的
APPROX_COUNT_DISTINCT(Sessions)等公式会产生错误。