APPROX_COUNT_DISTINCT

APPROX_COUNT_DISTINCT 函数用于统计字段中的大致唯一项数。

APPROX_COUNT_DISTINCT is only available when your data comes from a BigQuery data source. For other data source types, use COUNT_DISTINCT .

语法

APPROX_COUNT_DISTINCT( X )

参数

  • X - 包含要统计的项的字段或表达式。

APPROX_COUNT_DISTINCT 函数的运作方式

APPROX_COUNT_DISTINCT 函数接受一个参数,该参数可以是任何类型的指标、维度或表达式的名称。APPROX_COUNT_DISTINCT 会返回该字段或表达式中唯一项的大致数量。

在查询处理方面,APPROX_COUNT_DISTINCTCOUNT_DISTINCT 更高效,但返回的结果不太准确。如果您的数据集非常大,或者报告的性能比确切计数更重要,请考虑使用 APPROX_COUNT_DISTINCT。使用 APPROX_COUNT_DISTINCT 而非 COUNT_DISTINCT 还可以帮助您在使用 BigQuery 数据源时降低查询费用。

如需详细了解近似聚合的工作原理,请参阅 BigQuery 文档

示例

APPROX_COUNT_DISTINCT( Page ) - 统计“网页”维度中的大致唯一值数量。

APPROX_COUNT_DISTINCT 的限制

  • APPROX_COUNT_DISTINCT 函数仅适用于与 BigQuery 数据源搭配使用。仅限 Google 内部:APPROX_COUNT_DISTINCT 也适用于 #plx 数据源。
  • 对于不支持 APPROX_COUNT_DISTINCT 的数据源,APPROX_COUNT_DISTINCT 将像 COUNT_DISTINCT 一样运作。
  • 您无法将此函数应用于预聚合的指标(聚合类型为自动),也无法将其应用于其他聚合函数的结果表达式。例如,Google Analytics 数据源中的 APPROX_COUNT_DISTINCT(Sessions) 等公式会产生错误。