APPROX_COUNT_DISTINCT

APPROX_COUNT_DISTINCT 함수는 필드 하나에 있는 고유 항목의 대략적인 개수를 집계합니다.

APPROX_COUNT_DISTINCT is only available when your data comes from a BigQuery data source. For other data source types, use COUNT_DISTINCT .

구문

APPROX_COUNT_DISTINCT( X )

매개변수

  • X - 계산할 항목을 포함하는 필드 또는 표현식

APPROX_COUNT_DISTINCT 함수의 작동 방식

APPROX_COUNT_DISTINCT 함수에서는 매개변수 하나를 사용하며, 측정항목, 측정기준 또는 모든 유형의 표현식에 해당하는 이름이 매개변수로 사용될 수 있습니다. APPROX_COUNT_DISTINCT 함수는 이러한 필드 또는 표현식에 있는 고유 항목의 대략적인 개수를 반환합니다.

APPROX_COUNT_DISTINCTCOUNT_DISTINCT보다 쿼리 처리 측면에서 더 효율적이지만 결과의 정확성이 떨어집니다. 데이터 세트가 너무 크거나 보고서의 실적이 정확한 수치보다 중요한 경우에는 APPROX_COUNT_DISTINCT 함수를 사용해 보세요. COUNT_DISTINCT 대신 APPROX_COUNT_DISTINCT를 사용하면 BigQuery 데이터 소스를 사용할 때 쿼리 비용을 줄일 수 있습니다.

근사치 집계가 작동하는 방식에 대한 자세한 설명은 BigQuery 문서를 참고하세요.

예시

APPROX_COUNT_DISTINCT( Page ) - 페이지 측정기준에 해당하는 고유한 값의 대략적인 개수를 집계합니다.

APPROX_COUNT_DISTINCT의 제한사항

  • APPROX_COUNT_DISTINCT 함수는 BigQuery 데이터 소스와 함께만 사용할 수 있습니다. Google 내부용: APPROX_COUNT_DISTINCT는 #plx 데이터 소스에서도 사용할 수 있습니다.
  • APPROX_COUNT_DISTINCT를 지원하지 않는 데이터 소스의 경우 APPROX_COUNT_DISTINCT는 COUNT_DISTINCT처럼 작동합니다.
  • 사전 집계된 측정항목 ( 집계 유형은 자동)이나 다른 집계 함수의 결과인 표현식에는 이 함수를 적용할 수 없습니다. 예를 들어 Google 애널리틱스 데이터 소스에서 APPROX_COUNT_DISTINCT(Sessions)와 같은 수식을 사용하면 오류가 발생합니다.