APPROX_COUNT_DISTINCT
함수는 필드 하나에 있는 고유 항목의 대략적인 개수를 집계합니다.
APPROX_COUNT_DISTINCT
is only available when your data comes from a BigQuery data source. For other data source types, use
COUNT_DISTINCT
.
구문
APPROX_COUNT_DISTINCT
( X )
매개변수
- X - 계산할 항목을 포함하는 필드 또는 표현식
APPROX_COUNT_DISTINCT
함수의 작동 방식
APPROX_COUNT_DISTINCT
함수에서는 매개변수 하나를 사용하며, 측정항목, 측정기준 또는 모든 유형의 표현식에 해당하는 이름이 매개변수로 사용될 수 있습니다.
APPROX_COUNT_DISTINCT
함수는 이러한 필드 또는 표현식에 있는 고유 항목의 대략적인 개수를 반환합니다.
APPROX_COUNT_DISTINCT
는
COUNT_DISTINCT
보다 쿼리 처리 측면에서 더 효율적이지만 결과의 정확성이 떨어집니다. 데이터 세트가 너무 크거나 보고서의 실적이 정확한 수치보다 중요한 경우에는
APPROX_COUNT_DISTINCT
함수를 사용해 보세요.
COUNT_DISTINCT
대신
APPROX_COUNT_DISTINCT
를 사용하면 BigQuery 데이터 소스를 사용할 때 쿼리 비용을 줄일 수 있습니다.
근사치 집계가 작동하는 방식에 대한 자세한 설명은 BigQuery 문서를 참고하세요.
예시
APPROX_COUNT_DISTINCT( Page )
- 페이지 측정기준에 해당하는 고유한 값의 대략적인 개수를 집계합니다.
APPROX_COUNT_DISTINCT
의 제한사항
APPROX_COUNT_DISTINCT
함수는 BigQuery 데이터 소스와 함께만 사용할 수 있습니다. Google 내부용: APPROX_COUNT_DISTINCT는 #plx 데이터 소스에서도 사용할 수 있습니다.
APPROX_COUNT_DISTINCT
를 지원하지 않는 데이터 소스의 경우
APPROX_COUNT_DISTINCT
는 COUNT_DISTINCT처럼 작동합니다.
- 사전 집계된 측정항목 ( 집계 유형은 자동)이나 다른 집계 함수의 결과인 표현식에는 이 함수를 적용할 수 없습니다. 예를 들어 Google 애널리틱스 데이터 소스에서
APPROX_COUNT_DISTINCT(Sessions)
와 같은 수식을 사용하면 오류가 발생합니다.