집계란 표 형식 데이터를 줄이고 요약하는 과정입니다. 예를 들어 아래의 숫자 목록을 살펴보겠습니다.
100, 200, 300, 400, 500
이 예를 사용하여 집계의 개념을 설명하는 다음 사실을 말할 수 있습니다.
사실 | 집계 |
---|---|
5개의 숫자가 있습니다. | 개수 |
가장 낮은 숫자는 100입니다. | 최소 |
가장 높은 숫자는 500입니다. | 최대 |
숫자의 평균은 300입니다. | 평균 |
숫자의 합계는 1500입니다. | 합계 |
그 밖의 데이터 집계 방식으로는 중앙값, 개수 구분, 사분위수, 백분위수 등이 있습니다.
측정기준 및 집계
위의 예시는 하나의 숫자 집합으로, 일상 생활에서는 거의 볼 수 없습니다. 일상 생활에서 볼 수 있는 데이터는 일반적으로 측정기준과 측정항목으로 구성됩니다. 측정기준은 데이터를 분류 및 그룹화하고 측정항목은 데이터를 측정합니다.
Looker Studio에서 집계는 항상 측정기준과 함께 사용됩니다. 측정기준에는 다음과 같은 유형이 있습니다.
- 모든 측정기준: 원시 데이터를 표시합니다.
- 측정기준의 하위 집합: 선택한 측정기준별로 분류된 데이터를 표시합니다.
- 비어 있는 집합: 전체 데이터 세트의 요약을 표시합니다.
예를 들어 동일한 5개 숫자가 일일 주가라고 가정하겠습니다. 날짜와 티커는 측정기준이고, 주가는 측정항목입니다.
날짜 | 시세 표시 | 가격 |
1월 1일 | GOOG | 100 |
1월 1일 | AAPL | 200 |
1월 2일 | GOOG | 300 |
1월 2일 | AAPL | 400 |
1월 3일 | GOOG | 500 |
이제 측정기준을 사용하여 데이터를 다양한 방식으로 그룹화할 수 있습니다. 예를 들면 다음과 같습니다.
티커 기준
시세 표시 | 가격 |
GOOG | ? |
AAPL | ? |
날짜별
날짜 | 가격 |
1월 1일 | ? |
1월 2일 | ? |
1월 3일 | ? |
위의 예에서 측정항목 값은 데이터에 대해 알고 싶은 사항에 따라 결정됩니다. 예를 들어 각 회사의 평균 주가를 계산하려면 평균 집계와 티커 측정기준을 적용합니다.
시세 표시 | 평균 가격 |
GOOG | (100 + 300 + 500) / 3 = 300 |
AAPL | (200 + 400) / 2 = 300 |
특정 날짜의 주식 정보가 있는 회사가 몇 개인지 표시하려면 날짜 측정기준과 '개수' 집계를 사용합니다.
날짜 | 가격 개수 |
1월 1일 | 2 |
1월 2일 | 2 |
1월 3일 | 1 |
이제 주가 표에 날짜와 티커 측정기준을 모두 사용해 보겠습니다.
날짜 | 시세 표시 | AVG(Price) | SUM(Price) |
1월 1일 | GOOG | 100 | 100 |
1월 1일 | AAPL | 200 | 200 |
1월 2일 | GOOG | 300 | 300 |
1월 2일 | AAPL | 400 | 400 |
1월 3일 | GOOG | 500 | 500 |
사용 가능한 모든 측정기준을 포함하는 그룹을 만들면 결과는 원래 데이터와 동일합니다. 모든 집계의 결과가 동일하지만 이는 여전히 집계입니다. Looker Studio에서 표를 만들고 모든 측정기준을 표시하면 여전히 집계 유형은 설정할 수 있지만 아무 작업도 수행하지 않습니다.
Looker Studio의 집계
Looker Studio에서 데이터에 집계 방법을 적용하는 여러 방법은 다음과 같습니다.
데이터 소스 필드의 기본 집계는 해당 측정항목이 차트에 표시되는 방식을 결정합니다. 사용 가능한 기본 집계는 아래를 참고하세요.
차트의 내용입니다. 보고서 수정 권한 사용자는 기본 집계를 재정의하고 차트별로 다른 집계를 차트의 측정항목에 적용할 수 있습니다. 차트에서 데이터를 추가하고 수정하는 방법을 알아보세요.
계산된 필드입니다. 계산된 필드 수식에서 특정 집계 함수를 사용하여 집계된 측정항목을 생성할 수 있습니다. 함수 목록을 참고하세요.
기본 집계
다음 기본 집계를 데이터 소스의 필드에 적용할 수 있습니다.
집계 방법 | 약어 | 설명 |
---|---|---|
합계 | SUM | 필드 값을 모두 합산합니다. |
평균 | AVG | 필드 값의 평균이 계산됩니다. |
개수 | CT | 각 필드 값이 집계됩니다. |
고유 개수 | CTD | 고유한 필드 값만 집계됩니다. |
최소 | MIN | 필드에 최솟값이 표시됩니다. |
최대 | MAX | 필드에 최댓값이 표시됩니다. |
자동 | AUT | 이 메서드는 직접 적용할 수 없습니다. 집계 방법은 기본 데이터 세트나 계산된 필드의 결과로 제공됩니다. 자동 집계 방법은 변경할 수 없습니다. |
없음 | 집계가 적용되지 않습니다. 이 필드는 숫자 데이터를 포함하는 경우에도 측정기준으로 처리됩니다. |
집계 방법 변경
필드의 집계 방법을 변경하려면 데이터 소스를 수정한 다음 기본 집계 드롭다운 메뉴를 사용합니다.
자동 집계
Google 애널리틱스, Google Ads와 같은 일부 데이터 소스에서 측정항목에 사용할 수 있는 유일한 집계 유형으로 자동 집계가 있습니다. 이러한 데이터 세트는 미리 집계되어 잠재적으로 방대한 숫자 목록이 단일 값으로 줄어듭니다. 집계는 합계나 개수처럼 단순하거나, 백분위수처럼 복잡할 수 있습니다. 자동 집계된 측정항목은 다른 집계 유형으로 변경할 수 없습니다. 다른 집계 유형으로 변경하려면 Looker Studio에서 집계되지 않은 원시 데이터에 액세스할 수 있어야 합니다.
또한 자동 집계는 스프레드시트와 같은 다른 데이터 소스를 기반으로 계산된 필드에도 적용됩니다. 이 경우, 집계는 AVG(Price)
와 같은 수식에서 집계 함수를 사용한 직접적인 결과입니다. 이 경우, 앞서 말했듯이 AVG 함수의 결과와 충돌할 수 있으므로 자동 집계를 변경할 수 없습니다.