이 도움말에서는 혼합의 작동 방식을 이해하고 복잡한 사용 사례를 해결하는 데 도움이 되는 데이터 혼합에 관한 조언과 심층 정보를 제공합니다. 이 도움말을 최대한 활용하려면 이 주제의 다른 도움말에서 다루는 데이터 혼합의 기본사항을 이미 숙지하고 있어야 합니다.
혼합에는 사용 가능한 데이터의 하위 집합만 포함되어야 함
혼합을 기반으로 차트에서 시각화하려는 특정 필드만 포함하는 것이 좋습니다. 이 기능이 중요한 이유는 다음과 같습니다.
- 혼합을 사용하면 매우 큰 데이터 세트가 생성될 수 있으므로 성능이 저하되고 BigQuery와 같은 유료 서비스의 쿼리 비용이 증가할 수 있습니다.
- 혼합을 기반으로 하는 차트에서는 혼합의 행이 차트에 사용되지 않더라도 혼합의 모든 행을 계산합니다.
- 예를 들어 10개의 필드가 포함된 혼합을 만든다고 가정해 보겠습니다. 그런 다음 이러한 필드 중 하나만 사용하는 차트를 정의합니다. Looker Studio는 10개 필드 혼합을 계산한 다음 혼합 출력의 1개 필드를 쿼리하여 차트를 만듭니다.
- 재집계는 혼합에 기본 데이터의 하위 집합이 포함된 경우에만 발생합니다.
혼합을 사용하여 측정항목 재집계
기본 데이터 소스에서 포함된 측정항목은 혼합에서 합산되지 않은 수치가 됩니다. 혼합에 포함된 필드 수가 기본 데이터 소스의 전체 필드 수보다 적은 경우 이 수는 새 데이터를 기반으로 재집계됩니다. 이 방법으로 혼합을 사용하면 평균의 평균을 계산하는 등 이미 집계된 필드에 다른 집계를 적용해야 하는 경우에 유용할 수 있습니다.
자세한 내용은 혼합을 사용하여 데이터 재집계를 참고하세요.
단일 데이터 소스에서 혼합 만들기
블렌드는 다른 데이터 소스를 사용할 필요가 없습니다. 동일한 데이터 소스의 여러 테이블을 혼합하여 데이터를 다시 집계하는 것도 유용할 수 있습니다.
예를 들어 다음 표와 같이 인구가 가장 많은 미국 주의 상위 3개 카운티의 인구 데이터가 포함된 데이터 세트가 있다고 가정해 보겠습니다.
주 |
카운티 |
인구 (2023년 추정치) |
---|---|---|
캘리포니아 |
로스앤젤레스 카운티 |
10,014,009 |
캘리포니아 |
샌디에이고 카운티 |
3,298,634 |
캘리포니아 |
오렌지 카운티 |
3,186,989 |
텍사스 |
해리스 카운티 |
4,731,145 |
텍사스 |
댈러스 카운티 |
2,613,539 |
텍사스 |
타러ंट 카운티 |
2,110,640 |
뉴욕 |
킹스 카운티 (브루클린) |
2,736,074 |
뉴욕 |
Queens County |
2,405,464 |
뉴욕 |
브롱크스 카운티 |
1,418,890 |
주 내 각 카운티의 인구 비율을 계산하려고 합니다. 하지만 이를 위해서는 각 주의 총 인구를 자체 필드로 보유해야 합니다. 데이터 세트에서는 이 측정항목을 사용할 수 없지만 다음 단계에 따라 인구통계 데이터 소스를 자체적으로 혼합하여 가져올 수 있습니다.
- 기본 데이터 세트를 사용하여 데이터 소스를 만듭니다.
- 보고서에 해당 데이터 소스를 사용하는 차트를 추가합니다.
- 테이블 두 개로 블렌드를 만듭니다. 각 테이블은 1단계에서 만든 것과 동일한 데이터 소스를 사용합니다.
- 표 1에는 다음 필드를 포함합니다.
- 주, 군, 인구
- 인구의 이름을 CountyPopulation으로 바꿉니다.
- 테이블 2의 경우 인구 필드를 포함하고 이름을 StatePopulation으로 변경합니다.
- 표 1에는 다음 필드를 포함합니다.
- 조인 조건에 왼쪽 외부 조인을 사용하여 테이블 1의 State를 테이블 2의 State에 연결합니다.
- 저장을 클릭합니다.
- X를 클릭하여 보고서 편집기로 돌아갑니다.
그런 다음 보고서에 새 차트 (예: 표)를 추가하고 다음 단계에 따라 혼합을 차트의 데이터 소스로 선택합니다.
- 차트에 State, County, CountyPopulation, StatePopulation 필드를 추가합니다.
- 각 카운티의 주 인구 비율을 계산하려면 새로 재집계된 데이터를 사용하는 계산된 필드를 차트에 추가합니다.
- 속성 패널에서 측정항목 추가를 클릭한 다음 필드 추가를 클릭합니다.
- 필드 이름을 지정합니다 (예: Percent of State Population).
- 수식 상자에
(CountyPopulation / StatePopulation)*100
을 입력합니다. - (선택사항) 표시 형식을 설정하여 원하는 수준으로 백분율 값을 표시합니다 (예: 소수점 이하 2자리의 경우 백분율 (2)).
완료되면 표가 다음과 같이 표시됩니다.
주 |
카운티 |
CountyPopulation |
StatePopulation |
주 인구 비율 |
---|---|---|---|---|
캘리포니아 |
로스앤젤레스 카운티 |
10014009 |
16499632 |
60.69 |
텍사스 |
해리스 카운티 |
4731145 |
9455324 |
50.04 |
캘리포니아 |
샌디에이고 카운티 |
3298634 |
16499632 |
19.99 |
캘리포니아 |
오렌지 카운티 |
3186989 |
16499632 |
19.32 |
뉴욕 |
킹스 카운티 (브루클린) |
2736074 |
6560428 |
41.71 |
텍사스 |
댈러스 카운티 |
2613539 |
9455324 |
27.64 |
뉴욕 |
Queens County |
2405464 |
6560428 |
36.67 |
텍사스 |
타러ंट 카운티 |
2110640 |
9455324 |
22.32 |
뉴욕 |
브롱크스 카운티 |
1418890 |
6560428 |
21.63 |
혼합의 테이블 순서
Looker Studio는 가장 왼쪽 구성을 시작으로 혼합의 조인 구성을 순서대로 평가합니다. 그런 다음 각 조인의 결과가 오른쪽의 다음 조인에 적용됩니다. 예를 들어 3개의 테이블 혼합에서는 테이블 1 (가장 왼쪽)과 테이블 2 (중간) 사이의 조인 구성이 평가된 후 해당 결과가 테이블 2와 테이블 3 (가장 오른쪽) 사이의 조인 구성에 따라 사용됩니다.
자동으로 생성된 혼합의 테이블 순서
선택한 여러 차트가 혼합되면 Looker Studio에서 각 차트에 대한 테이블을 만든 다음 차트의 필드를 해당 테이블에 추가합니다. 혼합의 테이블 순서는 차트를 선택하는 순서와 일치합니다. 선택한 첫 번째 차트가 첫 번째 (가장 왼쪽) 테이블이 되고, 두 번째 차트가 두 번째 테이블이 됩니다.
Looker Studio는 또한 각 테이블에 조인 구성을 자동으로 생성하고 왼쪽 외부 조인 유형을 사용합니다.
기본 구성이 원하는 구성이 아니거나 테이블 간에 연결이 명확하게 되어 있지 않은 경우 목표에 맞게 혼합을 수정할 수 있습니다.
혼합되기 전에 테이블이 생성됨
혼합에 있는 각 테이블의 데이터는 최종 혼합에 조인되기 전에 쿼리됩니다. 테이블의 기간, 필터, 계산된 필드는 조인이 실행되기 전에 테이블을 생성하는 쿼리에 적용됩니다. 이러한 요소는 혼합 테이블에 포함된 데이터에 영향을 미치고 혼합의 출력을 변경할 수 있습니다.
혼합 데이터가 원본 데이터보다 더 많은 행을 포함할 수 있음
혼합을 구성하는 개별 데이터 소스를 기반으로 한 차트보다 더 많은 데이터가 혼합 차트로 표시될 수 있습니다. 결과는 데이터와 혼합에 선택한 조인 구성에 따라 다를 수 있습니다. 예를 들어 왼쪽 외부 조인에는 왼쪽 테이블의 모든 기록과 조인 조건 전체에서 동일한 값을 공유하는 오른쪽 테이블의 모든 기록이 포함됩니다. 조인 조건에 대한 일치하는 항목이 여러 개인 경우, 가장 왼쪽 데이터 소스보다 혼합된 데이터에서 더 많은 행이 나타날 수 있습니다.
혼합 및 명시적 기간과 필터
혼합의 행 수를 제한하는 두 가지 방법은 기간을 사용하거나 필터를 적용하는 것입니다. 혼합을 기반으로 하는 차트나 혼합을 구성하는 테이블에서 행을 제한할 수 있습니다. 이 프로세스를 '사전 혼합' 또는 '사후 혼합'으로 생각하면 좋습니다.
혼합의 테이블에 기간 또는 필터를 적용하면 혼합의 다른 테이블과 데이터가 조인되기 전에 적용됩니다. 기간이 지났거나 필터에서 제외된 행은 조인 쿼리를 사용할 수 없습니다.
혼합을 기반으로 차트에 기간 또는 필터를 적용하면 혼합이 생성된 후에 데이터에 적용됩니다 ('사후 혼합').
이러한 차이는 데이터 및 혼합 구성 방법에 따라 차트에 표시되는 결과에 큰 영향을 줄 수 있습니다.
혼합 및 상속된 필터
혼합은 필터가 사전 혼합 또는 사후 혼합 데이터와 호환되는 한 보고서, 페이지 또는 그룹 수준 필터를 상속합니다. 필터가 혼합에서 사용하는 기본 데이터 소스와 호환되는 경우 사전 혼합된 데이터에서 필터가 작동합니다. 그렇지 않으면 사후 혼합된 데이터에서 필터가 작동합니다. 필터가 사전 혼합 또는 사후 혼합 데이터와 호환되지 않으면 필터는 무시됩니다.
필터 상속에 대해 자세히 알아보기
혼합에 기반한 차트에 상속된 필터가 적용되면 Looker Studio는 다섯 가지 단계로 데이터를 처리합니다.
(사전 혼합):
- 1단계: 데이터 혼합 패널에 지정된 측정기준을 기반으로 데이터를 그룹화하고 집계합니다.
- 2단계: 상속된 측정기준 필터와 호환되는 측정항목 필터는 데이터 혼합 패널에 포함된 데이터 소스에 적용됩니다.
(블렌드):
- 3단계: 지정된 조인 구성을 사용하여 데이터가 혼합됩니다.
(혼합 후):
- 4단계: 차트의 측정기준을 기반으로 데이터가 그룹화되고 집계됩니다.
- 5단계: 측정항목 필터는 혼합 데이터와 호환되는 경우 차트에 적용됩니다.