데이터 스튜디오를 사용하여 BigQuery 데이터 시각화

BigQuery는 방대한 양의 데이터를 대상으로 실시간에 가깝게 SQL 쿼리를 실행하는 데 사용할 수 있는 페타바이트 규모의 분석 데이터 웨어하우스입니다.

데이터 시각화 도구는 BigQuery 데이터를 이해하고 양방향 방식으로 데이터를 분석하는 데 도움이 됩니다. 시각화 도구를 사용하면 트렌드를 파악하고, 이에 대응하고, 데이터를 바탕으로 예측할 수 있습니다. 이 가이드에서는 Google 데이터 스튜디오를 사용하여 BigQuery natality 샘플 테이블의 데이터를 시각화합니다.

목표

이 가이드의 목표는 다음과 같습니다.

  • BigQuery 데이터 소스에 연결
  • BigQuery 데이터 시각화를 위한 보고서 및 차트 만들기

비용

Google 데이터 스튜디오 BigQuery 커넥터를 사용하면 Google 데이터 스튜디오에서 BigQuery 테이블의 데이터에 액세스할 수 있습니다. BigQuery는 유료 제품이므로 Google 데이터 스튜디오를 통해 BigQuery에 액세스하면 BigQuery 사용 비용이 발생합니다. BigQuery 쿼리 가격 정책에 따라 매달 처음 1TB는 무료로 제공됩니다. 자세한 내용은 BigQuery 가격 책정 페이지를 참조하세요.

시작하기 전에

이 가이드를 시작하기 전에 Google Cloud Platform Console을 사용하여 프로젝트를 만들거나 선택하고 결제를 사용 설정하세요.

  1. Google 계정에 로그인합니다.

    아직 계정이 없으면 새 계정을 등록하세요.

  2. Google Cloud Platform 프로젝트를 선택하거나 만듭니다.

    리소스 관리 페이지로 이동

  3. Google Cloud Platform 프로젝트에 결제가 사용 설정되어 있는지 확인하세요.

    결제 사용 설정 방법 알아보기

  4. 새 프로젝트에서는 BigQuery가 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하는 방법은 다음과 같습니다. BigQuery API를 사용 설정합니다.

    API 사용 설정

Google 데이터 스튜디오 및 BigQuery 커넥터를 사용하여 보고서 및 차트 만들기

이 가이드 섹션에서는 Google 데이터 스튜디오와 BigQuery 커넥터를 사용하여 BigQuery의 데이터를 시각화합니다. natality 샘플 테이블의 데이터를 시각화하는 데이터 소스, 보고서, 차트를 만듭니다.

데이터 소스 만들기

Google 데이터 스튜디오에서 보고서를 만들기 위한 첫 단계는 보고서의 데이터 소스를 만드는 것입니다. 보고서에는 하나 이상의 데이터 소스가 포함될 수 있습니다. BigQuery 데이터 소스를 만들면 Google 데이터 스튜디오가 BigQuery 커넥터를 사용합니다.

Google 데이터 스튜디오 보고서에 BigQuery 데이터 소스를 추가하려면 적절한 권한이 있어야 합니다. BigQuery 데이터세트에 적용된 권한은 Google 데이터 스튜디오에서 만드는 보고서, 차트, 대시보드에도 적용됩니다. Google 데이터 스튜디오 보고서를 공유할 경우 적절한 권한이 있는 사용자에게만 보고서 구성요소가 표시됩니다.

데이터 소스를 만들려면 다음 안내를 따르세요.

  1. Google 데이터 스튜디오를 엽니다.

  2. 보고서 페이지의 새 보고서 시작 섹션에서 빈 템플릿을 클릭합니다. 제목이 없는 새 보고서가 생성됩니다.

    비어 있음 템플릿

  3. 메시지가 나타나면 마케팅 환경설정계정 및 개인정보 보호 설정을 완료하고 저장을 클릭합니다. 설정을 저장한 후 빈 템플릿을 다시 클릭해야 할 수도 있습니다.

  4. 데이터 소스 추가 창에서 새 데이터 소스 만들기를 클릭합니다.

    데이터 소스 추가

  5. Google 커넥터 섹션에서 BigQuery로 마우스를 가져간 다음 선택을 클릭합니다.

  6. 승인에서 승인을 클릭하여 Google 데이터 스튜디오가 GCP 프로젝트에 액세스할 수 있도록 합니다.

  7. 권한 요청 대화상자에서 허용을 클릭하여 Google 데이터 스튜디오에 BigQuery에서 데이터를 볼 수 있는 권한을 부여합니다. 이전에 Google 데이터 스튜디오를 사용한 적이 있는 경우 이 메시지가 나타나지 않을 수 있습니다.

  8. 내 프로젝트에서 공개 데이터세트를 클릭합니다.

  9. 결제 프로젝트에서 이전에 만든 GCP 프로젝트의 이름을 클릭합니다.

  10. 공개 데이터세트에서 샘플을 클릭합니다.

  11. 테이블에서 natality를 클릭합니다.

    natality 테이블

  12. 창의 오른쪽 상단에서 연결을 클릭합니다. Google 데이터 스튜디오가 BigQuery 데이터 소스에 연결되면 테이블의 필드가 표시됩니다. 이 페이지에서 필드 속성을 조정하거나 새로운 계산된 필드를 만들 수 있습니다.

  13. natality 테이블에 yearsource_year 필드가 정수로 저장됩니다. Google 데이터 스튜디오에서 이들 열을 문자열로 사용하려면 해당 열의 유형을 텍스트로 변경합니다. yearsource_year 필드 오른쪽에 있는 유형 열에서 숫자를 클릭하고 드롭다운 목록에서 텍스트를 선택합니다.

    필드 대화상자

  14. 보고서에 추가를 클릭합니다.

    보고서에 추가

  15. 메시지가 나타나면 보고서에 추가를 클릭합니다.

  16. 권한 요청 대화상자에서 허용을 클릭하여 데이터 스튜디오에서 Google 드라이브의 파일을 보고 관리할 수 있게 합니다. 이전에 Google 데이터 스튜디오를 사용한 적이 있는 경우 이 메시지가 나타나지 않을 수 있습니다.

계산된 필드를 사용하여 막대 그래프 만들기

보고서에 natality 데이터 소스를 추가한 후의 다음 단계는 시각화를 만드는 것입니다. 먼저 막대 그래프를 만듭니다. 막대 그래프는 연도별 총 출생아 수를 나타냅니다. 연도별 출생아 수를 표시하려면 계산된 필드를 만듭니다.

연도별 총 출생아 수를 표시하는 막대 그래프를 만들려면 다음 안내를 따르세요.

  1. (선택사항) 페이지 상단에서 제목 없는 보고서를 클릭하여 보고서 이름을 변경합니다. 예를 들어, BigQuery tutorial을 입력합니다.

  2. 보고서 편집기가 로드되면 삽입 > 막대 그래프를 클릭합니다.

  3. 핸들을 사용하여 차트를 보고서에 놓습니다.

  4. 데이터 탭에서 데이터 소스 값(natality)과 측정기준 및 측정항목의 기본값을 확인합니다.

  5. 연도별 출생 수를 차트로 표시하므로 측정기준을 source_year로 설정해야 합니다. source_year가 기본 측정기준이 아니면 사용 가능한 필드에서 source_year를 클릭하고 기본 측정기준으로 드래그하여 바꿉니다.

  6. 측정항목 섹션에서 측정항목 추가를 클릭합니다.

  7. 측정항목 선택도구에서 필드 만들기를 클릭합니다.

  8. 연도별 출생아 수를 성별로 표시하려면 계산된 필드를 만듭니다. 이 가이드에서는 is_male 필드의 항목을 계산합니다. is_male의 값은 남아이면 true이고, 여아이면 false입니다. 새 측정항목 창에서 이름birth_count를 입력합니다.

  9. 수식COUNT(is_male)을 입력합니다.

  10. 적용을 클릭합니다.

  11. 보고서 페이지를 클릭하여 측정항목 선택도구를 닫습니다.

  12. 측정항목이 추가된 후 기본 측정항목으로 마우스를 가져가고 오른쪽에 있는 삭제 아이콘을 클릭합니다. 측정기준은 source_year로 설정되고, 측정항목은 birth_count로 설정되어 있습니다.

  13. 차트는 기본적으로 내림차순으로 정렬됩니다. 출생아 수가 가장 많은 연도부터 표시됩니다.

    총 출생아 수 차트

  14. 차트를 개선하려면 막대 라벨을 변경합니다. 막대 그래프 속성 창에서 스타일 탭을 클릭합니다.

  15. 막대 그래프 섹션에서 데이터 라벨 표시를 선택합니다.

    라벨 표시

    차트의 각 막대 위에 총 출생아 수가 표시됩니다.

  16. birth_count 대신 source_year를 기준으로 데이터를 정렬합니다. 막대 그래프 속성 창의 데이터 탭에 있는 정렬 섹션에서 다음을 수행합니다.

    • 새 필드를 클릭합니다.
    • 정렬 선택도구에서 차트 필드로 스크롤하고 source_year를 선택합니다.
    • 대화상자 이외의 곳을 클릭하여 정렬 선택도구를 닫습니다.
    • 내림차순을 클릭하고 오름차순을 선택합니다. 표시 화면이 바뀌면서 연도별 출생아 수가 오름차순으로 표시됩니다.

    오름차순의 출생아 수

차트 필터링

현재 막대 그래프에는 연도별 출생 남아와 여아의 총 수가 표시되어 있습니다. 각 해에 출생한 여아만 표시하는 필터를 추가합니다.

  1. 막대 그래프 속성 창에서 데이터 탭을 클릭합니다.

  2. 필터 섹션에서 필터 추가를 클릭합니다.

  3. 필터 만들기 창에서 다음을 수행합니다.

    • 이름Female birth count를 입력합니다.
    • 포함을 클릭하여 제외로 변경합니다.
    • 필드 선택을 클릭하고 is_male을 선택합니다.
    • 조건 선택을 클릭하고 을 선택합니다.
    • 저장을 클릭합니다.

    필터 만들기 창

차트가 업데이트되어 각 해에 출생한 여아만 표시됩니다. 범례는 변경되지 않습니다. 범례 이름에는 여전히 birth_count라는 측정항목의 이름이 반영됩니다.

필터링된 차트

커스텀 쿼리를 사용하여 차트 만들기

커스텀 쿼리 옵션을 사용하여 차트를 만들면 조인, 유니언, 분석 함수 등 BigQuery의 모든 쿼리 기능을 활용할 수 있습니다.

또는 뷰를 만들어 BigQuery의 모든 쿼리 기능을 활용할 수 있습니다. 뷰는 SQL 쿼리로 정의하는 가상 테이블입니다. 보기가 포함된 데이터세트를 데이터 소스로 추가하여 보기에서 데이터를 쿼리할 수 있습니다. 보기에 대한 자세한 내용은 보기 사용을 참조하세요.

SQL 쿼리를 BigQuery 데이터 소스로 지정하면 쿼리 결과가 테이블 형식으로 생성되어 데이터 소스의 필드 정의(스키마)가 됩니다. 커스텀 쿼리를 데이터 소스로 사용하면, Google 데이터 스튜디오가 BigQuery에 전달되는 각 생성 쿼리에 대한 내부 select 문으로 사용자의 SQL을 사용합니다. Google 데이터 스튜디오의 커스텀 쿼리에 대한 자세한 내용은 온라인 도움말을 참조하세요.

커스텀 쿼리를 사용하여 막대 그래프 추가

커스텀 쿼리 데이터 소스를 사용하는 보고서에 막대 그래프를 추가하려면 다음 안내를 따르세요.

  1. 메뉴 옵션에서 페이지 > 새 페이지를 선택합니다.

  2. 삽입 > 막대그래프를 클릭합니다.

  3. 핸들을 사용하여 차트를 보고서에 놓습니다.

  4. 막대 그래프 속성 창의 데이터 탭에서 데이터 소스natality로 설정되어 있는지 확인합니다. natality를 클릭하여 데이터 소스 선택 창을 엽니다.

  5. 새 데이터 소스 만들기를 클릭합니다.

  6. Google 커넥터 섹션에서 BigQuery로 마우스를 가져가고 선택을 클릭합니다.

  7. 내 프로젝트에서 커스텀 쿼리를 클릭합니다.

  8. 프로젝트로 GCP 프로젝트를 선택합니다.

  9. 커스텀 검색어 입력 창에 다음 표준 SQL 쿼리를 입력합니다.

    SELECT
     source_year,
     sum(case when is_male then 1 else 0 end) as male_births,
     sum(case when is_male then 0 else 1 end) as female_births
    FROM
     `bigquery-public-data.samples.natality`
    GROUP BY
     source_year
    ORDER BY
     source_year
    DESC
    

    이 쿼리는 CASE 문을 사용해 is_male 부울 필드를 평가하여 특정 해에 출생한 여아 수와 남아 수를 확인합니다.

  10. 쿼리 옵션에서 legacy SQL 사용이 선택 취소되어 있는지 확인합니다. 이렇게 하면 BigQuery 표준 SQL 구문을 사용할 수 있습니다.

    커스텀 쿼리

  11. 창 맨 위에 있는 제목 없는 데이터 소스를 클릭하고 데이터 소스 이름을 Male female case query로 변경합니다.

  12. 창 오른쪽 상단 구석에 있는 연결을 클릭합니다. Google 데이터 스튜디오가 BigQuery 데이터 소스에 연결되면 쿼리 결과는 테이블 스키마를 결정하는 데 사용됩니다.

  13. 스키마가 표시되면 각 필드의 유형과 집계를 확인합니다. 기본적으로 source_year는 숫자 형식이고 집계는 없음으로 설정됩니다. source_year 필드 오른쪽에 있는 유형 열에서 숫자를 클릭하고 텍스트를 선택합니다. 집계가 없음으로 설정되었는지 확인합니다.

    필터링된 차트

  14. 보고서에 추가를 클릭합니다.

  15. 메시지가 나타나면 보고서에 추가를 클릭합니다.

  16. 뒤로 화살표를 클릭하여 데이터 소스 선택 창을 닫습니다.

  17. Google 데이터 스튜디오가 차트에 맞는 측정항목을 제대로 결정하지 못할 수 있습니다. 연도별 출생 남아 및 여아 수를 차트로 작성하기 때문에 측정항목의 값은 female_birthsmale_births여야 합니다. 막대 그래프 속성 창의 데이터 탭에 있는 측정항목 섹션에서 레코드 수를 클릭합니다.

  18. 측정항목 선택기에서 female_births를 선택합니다.

  19. 측정항목 섹션에서 측정항목 추가를 클릭합니다.

  20. 측정항목 선택기에서 male_births를 선택합니다. 이제 차트에서 각 해에 태어난 남아 및 여아 수가 별도의 막대로 표시됩니다.

    필터링된 차트

  21. 차트는 female_births 기준의 내림차순으로 정렬되어 있습니다. 이전 차트에서 진행한 것처럼 이를 source_year로 변경합니다. 정렬 섹션에서 female_births를 클릭합니다.

  22. 정렬 선택도구에서 source_year를 선택합니다. 이제 차트에 연도별 출생 여아 및 남아 수가 표시됩니다.

  23. 가독성을 위해 차트 스타일을 변경합니다. 막대 그래프 속성에서 스타일 탭을 클릭합니다.

  24. 차트에 측정항목이 추가된 순서에 따라 각 막대에 기본 색상이 설정됩니다. 색상 팔레트에서 두 번째 정사각형을 클릭하고 빨간색에서 파란색으로 변경합니다.

    필터링된 차트

  25. 색상 팔레트에서 첫 번째 정사각형을 클릭하고 파란색에서 빨간색으로 변경합니다.

    다음과 같이 차트가 표시됩니다.

    색이 지정된 막대 그래프

쿼리 기록 보기

BigQuery 웹 인터페이스에서 쿼리 기록을 조사하면 BigQuery 커넥터를 통해 제출된 쿼리를 볼 수 있습니다. 쿼리 기록에 따라 쿼리 비용을 예측할 수 있으며, 다른 시나리오에서 사용하도록 쿼리를 저장할 수 있습니다.

쿼리 기록을 살펴보려면 다음 안내를 따르세요.

콘솔

  1. GCP Console에서 BigQuery 웹 UI를 엽니다.
    BigQuery 웹 UI로 이동

  2. 왼쪽 탐색 메뉴에서 쿼리 기록을 클릭합니다.

  3. 쿼리 목록이 표시됩니다. 가장 최근의 쿼리가 먼저 나열됩니다. 쿼리를 클릭하여 작업 ID, 처리한 바이트 등의 쿼리 세부정보를 봅니다.

기본 UI

  1. BigQuery 웹 UI로 이동합니다.

    BigQuery 웹 UI로 이동

  2. 쿼리 기록을 클릭합니다.

  3. 쿼리 목록이 표시됩니다. 가장 최근의 쿼리가 먼저 나열됩니다. 쿼리 열기를 클릭하여 작업 ID, 처리한 바이트 등의 쿼리 세부정보를 봅니다.

    색이 지정된 막대 그래프

삭제

이 가이드에서 사용한 리소스 비용이 Google Cloud Platform 계정에 청구되지 않도록 하는 방법은 다음과 같습니다.

  1. GCP Console에서 프로젝트 페이지로 이동합니다.

    프로젝트 페이지로 이동

  2. 프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제 삭제를 클릭합니다.
  3. 대화상자에서 프로젝트 ID를 입력한 다음 종료를 클릭하여 프로젝트를 삭제합니다.

데이터 소스가 프로젝트와 연결되어 있기 때문에 프로젝트를 삭제하면 Google 데이터 스튜디오에서 데이터를 쿼리하지 못합니다. Cloud Platform 프로젝트를 삭제하지 않으려면 Google 데이터 스튜디오 보고서 및 데이터 소스를 삭제하면 됩니다.

Google 데이터 스튜디오 리소스를 삭제하려면 다음 안내를 따르세요.

  1. Google 데이터 스튜디오를 엽니다.

  2. 보고서 페이지에서 BigQuery 가이드 보고서 오른쪽에 있는 '더보기' 버튼 더보기 버튼을 클릭하고 삭제를 선택합니다.

  3. 데이터 소스를 클릭합니다.

  4. natality 데이터 소스 오른쪽에 있는 '더보기' 버튼을 클릭하고 삭제를 선택합니다.

  5. 남성과 여성의 케이스 쿼리 데이터 소스 오른쪽에 있는 '더보기' 버튼을 클릭하고 삭제를 선택합니다.

다음 단계

  • BigQuery에서 쿼리를 작성하는 방법 자세히 알아보기 - BigQuery 문서의 데이터 쿼리에서 쿼리 실행 방법, 맞춤설정 함수(UDF) 작성 방법 등을 설명합니다.

  • BigQuery 구문 탐색 - BigQuery의 기본 SQL 쿼리 언어는 표준 SQL이며 관련 내용은 SQL 참조에 설명되어 있습니다. BigQuery의 legacy SQL 유사 구문은 쿼리 참조(legacy SQL)에 설명되어 있습니다.

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...