BigQuery BI Engine을 사용하면 BigQuery에서 지원하는 보고서 및 대시보드로 지연 시간이 짧은 빠른 분석 서비스와 대화형 분석을 수행할 수 있습니다.
이 입문 가이드는 Looker Studio를 사용하여 보고서 및 대시보드를 빌드하는 데이터 분석가와 비즈니스 분석가를 대상으로 합니다.
목표
이 가이드의 목표는 다음과 같습니다.- Google Cloud 콘솔에서 BigQuery를 사용하여 BI Engine 용량 예약을 만들기
- Looker Studio를 사용하여 BI Engine에서 관리하는 BigQuery 테이블에 연결하기
- BI Engine 관리 테이블을 쿼리하는 Looker Studio 대시보드 만들기
비용
이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.
- BI Engine: BI Engine에서 생성한 예약 비용이 발생합니다.
- BigQuery: BigQuery에서 생성한 테이블의 스토리지 비용이 발생합니다.
프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요.
BI Engine 가격 책정에 대한 자세한 내용은 가격 책정 페이지를 참조하세요.
BigQuery 스토리지 가격 책정에 대한 자세한 내용은 BigQuery 문서에서 스토리지 가격 책정을 참조하세요.
시작하기 전에
시작하기 전에 사용할 프로젝트가 있는지, 해당 프로젝트에 대해 결제를 사용 설정했는지, BigQuery API를 활성화했는지 확인하세요.
- Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- BigQuery API는 새 프로젝트에서 자동으로 활성화됩니다.
기존 프로젝트에서 BigQuery API를 활성화하려면 다음으로 이동합니다.
Enable the BigQuery API.
BigQuery 데이터 세트 만들기
첫 번째 단계는 BI Engine 관리 테이블을 저장할 BigQuery 데이터 세트를 만드는 것입니다. 데이터 세트를 만들려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.
탐색 패널의 탐색기 패널에서 프로젝트 이름을 클릭합니다.
세부정보 패널에서
작업 보기를 클릭한 후 데이터 세트 만들기를 클릭합니다.데이터 세트 만들기 페이지에서 다음을 수행합니다.
- 데이터세트 ID에
biengine_tutorial
을 입력합니다. 데이터 위치에서 공개 데이터 세트가 저장된 멀티 리전 위치에 해당하는 us(미국 내 여러 리전)를 선택합니다.
이 튜토리얼에서는 테이블 만료 시간 사용 설정을 선택한 후 테이블이 만료되기 전의 일 수를 지정할 수 있습니다.
- 데이터세트 ID에
다른 기본 설정은 모두 그대로 두고 데이터세트 만들기를 클릭합니다.
공개 데이터 세트에서 데이터를 복사하여 테이블 만들기
이 튜토리얼에서는 Google Cloud 공개 데이터세트 프로그램을 통해 제공되는 데이터세트를 사용합니다. 공개 데이터 세트는 사용자가 액세스하고 애플리케이션에 통합할 수 있도록 BigQuery가 호스팅하는 데이터 세트입니다.
이 섹션에서는 San Francisco 311 서비스 요청 데이터세트의 데이터를 복사하여 테이블을 만듭니다. Google Cloud 콘솔을 사용하여 데이터 세트를 탐색할 수 있습니다.
테이블 만들기
테이블을 만들려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.
탐색기 패널에서
san_francisco_311
을 검색합니다.탐색기 패널에서 san_francisco_311을 확장하고 311_service_requests 테이블을 클릭합니다.
탐색기 툴바에서 복사를 클릭합니다.
테이블 복사 대화상자의 대상 섹션에서 다음을 수행합니다.
- 프로젝트 이름에 대해 찾아보기를 클릭한 후 프로젝트를 선택합니다.
- 데이터 세트 이름에 대해 biengine_tutorial을 선택합니다.
테이블 이름에
311_service_requests_copy
을 입력합니다.
복사를 클릭합니다.
선택사항: 복사 작업이 완료된 후
PROJECT_NAME
> biengine_tutorial을 확장하고 311_service_requests_copy > 미리보기를 클릭하여 테이블 콘텐츠를 확인합니다.PROJECT_NAME
을 이 튜토리얼의 Google Cloud 프로젝트 이름으로 바꿉니다.
BI Engine 예약 만들기
Google Cloud 콘솔의 관리에서 BI Engine 페이지로 이동합니다.
예약 만들기를 클릭합니다.
예약 만들기 페이지에서 BI Engine 예약을 구성합니다.
- 프로젝트 목록에서 Google Cloud 프로젝트를 확인합니다.
- 위치 목록에서 위치를 선택합니다. 위치는 쿼리 중인 데이터 세트 위치와 일치해야 합니다.
용량(GiB) 슬라이더를 예약할 메모리 용량에 맞게 조정합니다. 다음 예시는 용량을 2GiB로 설정합니다. 최댓값은 250GiB입니다.
다음을 클릭합니다.
원하는 경우 선호 테이블 섹션에서 BI Engine으로 가속화할 테이블을 지정합니다. 테이블 이름을 찾으려면 다음을 수행합니다.
- 테이블 ID 필드에 BI Engine에서 가속화하려는 테이블 이름의 일부(예:
311
)를 입력합니다. 제안된 이름 목록에서 테이블 이름을 선택합니다.
지정된 테이블만 가속화할 수 있습니다. 선호 테이블을 지정하지 않으면 모든 프로젝트 쿼리가 가속화될 수 있습니다.
- 테이블 ID 필드에 BI Engine에서 가속화하려는 테이블 이름의 일부(예:
다음을 클릭합니다.
확인 및 제출 섹션에서 약관을 검토합니다.
약관에 동의하면 만들기를 클릭합니다.
예약을 확인하면 세부정보가 예약 페이지에 표시됩니다.
Looker Studio에서 데이터 소스 연결 만들기
Looker Studio에서 보고서를 만들기 전에 보고서의 데이터 소스를 만들어야 합니다. 보고서에는 하나 이상의 데이터 소스가 포함될 수 있습니다. Looker Studio는 BigQuery 커넥터를 사용하여 BI Engine 관리 BigQuery 테이블에 연결합니다.
Looker Studio에서 데이터 소스 연결을 정의할 때 BI Engine은 구성하는 테이블과 열을 사용하여 캐시할 데이터를 파악합니다. BI Engine은 보고서에 추가하는 열만 캐시합니다.
필수 권한
Looker Studio 보고서에 BigQuery 데이터 소스를 추가하려면 적절한 권한이 있어야 합니다. BigQuery 데이터세트에 적용된 권한은 Looker Studio에서 만드는 보고서, 차트 및 대시보드에도 적용됩니다. Looker Studio 보고서를 공유할 경우 적절한 권한이 있는 사용자에게만 보고서 구성요소가 표시됩니다.
보고서를 채우는 데 사용되는 작업 쿼리를 실행하려면 bigquery.jobs.create
권한이 필요합니다. 쿼리 작업을 성공적으로 완료하려면 사용자 또는 그룹이 쿼리에서 참조하는 테이블이 포함된 데이터 세트에 액세스할 수 있어야합니다. 필요한 최소한의 액세스 수준은 보기 가능으로, 해당 데이터 세트의 bigquery.dataViewer
역할에 맵핑됩니다.
이 가이드에서 사용되는 데이터 세트를 만들었으므로 데이터 세트에 대한 소유자 액세스 권한이 부여되어 데이터 세트를 완전히 제어할 수 있습니다. 또한 이 가이드에서 사용되는 프로젝트를 만들었으므로 프로젝트 수준에서 소유자 액세스 권한을 갖습니다. 소유자 액세스 권한이 있으면 프로젝트에서 작업을 실행할 수 있습니다.
권한 정보
사전 정의된 다음의 IAM 역할을 부여하여 프로젝트 수준에서 bigquery.jobs.create
권한을 설정할 수 있습니다.
bigquery.user
bigquery.jobUser
bigquery.admin
사용자 또는 그룹에게 프로젝트 수준의 bigquery.user
역할을 부여하면 기본적으로 프로젝트의 데이터 세트, 테이블 또는 뷰에 대한 어떤 액세스 권한도 부여되지 않습니다. bigquery.user
역할이 부여된 사용자는 자체 데이터 세트를 만들고 자신이 액세스할 수 있는 데이터 세트에 대해 쿼리 작업을 실행할 수 있습니다. bigquery.user
또는 bigquery.jobUser
역할을 할당할 경우 사용자가 만들지는 않았지만 사용자 또는 그룹이 액세스해야 하는 각 데이터 세트에 대한 액세스 제어도 할당해야 합니다.
데이터 세트에 대한 액세스 권한을 할당할 때는 다음과 같은 3가지 옵션이 있습니다.
- 보기 가능은 해당 데이터 세트의 bigquery.dataViewer 역할에 맵핑됩니다.
- 편집 가능은 해당 데이터 세트의 bigquery.dataEditor 역할에 매핑됩니다.
- 소유자는 해당 데이터 세트의 bigquery.dataOwner 역할에 매핑됩니다.
사용자가 쿼리를 실행하는 데 필요한 최소한의 액세스 권한은 보기 가능입니다.
BigQuery의 IAM 역할에 대한 자세한 내용은 BigQuery 문서의 액세스 제어를 참조하십시오.
BigQuery에서의 데이터 세트 보안에 대한 자세한 정보는 BigQuery 문서의 데이터 세트에 대한 액세스 제어를 참조하세요.
데이터 소스 만들기
데이터 소스를 만들려면 다음 안내를 따르세요.
Looker Studio를 엽니다.
보고서 페이지의 새 보고서 시작 섹션에서 빈 템플릿을 클릭합니다. 제목이 없는 새 보고서가 생성됩니다.
메시지가 나타나면 마케팅 환경설정 및 계정 및 개인정보 보호 설정을 완료하고 저장을 클릭합니다. 설정을 저장한 후 빈 템플릿을 다시 클릭해야 할 수도 있습니다.
데이터 소스 추가 창에서 새 데이터 소스 만들기를 클릭합니다.
Google 커넥터 섹션에서 BigQuery로 마우스를 가져간 다음 선택을 클릭합니다.
승인에서 승인을 클릭하여 이렇게 하면 Looker Studio가 Google Cloud 프로젝트에 액세스할 수 있습니다.
권한 요청 대화상자에서 허용을 클릭하여 Looker Studio가 BigQuery에서 데이터를 볼 수 있게 합니다. 이전에 Looker Studio를 사용한 경우 이 메시지가 나타나지 않을 수 있습니다.
내 프로젝트를 선택한 상태로 두고 프로젝트 창에서 프로젝트 이름을 클릭합니다.
데이터 세트 창에서 biengine_tutorial을 클릭합니다.
테이블 창에서 311_service_requests_copy을 클릭합니다.
창의 오른쪽 상단에서 연결을 클릭합니다. Looker Studio가 BigQuery 데이터 소스에 연결되면 테이블의 필드가 표시됩니다. 이 페이지에서 필드 속성을 조정하거나 새로운 계산된 필드를 만들 수 있습니다.
오른쪽 상단에서 보고서에 추가를 클릭합니다.
메시지가 나타나면 보고서에 추가를 클릭합니다.
권한 요청 대화상자에서 허용을 클릭하여 Looker Studio에서 Google 드라이브의 파일을 보고 관리할 수 있게 합니다. 이전에 Looker Studio를 사용한 경우 이 메시지가 나타나지 않을 수 있습니다.
차트 만들기
보고서에 데이터 소스를 추가한 후의 다음 단계는 시각화를 만드는 것입니다. 먼저 막대 그래프를 만듭니다. 생성한 막대 그래프는 환경별 상위 불만사항을 표시합니다.
환경별로 불만을 표시하는 막대 그래프를 만들려면 다음 안내를 따르세요.
(선택사항) 페이지 상단에서 제목 없는 보고서를 클릭하여 보고서 이름을 변경합니다. 예를 들어
BI Engine tutorial
을 입력합니다.보고서 편집기가 로드되면 삽입 > 막대 그래프를 클릭합니다.
핸들을 사용하여 차트의 크기를 확장합니다.
데이터 탭에서 데이터 소스의 값이
311_service_requests_copy
임을 확인합니다.환경별 요청 수를 차트로 나타내므로 차원을
category
으로 설정하고 분류 차원을neighborhood
으로 설정해야 합니다. 기본 차원(예:status
)을 클릭하고 목록에서 카테고리를 선택합니다.사용 가능한 필드 목록에서 환경을 클릭하여 분류 차원 아래 여기에 차원 추가 상자로 드래그합니다.
필터 추가
데이터는 neighborhood
열의 많은 NULL
값을 포함하므로 그래프에서 NULL
값을 제외하는 필터를 추가합니다.
필터를 추가하는 방법은 다음과 같습니다.
데이터 탭에서 필터 추가를 클릭합니다.
필터 만들기 대화상자에서 다음을 수행합니다.
- 이름에 null 제외를 입력합니다.
- 데이터 소스가
311_service_requests_copy
로 설정되어 있는지 확인합니다. - 포함을 클릭하고 제외를 선택합니다.
- 필드 선택을 클릭하고 환경을 선택합니다.
조건 선택을 클릭하고 null을 선택합니다.
저장을 클릭합니다.
필터가 적용되면 다음과 같은 차트가 표시됩니다.
삭제
이 빠른 시작에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 프로젝트를 삭제하거나 BI Engine 예약을 삭제하거나 둘 다 삭제하면 됩니다.
프로젝트 삭제
비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.
프로젝트를 삭제하는 방법은 다음과 같습니다.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
예약 삭제
또는 프로젝트를 유지하려는 경우 용량 예약을 삭제하여 추가적인 BI Engine 비용을 방지할 수 있습니다.
예약을 삭제하려면 다음 단계를 따르세요.
Google Cloud 콘솔의 관리에서 BI Engine 페이지로 이동합니다.
예약 섹션에서 예약을 찾습니다.
작업 열에서 예약 오른쪽의
아이콘을 클릭하고 삭제를 선택합니다.예약을 삭제하시겠어요? 대화상자에서 삭제를 입력하고 DELETE를 클릭합니다.
다음 단계
- BigQuery BI Engine에 대한 개요는 BigQuery BI Engine 소개를 참조하기
- 고객센터에서 Looker Studio에 대해 자세히 알아보세요.
- 용량 예약 방법에 대해 알아보세요.
- BigQuery BI Engine 가격 책정에 대해 자세히 알아보세요.