BigQuery BI Engine では、BigQuery を基盤としたレポートとダッシュボードを使用して、高速で低レイテンシの分析サービスとインタラクティブな分析を実行できます。
この入門チュートリアルは、Looker Studio を使用してレポートとダッシュボードを作成するデータ アナリストとビジネス アナリストを対象としています。
目標
このチュートリアルの内容は次のとおりです。- Google Cloud コンソールで BigQuery を使用して BI Engine 容量の予約を作成します。
- Looker Studio を使用して、BI Engine で管理されている BigQuery テーブルに接続します。
- BI Engine 管理テーブルをクエリする Looker Studio ダッシュボードを作成します。
費用
このドキュメントでは、Google Cloud の次の課金対象のコンポーネントを使用します。
- BI Engine: BI Engine で作成した予約の費用が発生します。
- BigQuery: BigQuery で作成したテーブルのストレージ費用が発生します。
料金計算ツールを使うと、予想使用量に基づいて費用の見積もりを生成できます。
BI Engine の料金の詳細については、料金設定のページをご覧ください。
BigQuery ストレージの料金について詳しくは、BigQuery のドキュメントのストレージの料金をご覧ください。
始める前に
作業を始める前に、使用するプロジェクトを所有し、そのプロジェクトで課金が有効になっていることと、BigQuery API が有効になっていることを確認してください。
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- 新しいプロジェクトでは、BigQuery API が自動的に有効になります。既存のプロジェクトで BigQuery API を有効にするには、
Enable the BigQuery API.
に移動します。
BigQuery データセットを作成する
まず、BI Engine マネージド テーブルを格納する BigQuery データセットを作成します。データセットを作成する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
ナビゲーション パネルの [エクスプローラ] パネルで、プロジェクト名をクリックします。
詳細パネルで、
(アクションを表示)をクリックし、[データセットを作成] をクリックします。[データセットの作成] ページで、次の操作を行います。
- [データセット ID] に「
biengine_tutorial
」と入力します。 [データのロケーション] で、us(米国の複数のリージョン)と、一般公開データセットが保存されるマルチリージョンのロケーションを選択します。
このチュートリアルでは、[テーブルの有効期限を有効にする] を選択し、テーブルが期限切れになるまでの日数を指定できます。
- [データセット ID] に「
その他のデフォルト設定はすべてそのままにし、[データセットを作成] をクリックします。
一般公開データセットからデータをコピーしてテーブルを作成する
このチュートリアルでは、Google Cloud 一般公開データセット プログラムを通じて提供されているデータセットを使用します。一般公開データセットは BigQuery でホストされ、ユーザーがアクセスして独自のアプリケーションに統合できます。
このセクションでは、San Francisco 311 サービス リクエストのデータセットからデータをコピーしてテーブルを作成します。データセットは、Google Cloud コンソールで探すことができます。
テーブルを作成する
テーブルを作成する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] パネルで「
san_francisco_311
」を検索します。[エクスプローラ] パネルで、[san_francisco_311] を開き、[311_service_requests] テーブルをクリックします。
エクスプローラのツールバーで [コピー] をクリックします。
[テーブルのコピー] ダイアログの [宛先] セクションで、次の操作を行います。
- [プロジェクト名] で [参照] をクリックし、プロジェクトを選択します。
- [データセット名] で [biengine_tutorial] を選択します。
テーブル名に「
311_service_requests_copy
」と入力します。
[コピー] をクリックします。
省略可: コピージョブが完了したら、
PROJECT_NAME
> biengine_tutorial を開き、311_service_requests_copy > [プレビュー] をクリックして、テーブルの内容を確認します。PROJECT_NAME
は、このチュートリアルで使用する Google Cloud プロジェクトの名前に置き換えます。
BI Engine 予約を作成する
Google Cloud コンソールで、[管理] の下にある [BI Engine] ページに移動します。
[
予約を作成] をクリックします。[予約の作成] ページで、BI Engine の予約を構成します。
- [プロジェクト] リストで、Google Cloud プロジェクトを確認します。
- [ロケーション] リストで、ロケーションを選択します。ロケーションは、クエリするデータセットのロケーションと一致する必要があります。
[容量(GiB)] スライダーを、予約するメモリ容量に合わせます。次の例では、容量を 2 GB に設定しています。上限は 250 GiB です。
[次へ] をクリックします。
[優先テーブル] セクションで、必要に応じて BI Engine で高速化するテーブルを指定します。テーブル名を調べる手順は次のとおりです。
- [テーブル ID] フィールドに、BI Engine で高速化するテーブルの名前の一部を入力します(例:
311
)。 名前の候補リストから、テーブル名を選択します。
指定したテーブルのみが高速化の対象となります。優先テーブルが指定されていない場合は、すべてのプロジェクト クエリが高速化の対象となります。
- [テーブル ID] フィールドに、BI Engine で高速化するテーブルの名前の一部を入力します(例:
[次へ] をクリックします。
[確認して送信] セクションで、内容を確認します。
利用規約に同意する場合は、[作成] をクリックします。
予約を確認すると、[予約] ページに詳細が表示されます。
Looker Studio でデータソース接続を作成する
Looker Studio でレポートを作成する前に、レポートのデータソースを作成する必要があります。レポートには 1 つ以上のデータソースを含めることができます。Looker Studio は、BigQuery コネクタを使用して、BI Engine が管理する BigQuery テーブルに接続します。
Looker Studio でデータソース接続を定義すると、BI Engine は構成されたテーブルと列を使用して、キャッシュに保存するデータを決定します。BI Engine は、レポートに追加した列のみをキャッシュに保存します。
必要な権限
BigQuery データソースを Looker Studio レポートに追加するには、適切な権限が必要です。また、BigQuery データセットに適用される権限は、Looker Studio で作成したレポート、グラフ、ダッシュボードにも適用されます。Looker Studio レポートが共有されている場合は、適切な権限を持つユーザーにのみ、レポートの構成要素が表示されます。
レポートの入力に使用されるクエリジョブを実行するには、bigquery.jobs.create
権限が必要です。クエリジョブを正常に完了するには、クエリで参照されるテーブルを含むデータセットに対するアクセス権もユーザーまたはグループに付与されている必要があります。最低でも必要なアクセスレベルは閲覧者で、これは、そのデータセットの bigquery.dataViewer
ロールにマッピングされています。
このチュートリアルで使用するデータセットは新しく作成しているので、データセットへのオーナー アクセス権が付与され、データセットを完全に制御できる状態になっています。また、このチュートリアルで使用したプロジェクトも作成しているので、プロジェクト レベルでオーナー アクセス権を取得しています。このオーナー アクセス権により、プロジェクトでジョブを実行できます。
権限の詳細
次の IAM 事前定義ロールを付与することで、プロジェクト レベルで bigquery.jobs.create
権限を設定できます。
bigquery.user
bigquery.jobUser
bigquery.admin
ユーザーまたはグループにプロジェク トレベルで bigquery.user
ロールを付与すると、デフォルトでは、プロジェクト内のデータセット、テーブル、ビューへのアクセス権は付与されません。bigquery.user
は、ユーザーが独自のデータセットを作成したり、アクセス権が付与されているデータセットに対してクエリジョブを実行できるようにするためのロールです。bigquery.user
または bigquery.jobUser
ユーザーロールを割り当てる際は、そのユーザーまたはグループがアクセスする必要のある、他のユーザーまたはグループによって作成されたデータセットに対するアクセス制御も割り当てる必要があります。
データセットに対するアクセス権を割り当てる際のオプションには、次の 3 つがあります。
- 閲覧可能は、そのデータセットの bigquery.dataViewer ロールにマッピングされます。
- 編集可能は、そのデータセットの bigquery.dataEditor ロールにマッピングされています。
- オーナーは、そのデータセットの bigquery.dataOwner ロールにマッピングされています。
ユーザーがクエリを実行するために必要な最小のアクセス権限は、閲覧可能です。
BigQuery の IAM ロールの詳細は、BigQuery のドキュメントのアクセス制御をご覧ください。
BigQuery でのデータセットの保護については、BigQuery ドキュメントのデータセットへのアクセスの制御をご覧ください。
データソースの作成
データソースを作成するには、次の操作を行います。
Looker Studio を開きます。
[レポート] ページの [新しいレポートの開始] で、空のレポート テンプレートをクリックします。これによって、新しい無題のレポートが作成されます。
プロンプトが表示されたら、[マーケティング設定] と [アカウントとプライバシー] に値を設定して、[保存] をクリックします。設定を保存した後、もう一度 [空のレポート] テンプレートのクリックが必要になる場合があります。
[データソースを追加] ウィンドウで [新しいデータソースを作成] をクリックします。
[Google コネクタ] セクションで BigQuery にカーソルを合わせて、[選択] をクリックします。
[承認] セクションにある [承認] をクリックします。これにより、Looker Studio から Google Cloud プロジェクトにアクセスできるようになります。
[Request for permission] ダイアログ ボックスで [許可] をクリックして、Looker Studio で BigQuery のデータを表示できるようにします。以前に Looker Studio を使用した場合には、このプロンプトが表示されない可能性があります。
[プロジェクト] ペインで [マイ プロジェクト] が選択された状態のままにし、プロジェクトの名前をクリックします。
[データセット] ペインで [biengine_tutorial] をクリックします。
[テーブル] ペインで、[311_service_requests_copy] をクリックします。
ウィンドウの右上にある [接続] をクリックします。Looker Studio が BigQuery データソースに接続されると、テーブルのフィールドが表示されます。このページは、フィールドのプロパティの調整や、新しい計算フィールドの作成に使用できます。
右上にある [レポートに追加] をクリックします。
プロンプトが表示されたら、[レポートに追加] をクリックします。
[Request for permission] ダイアログ ボックスで [許可] をクリックして、Looker Studio で Google Drive 内のファイルを表示および管理できるようにします。以前に Looker Studio を使用した場合には、このプロンプトが表示されない可能性があります。
グラフの作成
データソースをレポートに追加したら、次にデータを可視化します。ここでは棒グラフの作成から始めます。作成した棒グラフには、地域別の上位のクレームが表示されます。
近隣地域のクレームを表示する棒グラフを作成するには、次の操作を行います。
(省略可)ページの先頭にある [無題のレポート] をクリックして、レポート名を変更します。たとえば、
BI Engine tutorial
と入力します。レポート エディタが読み込まれたら、[挿入] > [棒グラフ] をクリックします。
ハンドルを使用して、グラフのサイズを拡大します。
[データ] タブで、データソースの値が
311_service_requests_copy
になっていることを確認します。近隣地域別のリクエスト数をグラフ化するには、ディメンションを
category
に、内訳ディメンションをneighborhood
に設定します。デフォルトのディメンション(status
など)をクリックして、リストから [カテゴリ] を選択します。使用可能なフィールドのリストで [近隣地域] をクリックして、[Breakdown dimension] の [Add dimension here] ボックスにドラッグします。
フィルタを追加する
データには、neighborhood
列にNULL
値が含まれているため、グラフから NULL
値を削除するフィルタを追加します。
フィルタを追加するには、次の操作を行います。
[データ] タブで [フィルタを追加] をクリックします。
[Create filter] ダイアログで:
- 名前として「Exclude nulls」と入力します。
- データソースが
311_service_requests_copy
に設定されていることを確認します。 - [含む] をクリックし、[除外] を選択します。
- [フィールドを選択] をクリックして、[近隣地域] を選択します。
[Select a condition] をクリックして [=null] を選択します。
[保存] をクリックします。
フィルタを適用すると、グラフは次のようになります。
クリーンアップ
このクイックスタートで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、プロジェクトと BI Engine 予約のどちらか、または両方を削除してください。
プロジェクトの削除
課金をなくす最も簡単な方法は、チュートリアル用に作成したプロジェクトを削除することです。
プロジェクトを削除するには:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
予約の削除
プロジェクトを残す場合は、容量の予約を削除することで、BI Engine の費用発生を回避できます。
予約を削除する手順は次のとおりです。
Google Cloud コンソールで、[管理] の下にある [BI Engine] ページに移動します。
[予約] セクションで、予約を探します。
[操作] 列で、予約の右側にある
アイコンをクリックし、[削除] を選択します。[予約を削除しますか?] ダイアログで「削除」を入力して、[削除] をクリックします。
次のステップ
- BigQuery BI Engine の概要で BigQuery BI Engine の概要を確認する。
- Looker Studio について、ヘルプセンターで詳しく学習する。
- 容量の予約方法を確認する。
- BigQuery BI Engine の料金の詳細を確認する。