Google Cloud Console をビジュアル インターフェースとして使用して、クエリの実行、データの読み込み、データのエクスポートなどのタスクを実行できます。このクイックスタートでは、一般公開データセット内のテーブルをクエリする方法と、Cloud Console を使用してサンプルデータを BigQuery に読み込む方法について説明します。
始める前に
- Google アカウントにログインします。
Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
- 新しいプロジェクトでは、BigQuery が自動的に有効になります。既存のプロジェクトで BigQuery を有効にするには、 BigQuery API を有効にします。 にアクセスします。
- クレジット カード情報の提供やプロジェクトに対する課金の有効化を行わない場合は、BigQuery によってサンドボックスが提供されます。このトピックの手順は、プロジェクトへの課金が有効かどうかに関係なく機能します。必要に応じて課金を有効にする場合は、課金を有効にする方法についてをご覧ください。
一般公開データセットに対してクエリを実行する
Cloud Console には、テーブルに対してクエリを行うためのインターフェースが用意されており、BigQuery が提供する一般公開データセットも利用できます。
この例では、一般公開データセットの USA Name データをクエリし、1910 年から 2013 年までの米国で最も一般的な名前を調べます。
BigQuery の一般公開データセットは、デフォルトで Cloud Console に表示されます。一般公開データセット プロジェクトを手動で開くには、ブラウザに次の URL を入力します。
https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project
一般公開データセットのデータをクエリする手順は次のとおりです。
Cloud Console の BigQuery ページに移動します。
[エディタ] タブが表示されていない場合は、[クエリを新規作成]
をクリックします。次のクエリをコピーして、[エディタ] フィールドに貼り付けます。
SELECT name, gender, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name, gender ORDER BY total DESC LIMIT 10
クエリが有効な場合は、クエリによって処理されるデータの量とともにチェックマークが表示されます。この指標は、クエリ実行のコストを判断するのに役立ちます。クエリが無効な場合は、感嘆符がエラー メッセージとともに表示されます。
[実行] をクリックします。クエリ ウィンドウの下にクエリ結果ページが表示されます。クエリ結果ページの上部には、経過時間とクエリによって処理されたデータが表示されます。
Query complete...
メッセージの下に、クエリで選択した各列の名前を含むヘッダー行とともに、クエリの結果が表示されます。
テーブルにデータを読み込む
次に、データをテーブルに読み込んでクエリします。
データをダウンロードする
ダウンロードするファイルには、米国社会保障局から提供された、人気のある赤ちゃんの名前に関する約 7 MB のデータが含まれています。
赤ちゃんの名前の zip ファイルをダウンロードします。
自分のマシン上にそのファイルを展開します。
この zip ファイルには、データセットについて説明した
NationalReadMe.pdf
ファイルが含まれています。このデータセットの詳細yob2014.txt
というファイルを開いて、データの内容を確認します。このファイルは、名前、性別(M
またはF
)、その名前の子供の数を示す 3 つの列を含んだ、カンマ区切り値(CSV)ファイルです。このファイルにヘッダー行はありません。後で確認できるように、
yob2014.txt
ファイルの場所をメモします。
データセットを作成する
次に、データを保存するため、Cloud Console でデータセットを作成します。
必要に応じて、Cloud Console で BigQuery ページを開きます。
[エクスプローラ] パネルでプロジェクト名をクリックします。
詳細パネルで [データセットを作成]
をクリックします。[データセットの作成] ページで、次の操作を行います。
- [データセット ID] に
babynames
を入力します。 [データのロケーション] で [米国(US)] を選択します。現在、一般公開データセットは
US
マルチ リージョン ロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに配置します。
- [データセット ID] に
その他のデフォルト設定はすべてそのままにし、[データセットを作成] をクリックします。
新しいテーブルにデータを読み込む
次に、新しいテーブルにデータを読み込みます。
[エクスプローラ] パネルで、作成した babynames データセットをクリックします。
詳細パネルで [テーブルを作成]
をクリックします。別途指定のない限り、すべての設定にデフォルト値を使用します。
[テーブルの作成] ページで、次の操作を行います。
- [ソース] セクションの [テーブルの作成元] で [アップロード] を選択します。
- [ファイルを選択] で [参照] をクリックし、
yob2014.txt
ファイルを選択して [開く] をクリックします。 - [ファイル形式] で [CSV] を選択します。
- [送信先] セクションの [テーブル名] に「
names_2014
」と入力します。 [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をボックスに貼り付けます。
name:string,gender:string,count:integer
[テーブルを作成] をクリックします。
BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery によるデータの読み込みが完了すると、[ジョブ履歴] パネルにチェックマークが表示されます。
テーブルをプレビューする
最初の数行のデータをプレビューする手順は次のとおりです。
[エクスプローラ] パネルで [babynames] を展開し、[names_2014] を選択します。
詳細パネルで、[プレビュー] をクリックします。テーブルの最初の数行が BigQuery に表示されます。
テーブルに対してクエリを実行する
テーブルにデータが読み込まれたので、クエリできます。手順は前の例と同じです。ただし、今回は、一般公開テーブルではなく自分のテーブルをクエリします。
[クエリを新規作成]
をクリックします。新しいクエリエディタのタブが開きます。次のクエリをコピーしてクエリテキスト ボックスに貼り付けます。このクエリにより、2014 年の米国の男の子の赤ちゃんの名前の上位 5 つが取得されます。
SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5
[実行] をクリックします。結果はクエリ ウィンドウの下に表示されます。
クリーンアップ
このクイックスタートで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
必要に応じて、Cloud Console で BigQuery ページを開きます。
[エクスプローラ] パネルで、作成した babynames データセットをクリックします。
詳細パネルで、[データセットを削除] をクリックします。この操作を行うと、データセット、テーブル、すべてのデータが削除されます。
[データセットの削除] ダイアログで、データセットの名前(
babynames
)を入力し、[削除] をクリックして確定します。
次のステップ
Cloud Console の使用方法について詳しくは、Cloud Console の使用をご覧ください。
ネストされたデータと繰り返しデータを使用した JSON ファイルの読み込みについて学習するには、ネストされた JSON データと繰り返し JSON データの読み込みを参照してください。
BigQuery へのデータの読み込みの詳細については、データの読み込みの概要をご覧ください。
データのクエリの詳細については、BigQuery データのクエリの概要をご覧ください。
プログラムで BigQuery にアクセスする方法については、REST API リファレンスまたは BigQuery クライアント ライブラリのページをご覧ください。