Google Cloud コンソールを使用してデータを読み込んでクエリを実行する
Google Cloud コンソールを使用してデータセットを作成する方法、BigQuery テーブルにサンプルデータを読み込む方法、テーブルに対してクエリを実行する方法について説明します。
このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、ガイドを表示をクリックしてください。
始める前に
BigQuery を使用する前に、Google Cloud コンソールにログインしてプロジェクトを作成する必要があります。プロジェクトで課金を有効にしていない場合、アップロードしたデータはすべて BigQuery サンドボックスに保存されます。このサンドボックスでは制限付きの BigQuery 機能を使用しながら、BigQuery について料金なしで学習できます。詳細については、BigQuery サンドボックスを有効にするをご覧ください。- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- 省略可: 既存のプロジェクトを選択する場合は、必ず BigQuery API を有効にしてください。新しいプロジェクトでは、BigQuery API が自動的に有効になります。
- Google Cloud コンソールで、[BigQuery] ページを開きます。 [BigQuery] に移動
- [
エクスプローラ ] ペインでプロジェクト名をクリックします。 - [アクションを表示] をクリックします。
- [データセットを作成] を選択します。
- [データセットを作成する] ページで、次の操作を行います。
- [データセット ID] に「
babynames
」と入力します。 - [ロケーション タイプ] で [マルチリージョン] を選択してから、[US(米国の複数のリージョン)] を選択します。一般公開データセットは
us
マルチリージョン ロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。 - 残りのデフォルトの設定は変更せず、
[データセットを作成] をクリックします。 新しいブラウザタブで次の URL を開き、米国社会保障局のデータセットをダウンロードします。
https://www.ssa.gov/OACT/babynames/names.zip
ファイルを抽出します。
データセット スキーマの詳細については、zip ファイルの
NationalReadMe.pdf
ファイルをご覧ください。データの内容を確認するには、
yob2014.txt
ファイルを開きます。このファイルには、名前、出生時の性別、その名前の子供の数の値がカンマ区切りで含まれています。このファイルにはヘッダー行がありません。後で確認できるように、
yob2014.txt
ファイルの場所をメモします。- [
エクスプローラ ] ペインでプロジェクト名をクリックします。 - babynames データセットの横にある [アクションを表示] をクリックし、[開く] を選択します。
- [テーブルを作成]
特に指示のない限り、すべての設定にデフォルト値を使用します。
をクリックします。 - [テーブルの作成] ページで、次の操作を行います。
- [ソース] セクションで、[
テーブルの作成元 ] リストから [アップロード] を選択します。 - [ファイルを選択] フィールドで [参照] をクリックします。
- ローカルの
yob2014.txt
ファイルを選択して [開く] をクリックします。 - [
ファイル形式 ] リストから [CSV] を選択します。 - [宛先] セクションの [
テーブル ] フィールドに「names_2014
」と入力します。 - [スキーマ] セクションで [
テキストとして編集 ] をクリックし、次のスキーマ定義をテキスト フィールドに貼り付けます。 [
テーブルを作成 ] をクリックします。BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery によるデータの読み込みが完了したら、[
個人履歴] と [プロジェクト履歴 ] ペインを開いてジョブの詳細を確認します。- [
エクスプローラ ] ペインで、プロジェクトとbabynames
データセットを開いて、names_2014
テーブルを選択します。 - [
プレビュー ] タブをクリックします。テーブルの最初の数行が BigQuery に表示されます。 - 詳細ペインで、[SQL クエリ] をクリックします。新しいエディタタブが開きます。
- 次のクエリをコピーしてクエリエディタに貼り付けます。このクエリは、2014 年に生まれた米国の男児に割り当てられた米国の新生児の名前の上位 5 つを取得します。
SELECT name, count FROM `babynames.names_2014` WHERE assigned_sex_at_birth = 'M' ORDER BY count DESC LIMIT 5;
[実行] をクリックします。結果が [クエリ結果] セクションに表示されます。
- Google Cloud コンソールで、[BigQuery] ページを開きます。 [BigQuery] に移動
- [エクスプローラ] ペインで、作成した
babynames
データセットをクリックします。 - [アクションを表示] オプションを開いて、[削除] をクリックします。
- [データセットの削除] ダイアログで削除コマンドを確定します。「
delete
」という単語を入力して、[削除] をクリックします。 - Google Cloud コンソールの使用方法の詳細については、 Google Cloud コンソールの使用をご覧ください。
- BigQuery へのデータの読み込みの詳細については、データの読み込みの概要をご覧ください。
- データのクエリの詳細については、BigQuery データのクエリの概要をご覧ください。
- ネストされたデータと繰り返しデータを使用した JSON ファイルの読み込みについて学習するには、ネストされた JSON データと繰り返し JSON データの読み込みを参照してください。
- プログラムで BigQuery にアクセスする方法については、REST API リファレンスまたは BigQuery クライアント ライブラリのページをご覧ください。
BigQuery データセットを作成する
Google Cloud コンソールを使用して、データを保存するデータセットを作成します。
ソースデータ ファイルをダウンロードする
ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。データセットの詳細については、社会保障局のデータセットの情報ページをご覧ください。
テーブルにデータを読み込む
次に、新しいテーブルにデータを読み込みます。
name:string,assigned_sex_at_birth:string,count:integer
テーブルデータのプレビューを確認する
テーブルデータのプレビューを表示する手順は次のとおりです。

テーブルデータをクエリする
次に、テーブルにクエリを実行します。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。
一般公開データセット内のテーブルに対してクエリを正常に実行し、 Google Cloud コンソールを使用してサンプルデータを BigQuery に読み込みました。
クリーンアップする
このページで使用したリソースについて、 Google Cloud アカウントに課金されないようにするには、次の手順を実施します。