Google Cloud コンソールを使用してデータを読み込んでクエリを実行する

Google Cloud コンソールを使用してデータセットを作成する方法、BigQuery テーブルにサンプルデータを読み込む方法、テーブルに対してクエリを実行する方法について説明します。

このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、ガイドを表示をクリックしてください。

始める前に

BigQuery を使用する前に、Google Cloud コンソールにログインしてプロジェクトを作成する必要があります。プロジェクトで課金を有効にしていない場合、アップロードしたデータはすべて BigQuery サンドボックスに保存されます。このサンドボックスでは制限付きの BigQuery 機能を使用しながら、BigQuery について料金なしで学習できます。詳細については、BigQuery サンドボックスを有効にするをご覧ください。

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

省略可: 既存のプロジェクトを選択する場合は、必ず BigQuery API を有効にしてください。新しいプロジェクトでは、BigQuery API が自動的に有効になります。

BigQuery データセットを作成する

Google Cloud コンソールを使用して、データを保存するデータセットを作成します。

Google Cloud コンソールで、[BigQuery] ページを開きます。

[BigQuery] に移動

[エクスプローラ] ペインでプロジェクト名をクリックします。
[アクションを表示] をクリックします。
[データセットを作成] を選択します。
[データセットを作成する] ページで、次の操作を行います。

[データセット ID] に「babynames」と入力します。
[ロケーションタイプ] で [マルチリージョン] を選択してから、[US（米国の複数のリージョン）] を選択します。一般公開データセットは us マルチリージョンロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。
残りのデフォルトの設定は変更せず、[データセットを作成] をクリックします。

ソースデータファイルをダウンロードする

ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。

データセットの詳細については、社会保障局のデータセットの情報ページをご覧ください。

新しいブラウザタブで次の URL を開き、米国社会保障局のデータセットをダウンロードします。
```
https://www.ssa.gov/OACT/babynames/names.zip
```
ファイルを抽出します。

データセットスキーマの詳細については、zip ファイルの NationalReadMe.pdf ファイルをご覧ください。
データの内容を確認するには、yob2014.txt ファイルを開きます。このファイルには、名前、出生時の性別、その名前の子供の数の値がカンマ区切りで含まれています。このファイルにはヘッダー行がありません。
後で確認できるように、yob2014.txt ファイルの場所をメモします。

テーブルにデータを読み込む

次に、新しいテーブルにデータを読み込みます。

[エクスプローラ] ペインでプロジェクト名をクリックします。
babynames データセットの横にある [アクションを表示] をクリックし、[開く] を選択します。
[テーブルを作成] をクリックします。
特に指示のない限り、すべての設定にデフォルト値を使用します。
[テーブルの作成] ページで、次の操作を行います。

[ソース] セクションで、[テーブルの作成元] リストから [アップロード] を選択します。
[ファイルを選択] フィールドで [参照] をクリックします。
ローカルの yob2014.txt ファイルを選択して [開く] をクリックします。
[ファイル形式] リストから [CSV] を選択します。
[宛先] セクションの [テーブル] フィールドに「names_2014」と入力します。
[スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキストフィールドに貼り付けます。

name:string,assigned_sex_at_birth:string,count:integer

[テーブルを作成] をクリックします。

BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery によるデータの読み込みが完了したら、[個人履歴] と [プロジェクト履歴] ペインを開いてジョブの詳細を確認します。

テーブルデータのプレビューを確認する

テーブルデータのプレビューを表示する手順は次のとおりです。

[エクスプローラ] ペインで、プロジェクトと babynames データセットを開いて、names_2014 テーブルを選択します。
[プレビュー] タブをクリックします。テーブルの最初の数行が BigQuery に表示されます。

[プレビュー] タブは、すべてのテーブルタイプで使用できるわけではありません。たとえば、[プレビュー] タブは、外部のテーブルやビューには表示されません。

テーブルデータをクエリする

次に、テーブルにクエリを実行します。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

詳細ペインで、[SQL クエリ] をクリックします。新しいエディタタブが開きます。

次のクエリをコピーしてクエリエディタに貼り付けます。このクエリは、2014 年に生まれた米国の男児に割り当てられた米国の新生児の名前の上位 5 つを取得します。


    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      assigned_sex_at_birth = 'M'
    ORDER BY
      count DESC
    LIMIT
      5;

[実行] をクリックします。結果が [クエリ結果] セクションに表示されます。

一般公開データセット内のテーブルに対してクエリを正常に実行し、 Google Cloud コンソールを使用してサンプルデータを BigQuery に読み込みました。

クリーンアップする

このページで使用したリソースについて、 Google Cloud アカウントに課金されないようにするには、次の手順を実施します。

Google Cloud コンソールで、[BigQuery] ページを開きます。

[BigQuery] に移動

[エクスプローラ] ペインで、作成した babynames データセットをクリックします。
[アクションを表示] オプションを開いて、[削除] をクリックします。
[データセットの削除] ダイアログで削除コマンドを確定します。「delete」という単語を入力して、[削除] をクリックします。

次のステップ

Google Cloud コンソールの使用方法の詳細については、 Google Cloud コンソールの使用をご覧ください。
BigQuery へのデータの読み込みの詳細については、データの読み込みの概要をご覧ください。
データのクエリの詳細については、BigQuery データのクエリの概要をご覧ください。
ネストされたデータと繰り返しデータを使用した JSON ファイルの読み込みについて学習するには、ネストされた JSON データと繰り返し JSON データの読み込みを参照してください。
プログラムで BigQuery にアクセスする方法については、REST API リファレンスまたは BigQuery クライアントライブラリのページをご覧ください。

Google Cloud コンソールを使用してデータを読み込んでクエリを実行する

始める前に

BigQuery データセットを作成する

ソースデータ ファイルをダウンロードする

テーブルにデータを読み込む

テーブルデータのプレビューを確認する

テーブルデータをクエリする

クリーンアップする

次のステップ

ソースデータファイルをダウンロードする