GCP Console でのウェブ UI を使用したクイックスタート

GCP Console で BigQuery ウェブ UI をビジュアル インターフェースとして使用し、クエリの実行、データの読み込み、データのエクスポートなどのタスクを完了できます。このクイックスタートでは、一般公開データセット内のテーブルに対してクエリを実行する方法と、GCP Console を使用してサンプルデータを BigQuery に読み込む方法について説明します。

は、

始める前に

  1. Google アカウントにログインします。

    Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。

  2. GCP プロジェクトを選択または作成します。

    [リソースの管理] ページに移動

  3. プロジェクトに対して課金が有効になっていることを確認します。

    課金を有効にする方法について

  4. 新しいプロジェクトでは、BigQuery が自動的に有効になります。 既存のプロジェクトで BigQuery を有効にするには、以下にアクセスします。 BigQuery API を有効にします。

    APIを有効にする

一般公開データセットに対してクエリを実行する

BigQuery ウェブ UI には、テーブルに対してクエリを実行するためのインターフェースが用意されており、BigQuery が提供する一般公開テーブルも利用できます。

この例では、一般公開データセットの USA Name データをクエリし、1910 年から 2013 年の間で米国で最も一般的な名前を判別します。

BigQuery 一般公開データセットは、デフォルトでは GCP Console に表示されません。一般公開データセット プロジェクトを開くには、ブラウザに次の URL を入力します。

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

プロジェクトを開いたら、そのプロジェクトを固定します

一般公開データセットのデータをクエリするには:

  1. GCP Console の BigQuery ウェブ UI に移動します。

    BigQuery ウェブ UI に移動

  2. ウィンドウの右上にある [クエリを新規作成] をクリックします。

    クエリの作成ボタン

  3. 次のクエリをコピーしてクエリテキスト ボックスに貼り付けます。

    SELECT
    name, gender,
    SUM(number) AS total
    FROM
    `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
    name, gender
    ORDER BY
    total DESC
    LIMIT
    10
    
  4. ウィンドウの右下のクエリ検証ツールを確認します。

    クエリ検証ツール

    クエリが有効な場合、緑色のチェックマーク アイコンが表示されます。クエリが無効な場合は、赤色の感嘆符アイコンが表示されます。クエリが有効な場合は、検証ツールはクエリの実行時に処理されるデータ量も示します。処理されるデータ量は、クエリ実行のコストを判断するのに役立ちます。

  5. [クエリを実行] をクリックします。クエリ ウィンドウの下にクエリ結果ページが表示されます。クエリ結果ページの上部には、経過時間とクエリによって処理されたデータが表示されます。[Query complete...] メッセージの下にはクエリ結果がテーブルに表示されます。クエリで選択した各列の名前が含まれているヘッダー行も表示されます。

    BigQuery ウェブ UI クエリ結果

上のクエリは、BigQuery が提供する一般公開データセットのテーブルにアクセスします。bigquery-public-data プロジェクトを開いて、他の一般公開データセットを閲覧できます。一般公開データ プロジェクトを開くには、ブラウザに次の URL を入力します。

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

詳細については、BigQuery 一般公開データセットをご覧ください。

テーブルにデータを読み込む

次に、データをテーブルに読み込んでクエリします。

クイックスタートのこのセクションを実行するには、課金を有効にする必要があります。詳細については、始める前にをご覧ください。

データをダウンロードする

ダウンロードするファイルには、米国社会保障局から提供された、人気のある赤ちゃんの名前に関する約 7 MB のデータが含まれています。

  1. 赤ちゃんの名前の zip ファイルをダウンロードします。

  2. 自分のマシン上でファイルを解凍します。

    zip ファイルには、データセットについて説明した NationalReadMe.pdf ファイルが含まれています。 このデータセットの詳細をご確認いただけます

  3. yob2014.txt というファイルを開いて、データの内容を確認します。このファイルは、名前、性別(M または F)、およびその名前の子供の数を示す 3 つの列を含んだ、カンマ区切り値(CSV)ファイルです。このファイルにヘッダー行はありません。

  4. 後で確認できるように、yob2014.txt ファイルの場所をメモします。

データセットを作成する

次に、データを保存するデータセットをウェブ UI で作成します。

  1. 必要に応じて、BigQuery ウェブ UI を開きます。

    BigQuery ウェブ UI に移動

  2. ナビゲーション パネルの [リソース] セクションで、プロジェクト名をクリックします。

  3. 右側の詳細パネルで、[データセットを作成] をクリックします。

  4. [データセットを作成] ページで次の操作を行います。

    • [データセット ID] に「babynames」と入力します。
    • [データのロケーション] で [米国(US)] を選択します。現在、一般公開データセットは US マルチリージョン ロケーションに保存されています。わかりやすくするため、データセットは同じロケーションに配置してください。

      データセットの作成ページ

  5. その他のデフォルト設定はすべてそのままにし、[データセットを作成] をクリックします。

新しいテーブルにデータを読み込む

次に、新しいテーブルにデータを読み込みます。

  1. ナビゲーション パネルの [リソース] セクションで、作成した babynames データセットをクリックします。

  2. 右側の詳細パネルで [テーブルを作成] をクリックします。

    別途指定のない限り、すべての設定にデフォルト値を使用します。

  3. [テーブルの作成] ページで次の操作を行います。

    • [ソースデータ] で [空のテーブル] をクリックし、[アップロード] を選択します。
    • [ファイルを選択] で [参照] をクリックし、yob2014.txt ファイルを選択して [開く] をクリックします。
    • [ファイル形式] で [Avro] をクリックし、[CSV] を選択します。
    • [抽出先テーブル] に「names_2014」と入力します。
    • [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をボックスに貼り付けます。

      name:string,gender:string,count:integer

      新しいテーブルページ

  4. [テーブルを作成] をクリックします。

  5. BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery がデータを読み込んでいる間、ナビゲーション パネルのジョブ履歴の横に(1 件が実行中)という文字列が表示されます。データが読み込まれると、この文字列は消えます。

テーブルをプレビューする

(1 件が実行中)の文字列が消えたら、テーブルにアクセスできるようになります。最初の数行のデータをプレビューする手順は次のとおりです。

  1. ナビゲーション パネルで、babynames、names_2014 の順に選択します。

  2. 詳細パネルで [プレビュー] タブをクリックします。

    BigQuery ウェブ UI でのテーブルのプレビュー

テーブルに対してクエリを実行する

データをテーブルに読み込んだら、クエリを実行できます。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

  1. 必要に応じて [クエリを新規作成] ボタンをクリックします。以前に非表示にしていない限り、クエリ ウィンドウは表示されています。

  2. 次のクエリをコピーしてクエリテキスト ボックスに貼り付けます。このクエリは、2014 年の米国の男の子の赤ちゃんの名前の上位 5 つを取得します。

    SELECT
    name, count
    FROM
    `babynames.names_2014`
    WHERE
    gender = 'M'
    ORDER BY count DESC LIMIT 5

  3. [クエリを実行] をクリックします。結果はクエリ ウィンドウの下に表示されます。

    クエリ結果の名前

クリーンアップ

このクイックスタートで使用したリソースについて GCP アカウントに課金されないようにする手順は次のとおりです。

  1. 必要に応じて、BigQuery ウェブ UI を開きます。

    BigQuery ウェブ UI に移動

  2. ナビゲーション パネルの [リソース] セクションで、作成した babynames データセットをクリックします。

  3. 詳細パネルの右側で [データセットを削除] をクリックします。この操作を行うと、データセット、テーブル、すべてのデータが削除されます。

  4. [データセットの削除] ダイアログ ボックスにデータセットの名前(babynames)を入力し、[削除] をクリックすることで削除コマンドを確定します。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

ご不明な点がありましたら、Google のサポートページをご覧ください。