GCP Console のウェブ UI を使用したクイックスタート

Cloud Console の BigQuery ウェブ UI をビジュアル インターフェースとして使用して、クエリの実行、データの読み込み、データのエクスポートなどのタスクを実行できます。このクイックスタートでは、一般公開データセット内のテーブルをクエリする方法と、Cloud Console を使用してサンプルデータを BigQuery に読み込む方法について説明します。

始める前に

  1. Google アカウントにログインします。

    Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。

  2. Cloud Console のプロジェクト セレクタページで、Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタのページに移動

  3. 新しいプロジェクトでは、BigQuery が自動的に有効になります。既存のプロジェクトで BigQuery を有効にするには、 BigQuery API を有効にします。

    API を有効にする

    にアクセスします。
  4. BigQuery には、クレジット カード情報の登録やプロジェクトに対する課金の有効化を行わないで使用できるサンドボックスがあります。このトピックの手順は、プロジェクトへの課金が有効かどうかに関係なく機能します。必要に応じて課金を有効にする場合は、課金を有効にする方法についてをご覧ください。

一般公開データセットをクエリする

BigQuery ウェブ UI には、テーブルをクエリするためのインターフェースが用意されています。BigQuery が提供する一般公開データセットもクエリできます。

この例では、一般公開データセットの USA Name データをクエリし、1910 年から 2013 年までの米国で最も一般的な名前を調べます。

BigQuery の一般公開データセットは、デフォルトで Cloud Console に表示されます。一般公開データセット プロジェクトを手動で開くには、ブラウザに次の URL を入力します。

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

一般公開データセットのデータをクエリするには:

  1. Cloud Console の BigQuery ウェブ UI に移動します。

    BigQuery ウェブ UI に移動

  2. ウィンドウの右上にある [クエリを新規作成] をクリックします。このテキストがグレー表示されている場合、クエリエディタはすでに開いています。

    クエリの作成ボタン

  3. 次のクエリをコピーしてクエリテキスト ボックスに貼り付けます。

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. ウィンドウの右下にある緑色のチェックマークをクリックして、クエリ検証ツールを表示します。

    クエリ検証ツール

    クエリが有効な場合、緑色のチェックマーク アイコンが表示されます。クエリが無効な場合は、赤色の感嘆符アイコンが表示されます。クエリが有効な場合は、検証ツールはクエリの実行時に処理されるデータ量も示します。処理されるデータ量は、クエリ実行のコストを判断するのに役立ちます。

  5. [実行] をクリックします。クエリ ウィンドウの下にクエリ結果ページが表示されます。クエリ結果ページの上部には、経過時間とクエリによって処理されたデータが表示されます。Query complete... メッセージの下に、クエリで選択した各列の名前を含むヘッダー行とともに、クエリの結果が表示されます。

    BigQuery ウェブ UI クエリ結果

テーブルにデータを読み込む

次に、データをテーブルに読み込んでクエリします。

データをダウンロードする

ダウンロードするファイルには、米国社会保障局から提供された、人気のある新生児の名前に関する約 7 MB のデータが含まれています。

  1. 赤ちゃんの名前の zip ファイルをダウンロードします。

  2. 自分のマシン上でファイルを解凍します。

    この zip ファイルには、データセットについて説明した NationalReadMe.pdf ファイルが含まれています。このデータセットの詳細

  3. yob2014.txt というファイルを開いて、データの内容を確認します。このファイルは、名前、性別(M または F)、その名前の子供の数を示す 3 つの列を含んだ、カンマ区切り値(CSV)ファイルです。このファイルにヘッダー行はありません。

  4. 後で確認できるように、yob2014.txt ファイルの場所をメモします。

データセットの作成

次に、データを保存するデータセットをウェブ UI で作成します。

  1. 必要に応じて、BigQuery ウェブ UI を開きます。

    BigQuery ウェブ UI に移動

  2. ナビゲーション パネルの [リソース] セクションで、プロジェクト名をクリックします。

  3. 右側の詳細パネルで、[データセットを作成] をクリックします。

    BigQuery ウェブ UI クエリ結果

  4. [データセットを作成] ページで次の操作を行います。

    • [データセット ID] に「babynames」を入力します。
    • [データのロケーション] で [米国(US)] を選択します。現在、一般公開データセットは US マルチ リージョン ロケーションに保存されています。わかりやすくするため、データセットは同じロケーションに配置してください。

      データセットの作成ページ

  5. その他のデフォルト設定はすべてそのままにし、[データセットを作成] をクリックします。

新しいテーブルにデータを読み込む

次に、新しいテーブルにデータを読み込みます。

  1. ナビゲーション パネルの [リソース] セクションで、作成した babynames データセットをクリックします。

  2. 右側の詳細パネルで [テーブルを作成] をクリックします。

    別途指定のない限り、すべての設定にデフォルト値を使用します。

  3. [テーブルの作成] ページで、次の操作を行います。

    • [ソース] の [空のテーブル] をクリックし、[アップロード] を選択します。
    • [ファイルを選択] で [参照] をクリックし、yob2014.txt ファイルを選択して [開く] をクリックします。
    • [ファイル形式] で [Avro] をクリックし、[CSV] を選択します。
    • [送信先] セクションの [テーブル名] に「names_2014」と入力します。
    • [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をボックスに貼り付けます。

        name:string,gender:string,count:integer
        

      新しいテーブルの作成ページ

  4. [テーブルを作成] をクリックします。

  5. BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery がデータを読み込んでいる間、ナビゲーション パネルのジョブ履歴の横に(1 件が実行中)という文字列が表示されます。データが読み込まれると、この文字列は消えます。

テーブルをプレビューする

(1 件が実行中)の文字列が消えたら、テーブルにアクセスできるようになります。最初の数行のデータをプレビューする手順は次のとおりです。

  1. ナビゲーション パネルで、babynames、names_2014 の順に選択します。

  2. 詳細パネルで [プレビュー] タブをクリックします。

    BigQuery ウェブ UI でのテーブルのプレビュー

テーブルに対してクエリを実行する

テーブルにデータが読み込まれたので、クエリできます。手順は前の例と同じです。ただし、今回は、一般公開テーブルではなく自分のテーブルをクエリします。

  1. 必要に応じて [クエリを新規作成] ボタンをクリックします。以前に非表示にしていない限り、クエリ ウィンドウは表示されています。

  2. 次のクエリをコピーしてクエリテキスト ボックスに貼り付けます。このクエリは、2014 年の米国の男の子の赤ちゃんの名前の上位 5 つを取得します。

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. [実行] をクリックします。結果はクエリ ウィンドウの下に表示されます。

    名前のクエリ結果

クリーンアップ

このクイックスタートで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

  1. 必要に応じて、BigQuery ウェブ UI を開きます。

    BigQuery ウェブ UI に移動

  2. ナビゲーション パネルの [リソース] セクションで、作成した babynames データセットをクリックします。

  3. 詳細パネルの右側で [データセットを削除] をクリックします。この操作を行うと、データセット、テーブル、すべてのデータが削除されます。

  4. [データセットの削除] ダイアログ ボックスでデータセットの名前(babynames)を入力して、[削除] をクリックします。

次のステップ