Google Cloud コンソールでデータを読み込んでクエリを実行する

Google Cloud コンソールを使用して、データセットの作成、BigQuery テーブルへのサンプルデータの読み込み、テーブルのクエリを行う方法について説明します。


このタスクを Cloud コンソールで直接行う際の順を追ったガイダンスについては、[ガイドを表示] をクリックしてください。

ガイドを表示


以降のセクションでは、[ガイドを表示] をクリックした場合と同じ手順について説明します。

準備

BigQuery を使用する前に、Cloud コンソールにログインしてプロジェクトを作成する必要があります。プロジェクトで課金を有効にしていない場合、アップロードしたデータはすべて BigQuery サンドボックスに保存されます。このサンドボックスでは、制限付きの BigQuery 機能を使用しながら、BigQuery について料金なしで学習できます。詳細については、BigQuery サンドボックスを有効にするをご覧ください。

  1. Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  4. 省略可: 既存のプロジェクトを選択する場合は、必ず BigQuery API を有効にしてください。新しいプロジェクトでは、BigQuery API が自動的に有効になります。

BigQuery データセットを作成する

Cloud コンソールを使用して、データを保存するデータセットを作成します。

  1. Cloud コンソールで、[BigQuery] ページを開きます。
  2. BigQuery に移動
  3. [エクスプローラ] パネルでプロジェクト名をクリックします。
  4. [アクションを表示] > [データセットの作成] を展開します。
  5. [データセットの作成] ページで、次の操作を行います。
    1. [データセット ID] に「babynames」を入力します。
    2. [データのロケーション] リストから [us (multiple regions in United States)] を選択します。一般公開データセットは us マルチリージョン ロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。
    3. 残りのデフォルトの設定は変更せず、[データセットを作成] をクリックします。

ソースデータ ファイルをダウンロードする

ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。

データセットの詳細については、社会保障局のデータセットの情報ページをご覧ください。

  1. 新しいブラウザタブで次の URL を開き、米国社会保障局のデータセットをダウンロードします。

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. ファイルを抽出します。

    データセット スキーマの詳細については、zip ファイルの NationalReadMe.pdf ファイルをご覧ください。

  3. データの内容を確認するには、yob2014.txt ファイルを開きます。このファイルには、名前、性別(M または F)、その名前の子供の数のカンマ区切り値が含まれています。このファイルにはヘッダー行がありません。

  4. 後で確認できるように、yob2014.txt ファイルの場所をメモします。

テーブルにデータを読み込む

次に、新しいテーブルにデータを読み込みます。

  1. [エクスプローラ] パネルでプロジェクト名をクリックします。
  2. babynames データセットの横にある [その他の操作] をクリックして、[開く] を選択します。
  3. 詳細パネルで [テーブルを作成] をクリックします。

    特に指示のない限り、すべての設定にデフォルト値を使用します。

  4. [テーブルの作成] ページで、次の操作を行います。
    1. [ソース] セクションで、[テーブルの作成元] リストから [アップロード] を選択します。
    2. [ファイルを選択] フィールドで [参照] をクリックします。
    3. ローカルの yob2014.txt ファイルを選択して [開く] をクリックします。
    4. [ファイル形式] リストから [CSV] を選択します。
    5. [送信先] セクションで、[テーブル] に「names_2014」と入力します。
    6. [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をボックスに貼り付けます。
    7. name:string,gender:string,count:integer
    8. [テーブルを作成] をクリックします。
      BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery によるデータの読み込みが完了したら、[個人履歴] と [プロジェクト履歴] パネルを開いてジョブの詳細を確認します。

テーブルデータのプレビュー

テーブルデータのプレビューを表示する手順は次のとおりです。

  1. [エクスプローラ] パネルで、プロジェクトと babynames データセットを開いて、names_2014 テーブルを選択します。
  2. 詳細パネルで、[プレビュー] をクリックします。テーブルの最初の数行が BigQuery に表示されます。
  3. テーブルの最初の数行が BigQuery に表示されます。 Cloud コンソールのテーブル プレビュー。
[プレビュー] タブは、すべてのテーブルタイプで使用できるわけではありません。たとえば、[プレビュー] タブは、外部のテーブルやビューには表示されません。

テーブルデータをクエリする

次に、テーブルにクエリを実行します。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

  1. [クエリを新規作成] をクリックします。新しいエディタタブが開きます。
  2. [エディタ] フィールドに次のクエリを貼り付けます。このクエリは、2014 年に米国で人気が高かった男の子の名前、上位 5 つを取得します。
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          gender = 'M'
        ORDER BY
          count DESC
        LIMIT
          5
        
  3. [実行] をクリックします。結果が [クエリ結果] セクションに表示されます。
    名前のクエリ結果

一般公開データセット内のテーブルに対してクエリを正常に実行し、Cloud コンソールを使用してサンプルデータを BigQuery に読み込みました。

クリーンアップ

このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

  1. Cloud コンソールで、[BigQuery] ページを開きます。
  2. BigQuery に移動
  3. [エクスプローラ] パネルで、作成した babynames データセットをクリックします。
  4. [アクションを表示] オプションを開いて、[削除] をクリックします。
  5. [データセットの削除] ダイアログで削除コマンドを確定します。「delete」という単語を入力して、[削除] をクリックします。

次のステップ