R で BigQuery を使用する

このページでは、bigrquery パッケージを使用して、BigQuery から R tibble にデータを読み込む方法について説明します。

このページでは、R を使用して BigQuery データを操作する方法の一例を示します。bigrquery パッケージや bigQueryR などの他のパッケージで使用可能なメソッドも使用できます。

始める前に

始める前に、R フレームワークのユーザー管理ノートブック インスタンスを作成します。

JupyterLab ノートブックを開く

ユーザー管理のノートブック インスタンスを開くには、次の手順を行います。

  1. Google Cloud Console で、[ユーザー管理のノートブック] ページに移動します。

    [ユーザー管理のノートブック] に移動

  2. 目的のインスタンスを選択します。

  3. [JupyterLab を開く] をクリックします。

    ユーザーが管理するノートブック インスタンスで JupyterLab が表示されます。

  4. JupyterLab で、[File] > [New] > [Notebook] の順に選択し、R カーネルを選択します。

bigrquery R パッケージを読み込む

bigrquery R パッケージを読み込むには、次の手順を行います。

  1. ノートブック ファイルの最初のコードセルに、次のコードを入力します。

    # Load the package
    library(bigrquery)
    
  2. [Run the selected cells and advance] をクリックします。

    [Run the selected cells and advance] ボタン

    R がパッケージを読み込みます。

BigQuery からデータを読み込む

bigrquery R パッケージを使用して BigQuery データを tibble に読み込むには、次の手順を行います。

  1. コードセルを追加するには、ノートブック ファイルの [Insert a string at below] ボタンをクリックします。

    [Insert a cell below] ボタン

  2. 新しいコードセルに、次のように入力します。

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    PROJECT_ID は、実際の Google Cloud プロジェクト ID に置き換えます。

  3. セルを実行して、いずれかの BigQuery の公開データセットから 10 行のデータを表示します。

次のステップ

R ノートブックで BigQuery データを使用する詳しい方法については、bigrquery のドキュメントbigQueryR へようこそをご覧ください。