R で BigQuery を使用する

このページでは、bigrquery パッケージを使用して、BigQuery から R tibble にデータを読み込む方法について説明します。

このページでは、R を使用して BigQuery データを操作する方法の一例を示します。bigrquery パッケージや bigQueryR などの他のパッケージで使用可能なメソッドも使用できます。

始める前に

始める前に、R フレームワークのユーザー管理ノートブックインスタンスを作成します。

JupyterLab ノートブックを開く

ユーザー管理のノートブックインスタンスを開くには、次の手順を行います。

Google Cloud Console で、[ユーザー管理のノートブック] ページに移動します。

[ユーザー管理のノートブック] に移動
目的のインスタンスを選択します。
[JupyterLab を開く] をクリックします。

ユーザーが管理するノートブックインスタンスで JupyterLab が表示されます。
JupyterLab で、[File] > [New] > [Notebook] の順に選択し、R カーネルを選択します。

bigrquery R パッケージを読み込む

bigrquery R パッケージを読み込むには、次の手順を行います。

ノートブックファイルの最初のコードセルに、次のコードを入力します。
```
# Load the package
library(bigrquery)
```
[Run the selected cells and advance] をクリックします。

R がパッケージを読み込みます。

BigQuery からデータを読み込む

bigrquery R パッケージを使用して BigQuery データを tibble に読み込むには、次の手順を行います。

コードセルを追加するには、ノートブックファイルの [Insert a string at below] ボタンをクリックします。

新しいコードセルに、次のように入力します。

# Store the project ID
projectid = "PROJECT_ID"

# Set your query
sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"

# Run the query; this returns a bq_table object that you can query further
tb <- bq_project_query(projectid, sql)

# Store the first 10 rows of the data in a tibble
sample <-bq_table_download(tb, n_max = 10)

# Print the 10 rows of data
sample

PROJECT_ID は、実際の Google Cloud プロジェクト ID に置き換えます。

セルを実行して、いずれかの BigQuery の公開データセットから 10 行のデータを表示します。

次のステップ

R ノートブックで BigQuery データを使用する詳しい方法については、bigrquery のドキュメントと bigQueryR へようこそをご覧ください。