このページでは、bigrquery
パッケージを使用して、BigQuery から R tibble にデータを読み込む方法について説明します。
このページでは、R を使用して BigQuery データを操作する方法の一例を示します。bigrquery
パッケージや bigQueryR
などの他のパッケージで使用可能なメソッドも使用できます。
始める前に
始める前に、R フレームワークのユーザー管理ノートブック インスタンスを作成します。
JupyterLab ノートブックを開く
ユーザー管理のノートブック インスタンスを開くには、次の手順を行います。
Google Cloud Console で、[ユーザー管理のノートブック] ページに移動します。
目的のインスタンスを選択します。
[JupyterLab を開く] をクリックします。
ユーザーが管理するノートブック インスタンスで JupyterLab が表示されます。
JupyterLab で、[File] > [New] > [Notebook] の順に選択し、R カーネルを選択します。
bigrquery R パッケージを読み込む
bigrquery R パッケージを読み込むには、次の手順を行います。
ノートブック ファイルの最初のコードセルに、次のコードを入力します。
# Load the package library(bigrquery)
[
Run the selected cells and advance] をクリックします。R がパッケージを読み込みます。
BigQuery からデータを読み込む
bigrquery
R パッケージを使用して BigQuery データを tibble に読み込むには、次の手順を行います。
コードセルを追加するには、ノートブック ファイルの [
Insert a string at below] ボタンをクリックします。新しいコードセルに、次のように入力します。
# Store the project ID projectid = "PROJECT_ID" # Set your query sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10" # Run the query; this returns a bq_table object that you can query further tb <- bq_project_query(projectid, sql) # Store the first 10 rows of the data in a tibble sample <-bq_table_download(tb, n_max = 10) # Print the 10 rows of data sample
PROJECT_ID は、実際の Google Cloud プロジェクト ID に置き換えます。
セルを実行して、いずれかの BigQuery の公開データセットから 10 行のデータを表示します。
次のステップ
R ノートブックで BigQuery データを使用する詳しい方法については、bigrquery のドキュメントと bigQueryR へようこそをご覧ください。