将 R 与 BigQuery 配合使用
本页面介绍如何使用 bigrquery
软件包将数据从 BigQuery 加载到 R tibble。这些步骤编写为在 Vertex AI Workbench 用户管理的笔记本实例中的 Jupyter 笔记本中使用。
本页面是使用 R 与 BigQuery 数据进行交互的一种方法示例。您也可以使用 bigrquery
软件包或其他软件包中提供的其他方法,例如 bigQueryR
。
准备工作
在开始之前,请创建一个 R 框架用户管理的笔记本实例。
打开 JupyterLab 笔记本
如需打开用户管理的笔记本实例,请完成以下步骤:
在 Google Cloud 控制台中,转到用户管理的笔记本页面。
选择要打开的实例。
点击打开 JupyterLab。
用户管理的笔记本实例会打开 JupyterLab。
在 JupyterLab 中,依次选择文件 > 新建 > 笔记本,然后选择 R 内核。
加载 bigrquery R 软件包
如需加载 bigrquery R 软件包,请完成以下步骤:
在笔记本文件的第一个代码单元中,输入以下代码:
# Load the package library(bigrquery)
点击
运行所选单元并前进。R 会加载该软件包。
从 BigQuery 加载数据
如需使用 bigrquery
R 软件包将 BigQuery 数据加载到 tibble 中,请完成以下步骤。
如需添加代码单元,请点击笔记本文件的
在下方插入单元按钮。在新的代码单元中,输入以下内容:
# Store the project ID projectid = "PROJECT_ID" # Set your query sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10" # Run the query; this returns a bq_table object that you can query further tb <- bq_project_query(projectid, sql) # Store the first 10 rows of the data in a tibble sample <-bq_table_download(tb, n_max = 10) # Print the 10 rows of data sample
将 PROJECT_ID 替换为您的 Google Cloud 项目 ID。
运行该单元以查看 BigQuery 的某个公共数据集中的 10 行数据。
后续步骤
如需详细了解如何在 R 笔记本中使用 BigQuery 数据,请参阅 bigrquery 文档和欢迎使用 bigQueryR。