将 R 与 BigQuery 配合使用

将 R 与 BigQuery 配合使用

本页面介绍如何使用 bigrquery 软件包将数据从 BigQuery 加载到 R tibble。这些步骤编写为在 Vertex AI Workbench 用户管理的笔记本实例中的 Jupyter 笔记本中使用。

本页面是使用 R 与 BigQuery 数据进行交互的一种方法示例。您也可以使用 bigrquery 软件包或其他软件包中提供的其他方法,例如 bigQueryR

准备工作

在开始之前,请创建一个 R 框架用户管理的笔记本实例

打开 JupyterLab 笔记本

如需打开用户管理的笔记本实例,请完成以下步骤:

  1. 在 Google Cloud 控制台中,转到用户管理的笔记本页面。

    转到“用户管理的笔记本”

  2. 选择要打开的实例。

  3. 点击打开 JupyterLab

    用户管理的笔记本实例会打开 JupyterLab。

  4. 在 JupyterLab 中,依次选择文件 > 新建 > 笔记本,然后选择 R 内核。

加载 bigrquery R 软件包

如需加载 bigrquery R 软件包,请完成以下步骤:

  1. 在笔记本文件的第一个代码单元中,输入以下代码:

    # Load the package
    library(bigrquery)
    
  2. 点击 运行所选单元并前进

    “运行所选单元并前进”按钮。

    R 会加载该软件包。

从 BigQuery 加载数据

如需使用 bigrquery R 软件包将 BigQuery 数据加载到 tibble 中,请完成以下步骤。

  1. 如需添加代码单元,请点击笔记本文件的 在下方插入单元按钮。

    “在下方插入单元”按钮。

  2. 在新的代码单元中,输入以下内容:

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    PROJECT_ID 替换为您的 Google Cloud 项目 ID

  3. 运行该单元以查看 BigQuery 的某个公共数据集中的 10 行数据。

后续步骤

如需详细了解如何在 R 笔记本中使用 BigQuery 数据,请参阅 bigrquery 文档欢迎使用 bigQueryR