Usa R con BigQuery

Usa R con BigQuery

En esta página, se describe cómo cargar datos de BigQuery en un tibble de R mediante el paquete bigrquery. Estos pasos se escriben para usar en un notebook de Jupyter dentro de una instancia de notebooks de Vertex AI Workbench administrada por el usuario.

En esta página, se muestra un ejemplo de una forma de usar R para interactuar con datos de BigQuery. Puedes usar otros métodos disponibles en el paquete bigrquery o en otros paquetes, como bigQueryR.

Antes de comenzar

Antes de comenzar, crea una instancia de notebooks administrados por el usuario en el framework de R.

Abre un notebook de JupyterLab

Para abrir una instancia de notebooks administrados por el usuario, completa los siguientes pasos:

  1. En la consola de Google Cloud, ve a la página Notebooks administrados por el usuario.

    Ir a Notebooks administrados por el usuario

  2. Selecciona la instancia que deseas abrir.

  3. Haga clic en Open JupyterLab.

    Tu instancia de notebooks administrados por el usuario abre JupyterLab.

  4. En JupyterLab, selecciona File > New > Notebook y, luego, selecciona el kernel de R.

Carga el paquete bigrquery de R

Para cargar el paquete bigrquery de R, completa los siguientes pasos:

  1. En la primera celda de código del archivo de notebook, ingresa el siguiente código:

    # Load the package
    library(bigrquery)
    
  2. Haz clic en Run the selected cells and advance.

    El botón Run the selected cells and advance.

    R carga el paquete.

Carga datos de BigQuery

Para cargar datos de BigQuery en una tabla mediante el paquete bigrquery de R, completa los siguientes pasos.

  1. Para agregar una celda de código, haz clic en el botón Insert a cell below del archivo de notebook.

    El botón Insert a cell below.

  2. En la nueva celda de código, ingresa lo siguiente.

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    Reemplaza PROJECT_ID por el ID del proyecto de Google Cloud.

  3. Ejecuta la celda para ver 10 filas de datos de uno de los conjuntos de datos públicos de BigQuery.

¿Qué sigue?

Para obtener más información sobre cómo usar los datos de BigQuery en tus notebooks de R, lee la documentación de bigrquery y Te damos la bienvenida a bigQueryR.