Usa R con BigQuery

Usa R con BigQuery

Questa pagina descrive come caricare i dati da BigQuery in un tibble utilizzando il pacchetto bigrquery. Questi passaggi sono scritti per l'utilizzo in un blocco note Jupyter all'interno di un'istanza di blocchi note gestiti dall'utente di Vertex AI Workbench.

Questa pagina è un esempio di un modo in cui utilizzare R per interagire con i dati di BigQuery. Puoi utilizzare altri metodi disponibili nel pacchetto bigrquery o in altri pacchetti, ad esempio bigQueryR.

Prima di iniziare

Prima di iniziare, crea un'istanza di blocchi note gestiti dall'utente del framework R.

Apri un blocco note JupyterLab

Per aprire un'istanza di blocchi note gestiti dall'utente, completa questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Blocchi note gestiti dall'utente.

    Vai ai blocchi note gestiti dall'utente

  2. Seleziona l'istanza che vuoi aprire.

  3. Fai clic su Apri JupyterLab.

    L'istanza di blocchi note gestiti dall'utente apre JupyterLab.

  4. In JupyterLab, seleziona File > New (Nuovo) > Notebook, quindi seleziona il kernel R.

Carica il pacchetto R Bigrquery

Per caricare il pacchetto bigrquery R, completa i seguenti passaggi:

  1. Nella prima cella di codice del file del blocco note, inserisci il seguente codice:

    # Load the package
    library(bigrquery)
    
  2. Fai clic su  Esegui le celle selezionate e avanza.

    Pulsante Esegui le celle selezionate e avanza.

    R carica il pacchetto.

Carica dati da BigQuery

Per caricare i dati BigQuery in un tibble utilizzando il pacchetto R bigrquery, completa i seguenti passaggi.

  1. Per aggiungere una cella di codice, fai clic sul pulsante del file del blocco note  Inserisci una cella sotto.

    Il pulsante Inserisci una cella sotto.

  2. Inserisci quanto segue nella nuova cella di codice.

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    Sostituisci PROJECT_ID con il tuo ID progetto Google Cloud.

  3. Esegui la cella per visualizzare 10 righe di dati da uno dei set di dati pubblici di BigQuery.

Passaggi successivi

Per saperne di più su come utilizzare i dati BigQuery nei blocchi note R, leggi la documentazione di BigQuery e Ti diamo il benvenuto in bigQueryR.