Menggunakan R dengan BigQuery

Menggunakan R dengan BigQuery

Halaman ini menjelaskan cara memuat data dari BigQuery ke tibble R menggunakan paket bigrquery. Langkah-langkah ini ditulis untuk digunakan di notebook Jupyter dalam instance notebook Vertex AI Workbench yang dikelola pengguna.

Halaman ini adalah contoh salah satu cara menggunakan R untuk berinteraksi dengan data BigQuery. Anda dapat menggunakan metode lain yang tersedia dalam paket bigrquery atau paket lain, seperti bigQueryR.

Sebelum memulai

Sebelum Anda memulai, buat instance notebook framework R yang dikelola pengguna.

Membuka notebook JupyterLab

Untuk membuka instance notebook yang dikelola pengguna, selesaikan langkah-langkah berikut:

  1. Di dalam konsol Google Cloud, buka halaman User-managed notebooks.

    Buka User-managed notebooks

  2. Pilih instance yang ingin Anda buka.

  3. Klik Open JupyterLab.

    Instance notebook yang dikelola pengguna akan membuka JupyterLab.

  4. Di dalam JupyterLab, pilih File > New > Notebook, lalu pilih R kernel.

Memuat paket R bigrquery

Untuk memuat paket R bigrquery, selesaikan langkah-langkah berikut:

  1. Pada sel kode pertama dari file notebook, masukkan kode berikut:

    # Load the package
    library(bigrquery)
    
  2. Klik  Run the selected cells and advanced.

    Tombol Run the selected cells and advance.

    R akan memuat paket.

Memuat data dari BigQuery

Untuk memuat data BigQuery ke dalam tibble menggunakan paket R bigrquery, selesaikan langkah-langkah berikut.

  1. Untuk menambahkan sel kode, klik tombol  Insert a cell below pada file notebook.

    Tombol Insert a cell below.

  2. Di dalam sel kode yang baru, masukkan kode berikut ini.

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    Ganti PROJECT_ID dengan ID project Google Cloud Anda.

  3. Jalankan sel untuk melihat 10 baris data dari salah satu set data publik BigQuery.

Langkah selanjutnya

Untuk mempelajari lebih lanjut cara menggunakan data BigQuery di notebook R Anda, baca dokumentasi bigrquery dan Selamat datang di bigQueryR.