R mit BigQuery verwenden

R mit BigQuery verwenden

Auf dieser Seite wird beschrieben, wie Sie Daten aus BigQuery mit dem Paket bigrquery in ein R-Tibble laden. Diese Schritte wurden zur Verwendung in einem Jupyter-Notebook innerhalb einer vom Nutzer verwalteten Vertex AI Workbench-Notebookinstanz geschrieben.

Diese Seite ist ein Beispiel für eine Möglichkeit, R zur Interaktion mit BigQuery-Daten zu verwenden. Sie können auch andere Methoden verwenden, die im Paket bigrquery oder in anderen Paketen verfügbar sind, z. B. bigQueryR.

Vorbereitung

Bevor Sie beginnen, erstellen Sie eine nutzerverwaltete Notebookinstanz.

JupyterLab-Notebook öffnen

Führen Sie die folgenden Schritte aus, um eine nutzerverwaltete Notebookinstanz zu öffnen:

  1. Rufen Sie in der Google Cloud Console die Seite Nutzerverwaltete Notebooks auf.

    Zu "Nutzerverwaltete Notebooks"

  2. Wählen Sie die Instanz aus, die Sie öffnen möchten.

  3. Klicken Sie auf JupyterLab öffnen.

    Ihre nutzerverwaltete Notebooks-Instanz öffnet JupyterLab.

  4. Wählen Sie in JupyterLab Datei > Neu  > Notebook und dann den R-Kernel aus.

R-Paket von bigrquery laden

Führen Sie die folgenden Schritte aus, um das R-Paket „bigrquery” zu laden:

  1. Geben Sie in der ersten Codezelle der Notebookdatei den folgenden Code ein:

    # Load the package
    library(bigrquery)
    
  2. Klicken Sie auf Ausgewählte Zellen ausführen und fortfahren.

    Schaltfläche "Ausgewählte Zellen ausführen und fortfahren"

    R lädt das Paket.

Daten aus BigQuery laden

Führen Sie die folgenden Schritte aus, um BigQuery-Daten mit dem R-Paket bigrquery in ein Tibble zu laden.

  1. Klicken Sie zum Hinzufügen einer Codezelle auf die Schaltfläche Zelle unten einfügen der Notebookdatei.

    Schaltfläche "Zelle unten einfügen"

  2. Geben Sie in der neuen Codezelle Folgendes ein.

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    Ersetzen Sie PROJECT_ID durch Ihre Google Cloud-Projekt-ID.

  3. Führen Sie die Zelle aus, um 10 Datenzeilen aus einem der öffentlichen Datasets von BigQuery abzurufen.

Nächste Schritte

Weitere Informationen zur Verwendung von BigQuery-Daten in Ihren R-Notebooks finden Sie in der Dokumentation zu bigrquery und unter Willkommen bei bigQueryR.