BigQuery에서 R 사용

BigQuery에서 R 사용

이 페이지에서는 bigrquery 패키지를 사용하여 BigQuery에서 R tibble로 데이터를 로드하는 방법을 설명합니다. 이 단계는 Vertex AI Workbench 사용자 관리형 노트북 인스턴스 내의 Jupyter 노트북에서 사용하도록 작성되었습니다.

이 페이지는 BigQuery 데이터와 상호작용을 위해 R을 사용하는 한 가지 방법 예시입니다. bigrquery 패키지 또는 bigQueryR과 같은 다른 패키지에서 제공되는 다른 메서드를 사용할 수 있습니다.

시작하기 전에

시작하기 전에 R 프레임워크 사용자 관리형 노트북 인스턴스를 만듭니다.

JupyterLab 노트북 열기

사용자 관리형 노트북 인스턴스를 열려면 다음 단계를 완료합니다.

  1. Google Cloud Console에서 사용자 관리형 노트북 페이지로 이동합니다.

    사용자 관리형 노트북으로 이동

  2. 열려는 인스턴스를 선택합니다.

  3. JupyterLab 열기를 클릭합니다.

    사용자 관리형 노트북 인스턴스가 JupyterLab을 엽니다.

  4. JupyterLab에서 파일 > 새 항목 > 노트북을 선택한 후 R 커널을 선택합니다.

Bigrquery R 패키지 로드

Bigrquery R 패키지를 로드하려면 다음 단계를 수행하세요.

  1. 노트북 파일의 첫 번째 코드 셀에 다음 명령어를 입력합니다.

    # Load the package
    library(bigrquery)
    
  2. 선택한 셀 실행 및 진행을 클릭합니다.

    선택한 셀 실행 및 고급 버튼

    R이 패키지를 로드합니다.

BigQuery에서 데이터 로드

bigrquery R 패키지를 사용하여 BigQuery 데이터를 tibble에 로드하려면 다음 단계를 완료하세요.

  1. 코드 셀을 추가하려면 노트북 파일의 아래에 셀 삽입 버튼을 클릭합니다.

    아래에 셀 삽입 버튼

  2. 새 코드 셀에 다음을 입력합니다.

    # Store the project ID
    projectid = "PROJECT_ID"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query; this returns a bq_table object that you can query further
    tb <- bq_project_query(projectid, sql)
    
    # Store the first 10 rows of the data in a tibble
    sample <-bq_table_download(tb, n_max = 10)
    
    # Print the 10 rows of data
    sample
    

    PROJECT_IDGoogle Cloud 프로젝트 ID로 바꿉니다.

  3. 셀을 실행하여 BigQuery의 공개 데이터 세트 중 하나에서 10개 행으로 이루어진 데이터를 봅니다.

다음 단계

R 노트북에서 BigQuery 데이터를 사용하는 방법에 대한 자세한 내용은 bigrquery 문서bigQueryR에 오신 것을 환영합니다를 참조하세요.