Usar R com BigQuery

Esta página descreve como carregar dados a partir do BigQuery para um frame de dados R usando o pacote R bigrquery.

Antes de começar

Antes de começar, crie uma nova instância do AI Platform Notebooks para R.

Abrir um Notebook no JupyterLab

Siga estas etapas para abrir uma instância de Notebooks no AI Platform.

  1. Acesse a página Notebooks do AI Platform no Console do Google Cloud Platform:

    Acessar a página "Notebooks do AI Platform"

  2. Selecione Abrir JupyterLab para a instância a ser aberta.

    Abrir JupyterLab

  3. Selecione Arquivo -> Novo -> Notebook e, em seguida, selecione o kernel R.

    Adicionar um notebook R

Instalar e carregar pacotes R

Siga estas etapas para instalar e carregar os pacotes R de que você precisa.

  1. Na primeira célula de código do Notebook, digite o seguinte:

    # Install the packages
    install.packages("tidyverse")
    install.packages("httpuv")
    install.packages("gargle")
    install.packages("bigrquery")
    
  2. Clique no botão de execução para iniciar o comando. R instala os pacotes.

    O botão de execução

  3. Para adicionar uma célula de código ao notebook, clique no botão + do notebook.

    O botão "+"

  4. Na nova célula de código, adicione o seguinte código e execute-o.

    # Load the packages
    library(tidyverse)
    library(httpuv)
    library(gargle)
    library(bigrquery)
    

Autenticar sua solicitação do BigQuery

Use as etapas a seguir para autenticar sua solicitação do BigQuery e carregar dados em um frame de dados R. Você pode autenticar sua solicitação do BigQuery por meio de um destes métodos: usar as credenciais da sua conta do Google Cloud Platform ou uma chave de conta de serviço. Saiba mais sobre as diferenças entre uma conta de usuário do GCP e uma conta de serviço.

Usar credenciais do GCP

Para autenticar o acesso do BigQuery por meio das suas credenciais do GCP, siga estas etapas:

  1. Em uma nova célula de código, digite o seguinte código.

    # Provide authentication
    bq_auth(use_oob = TRUE)
    
  2. Execute o código para autenticar seu acesso ao BigQuery.

Usar uma chave de conta de serviço

Crie uma chave de conta de serviço

Para criar uma chave de conta de serviço do BigQuery, siga estas etapas:

  1. Acesse a página APIs e serviços -> Credenciais no Console do Google Cloud Platform.

    Acesse a página "APIs e serviços -> Credenciais".

  2. Selecione Criar credenciais > Chave de conta de serviço.

    Criar uma credencial

  3. No menu suspenso Conta de serviço, selecione uma credencial existente que tenha acesso ao BigQuery ou selecione Nova conta de serviço para criar uma nova.

    Para criar uma nova conta de serviço, digite um Nome de conta de serviço e, no menu suspenso Papel, selecione BigQuery e, em seguida, selecione o papel que você quer atribuir, como "Administrador do BigQuery."

    Criar uma conta de serviço

  4. Selecione JSON como o tipo de chave.

    Selecionar JSON

  5. Clique em Criar. Seu navegador faz o download de um arquivo JSON que contém a chave da conta de serviço. Esse arquivo garante acesso aos recursos. Por isso, armazene-o de maneira segura.

  6. Clique em Fechar para fechar a mensagem Chave privada salva no seu computador.

Autenticar a chave da sua conta de serviço do BigQuery

Para autenticar seu acesso ao BigQuery por meio da chave da sua conta de serviço, siga estas etapas:

  1. No seu Notebook do JupyterLab, clique no botão Fazer upload de arquivos.

    O botão "Carregar arquivos"

  2. Acesse e selecione o arquivo JSON que você criou e clique em Abrir para fazer o upload.

  3. Em uma nova célula de código, digite o seguinte código. Substitua path-name.json pelo caminho do arquivo JSON da chave da conta de serviço da instância do seu notebook.

    Para copiar o caminho do seu arquivo JSON, clique com o botão direito do mouse (comando + clique no Mac) no nome de arquivo do navegador de arquivos JupyterLab e selecione Copiar caminho.

    # Provide authentication through the JSON service account key
    bq_auth(path="path-name.json")
    
  4. Execute o código para autenticar seu acesso ao BigQuery.

Carregar dados do BigQuery

Siga estas etapas para carregar os dados do BigQuery em um frame de dados usando o pacote bigrquery R.

  1. Em uma nova célula de código, digite o seguinte. Substitua project-id pela sua ID do projeto do GCP.

    Para ver o ID do projeto, clique na seta suspensa ao lado do nome do projeto no Console do Google Cloud Platform.

    # Store the project id
    projectid = "project-id"
    
    # Set your query
    sql <- "SELECT * FROM `bigquery-public-data.usa_names.usa_1910_current` LIMIT 10"
    
    # Run the query and store the data in a dataframe
    df <- query_exec(sql, projectid, use_legacy_sql = FALSE)
    
    # Print the query result
    df
    
  2. Execute a célula para visualizar 10 linhas de dados de um dos conjuntos de dados públicos do BigQuery's public datasets.

A seguir

Leia a documentação do bigrquery (em inglês) para saber mais sobre como usar os dados do BigQuery nos notebooks R.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Notebooks do AI Platform
Precisa de ajuda? Acesse nossa página de suporte.