Desenvolva com a Gemini CLI

Esta página explica como interagir com dados do BigQuery no seu terminal usando comandos de linguagem natural com a CLI do Gemini. A utilização das extensões dedicadas do BigQuery com a CLI Gemini permite a análise de dados e as estatísticas baseadas em IA diretamente na linha de comandos. Pode analisar dados das suas tabelas do BigQuery ou de tabelas nos conjuntos de dados públicos do BigQuery.

Estas extensões originais oferecem algumas ferramentas comuns para análise de dados e estatísticas. Para criar as suas próprias ferramentas, consulte o artigo Use o BigQuery com o MCP, a CLI do Gemini e outros agentes.

Acerca da Gemini CLI e das extensões

O Gemini CLI é um agente de IA de conversação de código aberto da Google que acelera os fluxos de trabalho de desenvolvimento e ajuda na programação, depuração, exploração de dados e criação de conteúdo. Oferece uma experiência orientada por agentes para interagir com os serviços do Data Cloud, como o BigQuery, e outras bases de dados Google Cloud populares e de código aberto.

Para mais informações sobre a Gemini CLI, consulte a documentação da Gemini CLI.

Como funcionam as extensões

As extensões expandem as capacidades da CLI Gemini, permitindo-lhe ligar-se e controlar serviços Google Cloud específicos e outras ferramentas. As extensões fornecem contexto e compreensão da API ao Gemini, o que permite a interação conversacional. Pode carregar as extensões a partir de URLs do GitHub, diretórios locais ou registos. Estas extensões oferecem ferramentas, comandos com barra e comandos. Estas são separadas das extensões do IDE, como o Gemini Code Assist, que se integram através da caixa de ferramentas da MCP.

Acerca das extensões do BigQuery

O BigQuery oferece as seguintes extensões para trabalhar com dados do BigQuery através da CLI Gemini:

Extensão BigQuery Data Analytics
Use esta extensão para descobrir dados, saber mais sobre tabelas e conjuntos de dados do BigQuery e fazer perguntas em linguagem natural sobre os seus conjuntos de dados. Também pode gerar previsões ou executar uma análise de contribuição com ferramentas avançadas incorporadas. As ferramentas nesta extensão ajudam a CLI Gemini a escrever consultas SQL com base nas suas perguntas em linguagem natural e, em seguida, executam as consultas para fornecer respostas às suas perguntas.
Extensão de estatísticas conversacionais do BigQuery
Use esta extensão para obter estatísticas avançadas dos seus dados do BigQuery através de um agente de estatísticas pré-alojado no servidor. As ferramentas nesta extensão ajudam a CLI do Gemini a enviar a sua pergunta em linguagem natural a um agente alojado integrado e a responder com estatísticas mais detalhadas dos seus dados.

Ferramentas de análise de dados do BigQuery

A extensão BigQuery Data Analytics oferece as seguintes ferramentas:

Categoria Ferramenta Exemplo de comando de linguagem natural
Informações do conjunto de dados e da tabela get_dataset_info Obter informações sobre o conjunto de dados my_dataset
get_table_info Obter informações sobre a tabela my_dataset.my_table
list_dataset_ids Apresenta todos os conjuntos de dados no projeto my_project
list_table_ids Liste todas as tabelas no conjunto de dados my_dataset
Pesquisar search_catalog Encontre tabelas relacionadas com transferências do PyPi
Execução de SQL execute_sql Using bigquery-public-data.pypi.file_downloads show me top 10 downloaded pypi packages this month
Previsão de séries de tempo bigquery_forecast Prever vendas para 10 períodos a partir da tabela my_table
Análise das contribuições analyze_contribution Analisa a contribuição do país para a receita na tabela my_table

Ferramentas de estatísticas de conversas

A extensão Conversational Analytics oferece as seguintes ferramentas:

Categoria Ferramenta Exemplo de comando de linguagem natural
Pesquisar search_catalog Encontre tabelas relacionadas com transferências do PyPi
Estatísticas de conversas ask_data_insights Usando ask_data_insights e usando as tabelas em bigquery-public-data.google_analytics_sample , indica-me os canais nos quais me devo focar e porquê

Antes de começar

Antes de começar, precisa do seguinte:

  • Acesso a, pelo menos, um projeto Google Cloud .
  • Para a extensão Data Analytics, ative as seguintes APIs:

    • BigQuery
    • Para usar a ferramenta search_catalog: Dataplex Universal Catalog
  • Para a extensão Conversational Analytics, ative as seguintes APIs:

    • BigQuery
    • Dataplex Universal Catalog
    • Para usar a ferramenta ask_data_insights: API Gemini para o Google Cloud, Gemini e API Data Analytics com o Gemini.

Funções necessárias

Para obter as autorizações de que precisa para usar as extensões do BigQuery com a CLI Gemini, peça ao seu administrador que lhe conceda as seguintes funções de IAM nos recursos do Resource Manager (projetos, pastas e organizações) ou recursos de nível inferior, como conjuntos de dados:

Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.

Instale as extensões do BigQuery

Instale as extensões do BigQuery e, em seguida, use-as para explorar e analisar os seus dados.

  1. Instale a CLI do Gemini.

  2. Defina as variáveis de ambiente para estabelecer ligação ao seu projeto do BigQuery:

    export BIGQUERY_PROJECT="PROJECT_ID"
    

    Substitua PROJECT_ID pelo seu Google Cloud ID do projeto.

    Também pode definir estas variáveis de ambiente opcionais:

    • BIGQUERY_LOCATION: a localização do conjunto de dados, por exemplo: export BIGQUERY_LOCATION="us"
    • BIGQUERY_USE_CLIENT_OAUTH: se deve usar o OAuth do lado do cliente. Por exemplo: export BIGQUERY_USE_CLIENT_OAUTH=true
  3. Instale a extensão BigQuery Data Analytics ou Conversational Analytics através do comando gemini extension install:

    • Opcional: instale a extensão BigQuery Data Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
      
    • Opcional: instale a extensão BigQuery Conversational Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
      
  4. Inicie a CLI do Gemini no modo interativo para explorar e analisar os seus dados:

    gemini
    

    A CLI carrega automaticamente a extensão do BigQuery e as respetivas ferramentas, que pode usar para interagir com os seus dados.

Exemplos de comandos para explorar e analisar os seus dados

Introduza comandos na Gemini CLI. Pode usar os seguintes exemplos para começar.

Explore e analise tabelas

Os exemplos de comandos seguintes permitem-lhe explorar e analisar as suas tabelas.

  • Exemplo de comando para encontrar tabelas relacionadas com transferências do PyPi:

    Find tables related to PyPi downloads
    

    Resposta de exemplo

    A CLI do Gemini devolve uma lista de tabelas relacionadas:

    ✦ I found the following tables related to PyPi downloads:
    
        *   file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads
        *   distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
    
  • Exemplo de comando para mostrar os dez principais pacotes do PyPI transferidos este mês:

    Using bigquery-public-data.pypi.file_downloads show me top 10
    downloaded pypi packages this month
    

    Resposta de exemplo

    A Gemini CLI devolve os 10 principais pacotes:

    ✦ Here are the top 10 most downloaded PyPI packages this month:
    
        1.  boto3: 685,007,866 downloads
        2.  botocore: 531,034,851 downloads
        3.  urllib3: 512,611,825 downloads
        4.  requests: 464,595,806 downloads
        5.  typing-extensions: 459,505,780 downloads
        6.  certifi: 451,929,759 downloads
        7.  charset-normalizer: 428,716,731 downloads
        8.  idna: 409,262,986 downloads
        9.  grpcio-status: 402,535,938 downloads
        10. aiobotocore: 399,650,559 downloads
    

Execute estatísticas mais detalhadas com a ferramenta ask_data_insights

A ferramenta ask_data_insights aciona um agente na API Conversational Analytics do BigQuery para responder às suas perguntas. O agente do lado do servidor recolhe contexto adicional sobre os seus dados e oferece mais estatísticas.

  • Exemplo de comando para receber estatísticas sobre os canais nos quais se deve focar:

    Using ask_data_insights and using the tables under
    bigquery-public-data.google_analytics_sample, tell me the channels I should
    focus on and why
    

    Resposta de exemplo

    A Gemini CLI devolve recomendações com base na análise:

    Based on the analysis of the Google Analytics sample data, here are the
    channels you should focus on and why:
      ┌─────────────────┬──────────────┬─────────────────┬────────────────────┬───────────────┐
      │ Channel         │ Total Visits │ Total Pageviews │ Total Transactions │ Total Revenue │
      ├─────────────────┼──────────────┼─────────────────┼────────────────────┼───────────────┤
      │ Referral        │ 104,838      │ 707,597         │ 5,543              │ $651,429.91   │
      │ Direct          │ 143,026      │ 584,840         │ 2,219              │ $434,840.55   │
      │ Organic Search  │ 381,561      │ 1,569,218       │ 3,581              │ $326,380.51   │
      │ Display         │ 6,262        │ 34,202          │ 152                │ $78,337.46    │
      │ Paid Search     │ 25,326       │ 136,060         │ 479                │ $43,558.90    │
      │ Social          │ 226,117      │ 398,690         │ 131                │ $4,916.54     │
      │ Affiliates      │ 16,403       │ 47,417          │ 9                  │ $597.38       │
      │ (Other)         │ 120          │ 442             │ 1                  │ $9.99         │
      └─────────────────┴──────────────┴─────────────────┴────────────────────┴───────────────┘
    
      Recommendations:
    
        1.  Prioritize referral traffic:
            *   Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and
              converts well.
            *   Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with.
    
        2.  Nurture your direct traffic:
            *   Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
    

Preços

Não existe nenhum custo adicional pela utilização de ferramentas de metadados (como get_dataset_info, get_table_info, list_dataset_ids e list_table_ids) ou da ferramenta search_catalog.

As ferramentas que executam consultas, incluindo o execute_sql, o bigquery_forecast e o analyze_contribution, são faturadas de acordo com os preços a pedido do BigQuery ou os preços de capacidade do BigQuery, consoante a configuração do seu projeto.

Durante a versão beta (anterior à v1.0), a ferramenta ask_data_insights é oferecida sem custos adicionais. No entanto, todas as consultas do BigQuery acionadas por esta ferramenta são faturadas de acordo com os preços padrão do BigQuery.

O que se segue?