Desarrolla con la CLI de Gemini

En esta página, se explica cómo interactuar con los datos de BigQuery en tu terminal usando instrucciones en lenguaje natural con la CLI de Gemini. Usar las extensiones de BigQuery dedicadas con la CLI de Gemini permite obtener análisis y estadísticas basados en IA directamente en la línea de comandos. Puedes analizar datos de tus tablas de BigQuery o de las tablas de los conjuntos de datos públicos de BigQuery.

Estas extensiones de origen proporcionan algunas herramientas comunes para el análisis de datos y las estadísticas. Para compilar tus propias herramientas, consulta Usa BigQuery con MCP, la CLI de Gemini y otros agentes.

Acerca de Gemini CLI y las extensiones

La CLI de Gemini es un agente de IA conversacional de código abierto de Google que acelera los flujos de trabajo de desarrollo y ayuda con la programación, la depuración, la exploración de datos y la creación de contenido. Ofrece una experiencia basada en agentes para interactuar con los servicios de Data Cloud, como BigQuery, y otras bases de datos Google Cloud populares y de código abierto.

Para obtener más información sobre la CLI de Gemini, consulta la documentación de la CLI de Gemini.

Cómo funcionan las extensiones

Las extensiones amplían las capacidades de la CLI de Gemini, lo que le permite conectarse a servicios Google Cloud específicos y otras herramientas, y controlarlos. Las extensiones proporcionan a Gemini contexto y comprensión de la API, lo que permite la interacción conversacional. Puedes cargar las extensiones desde URLs de GitHub, directorios locales o registros. Estas extensiones ofrecen herramientas, comandos de barra y mensajes. Son independientes de las extensiones del IDE, como Gemini Code Assist, que se integran con MCP Toolbox.

Acerca de las extensiones de BigQuery

BigQuery ofrece las siguientes extensiones para trabajar con datos de BigQuery a través de la CLI de Gemini:

Extensión de BigQuery Data Analytics
Usa esta extensión para descubrir datos, obtener más información sobre las tablas y los conjuntos de datos de BigQuery, y hacer preguntas en lenguaje natural sobre tus conjuntos de datos. También puedes generar previsiones o ejecutar un análisis de contribución con herramientas avanzadas integradas. Las herramientas de esta extensión ayudan a la CLI de Gemini a escribir consultas en SQL basadas en tus preguntas en lenguaje natural y, luego, ejecutan las consultas para proporcionar respuestas a tus preguntas.
Extensión de BigQuery Conversational Analytics
Usa esta extensión para obtener estadísticas avanzadas a partir de tus datos de BigQuery con un agente de análisis alojado previamente en el servidor. Las herramientas de esta extensión ayudan a la CLI de Gemini a enviar tu pregunta en lenguaje natural a un agente alojado integrado y a responder con estadísticas más detalladas de tus datos.

Herramientas de análisis de datos de BigQuery

La extensión de BigQuery Data Analytics proporciona las siguientes herramientas:

Categoría Herramienta Ejemplo de instrucción en lenguaje natural
Información del conjunto de datos y la tabla get_dataset_info Obtén información sobre el conjunto de datos my_dataset
get_table_info Obtén información sobre la tabla my_dataset.my_table
list_dataset_ids Enumera todos los conjuntos de datos del proyecto my_project
list_table_ids Enumera todas las tablas del conjunto de datos my_dataset
Buscar search_catalog Cómo encontrar tablas relacionadas con las descargas de PyPI
Ejecución de SQL execute_sql Usa bigquery-public-data.pypi.file_downloads para mostrarme los 10 paquetes de PyPI más descargados este mes
Previsión de series temporales bigquery_forecast Prevé las ventas para 10 períodos a partir de la tabla my_table
Análisis de contribuciones analyze_contribution Analiza la contribución del país a los ingresos en la tabla my_table

Herramientas de Conversational Analytics

La extensión de Conversational Analytics proporciona las siguientes herramientas:

Categoría Herramienta Ejemplo de instrucción en lenguaje natural
Buscar search_catalog Cómo encontrar tablas relacionadas con las descargas de PyPI
Estadísticas conversacionales ask_data_insights Con ask_data_insights y las tablas en bigquery-public-data.google_analytics_sample , dime en qué canales debería enfocarme y por qué.

Antes de comenzar

Antes de comenzar, necesitas lo siguiente:

  • Acceso a al menos un proyecto de Google Cloud
  • Para la extensión de Data Analytics, habilita las siguientes APIs:

    • BigQuery
    • Para usar la herramienta search_catalog: Dataplex Universal Catalog
  • Para la extensión de Conversational Analytics, habilita las siguientes APIs:

    • BigQuery
    • Dataplex Universal Catalog
    • Para usar la herramienta ask_data_insights: API de Gemini para Google Cloud, Gemini y API de Data Analytics con Gemini.

Roles requeridos

Para obtener los permisos que necesitas para usar las extensiones de BigQuery con la CLI de Gemini, pídele a tu administrador que te otorgue los siguientes roles de IAM en los recursos de Resource Manager (proyectos, carpetas y organizaciones) o en recursos de nivel inferior, como los conjuntos de datos:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Instala las extensiones de BigQuery

Instala las extensiones de BigQuery y, luego, úsalas para explorar y analizar tus datos.

  1. Instala Gemini CLI.

  2. Configura las variables de entorno para conectarte a tu proyecto de BigQuery:

    export BIGQUERY_PROJECT="PROJECT_ID"
    

    Reemplaza PROJECT_ID por el ID del proyecto Google Cloud.

    También puedes establecer estas variables de entorno opcionales:

    • BIGQUERY_LOCATION: La ubicación del conjunto de datos, por ejemplo, export BIGQUERY_LOCATION="us"
    • BIGQUERY_USE_CLIENT_OAUTH: Indica si se debe usar OAuth del cliente, por ejemplo, export BIGQUERY_USE_CLIENT_OAUTH=true.
  3. Instala la extensión BigQuery Data Analytics o Conversational Analytics con el comando gemini extension install:

    • Opcional: Instala la extensión BigQuery Data Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
      
    • Opcional: Instala la extensión de BigQuery Conversational Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
      
  4. Inicia la CLI de Gemini en modo interactivo para explorar y analizar tus datos:

    gemini
    

    La CLI carga automáticamente la extensión de BigQuery y sus herramientas, que puedes usar para interactuar con tus datos.

Ejemplos de instrucciones para explorar y analizar tus datos

Ingresa instrucciones en la CLI de Gemini. Puedes usar los siguientes ejemplos para comenzar.

Explora y analiza tablas

Las siguientes instrucciones te permiten explorar y analizar tus tablas.

  • Ejemplo de instrucción para encontrar tablas relacionadas con las descargas de PyPI:

    Find tables related to PyPi downloads
    

    Respuesta de ejemplo

    La CLI de Gemini devuelve una lista de tablas relacionadas:

    ✦ I found the following tables related to PyPi downloads:
    
        *   file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads
        *   distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
    
  • Ejemplo de instrucción para mostrar los diez paquetes de PyPI más descargados este mes:

    Using bigquery-public-data.pypi.file_downloads show me top 10
    downloaded pypi packages this month
    

    Respuesta de ejemplo

    La CLI de Gemini devuelve los 10 paquetes principales:

    ✦ Here are the top 10 most downloaded PyPI packages this month:
    
        1.  boto3: 685,007,866 downloads
        2.  botocore: 531,034,851 downloads
        3.  urllib3: 512,611,825 downloads
        4.  requests: 464,595,806 downloads
        5.  typing-extensions: 459,505,780 downloads
        6.  certifi: 451,929,759 downloads
        7.  charset-normalizer: 428,716,731 downloads
        8.  idna: 409,262,986 downloads
        9.  grpcio-status: 402,535,938 downloads
        10. aiobotocore: 399,650,559 downloads
    

Ejecuta estadísticas más detalladas con la herramienta ask_data_insights

La herramienta ask_data_insights activa un agente en la API de BigQuery Conversational Analytics para responder tus preguntas. El agente del servidor recopila contexto adicional sobre tus datos y ofrece más estadísticas.

  • Ejemplo de instrucción para obtener estadísticas sobre los canales en los que debes enfocarte:

    Using ask_data_insights and using the tables under
    bigquery-public-data.google_analytics_sample, tell me the channels I should
    focus on and why
    

    Respuesta de ejemplo

    La CLI de Gemini devuelve recomendaciones basadas en el análisis:

    Based on the analysis of the Google Analytics sample data, here are the
    channels you should focus on and why:
      ┌─────────────────┬──────────────┬─────────────────┬────────────────────┬───────────────┐
      │ Channel         │ Total Visits │ Total Pageviews │ Total Transactions │ Total Revenue │
      ├─────────────────┼──────────────┼─────────────────┼────────────────────┼───────────────┤
      │ Referral        │ 104,838      │ 707,597         │ 5,543              │ $651,429.91   │
      │ Direct          │ 143,026      │ 584,840         │ 2,219              │ $434,840.55   │
      │ Organic Search  │ 381,561      │ 1,569,218       │ 3,581              │ $326,380.51   │
      │ Display         │ 6,262        │ 34,202          │ 152                │ $78,337.46    │
      │ Paid Search     │ 25,326       │ 136,060         │ 479                │ $43,558.90    │
      │ Social          │ 226,117      │ 398,690         │ 131                │ $4,916.54     │
      │ Affiliates      │ 16,403       │ 47,417          │ 9                  │ $597.38       │
      │ (Other)         │ 120          │ 442             │ 1                  │ $9.99         │
      └─────────────────┴──────────────┴─────────────────┴────────────────────┴───────────────┘
    
      Recommendations:
    
        1.  Prioritize referral traffic:
            *   Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and
              converts well.
            *   Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with.
    
        2.  Nurture your direct traffic:
            *   Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
    

Precios

No hay costos adicionales por usar las herramientas de metadatos (como get_dataset_info, get_table_info, list_dataset_ids y list_table_ids) ni la herramienta search_catalog.

Las herramientas que ejecutan consultas, incluidas execute_sql, bigquery_forecast y analyze_contribution, se facturan según los precios bajo demanda de BigQuery o los precios por capacidad de BigQuery, según la configuración de tu proyecto.

Durante la versión beta (anterior a la versión 1.0), la herramienta ask_data_insights se ofrece sin costo adicional. Sin embargo, las consultas de BigQuery que active esta herramienta se facturarán según los precios estándares de BigQuery.

¿Qué sigue?