Desarrolla con la CLI de Gemini
En esta página, se explica cómo interactuar con los datos de BigQuery en tu terminal usando instrucciones en lenguaje natural con la CLI de Gemini. Usar las extensiones de BigQuery dedicadas con la CLI de Gemini permite obtener análisis y estadísticas basados en IA directamente en la línea de comandos. Puedes analizar datos de tus tablas de BigQuery o de las tablas de los conjuntos de datos públicos de BigQuery.
Estas extensiones de origen proporcionan algunas herramientas comunes para el análisis de datos y las estadísticas. Para compilar tus propias herramientas, consulta Usa BigQuery con MCP, la CLI de Gemini y otros agentes.
Acerca de Gemini CLI y las extensiones
La CLI de Gemini es un agente de IA conversacional de código abierto de Google que acelera los flujos de trabajo de desarrollo y ayuda con la programación, la depuración, la exploración de datos y la creación de contenido. Ofrece una experiencia basada en agentes para interactuar con los servicios de Data Cloud, como BigQuery, y otras bases de datos Google Cloud populares y de código abierto.
Para obtener más información sobre la CLI de Gemini, consulta la documentación de la CLI de Gemini.
Cómo funcionan las extensiones
Las extensiones amplían las capacidades de la CLI de Gemini, lo que le permite conectarse a servicios Google Cloud específicos y otras herramientas, y controlarlos. Las extensiones proporcionan a Gemini contexto y comprensión de la API, lo que permite la interacción conversacional. Puedes cargar las extensiones desde URLs de GitHub, directorios locales o registros. Estas extensiones ofrecen herramientas, comandos de barra y mensajes. Son independientes de las extensiones del IDE, como Gemini Code Assist, que se integran con MCP Toolbox.
Acerca de las extensiones de BigQuery
BigQuery ofrece las siguientes extensiones para trabajar con datos de BigQuery a través de la CLI de Gemini:
- Extensión de BigQuery Data Analytics
- Usa esta extensión para descubrir datos, obtener más información sobre las tablas y los conjuntos de datos de BigQuery, y hacer preguntas en lenguaje natural sobre tus conjuntos de datos. También puedes generar previsiones o ejecutar un análisis de contribución con herramientas avanzadas integradas. Las herramientas de esta extensión ayudan a la CLI de Gemini a escribir consultas en SQL basadas en tus preguntas en lenguaje natural y, luego, ejecutan las consultas para proporcionar respuestas a tus preguntas.
- Extensión de BigQuery Conversational Analytics
- Usa esta extensión para obtener estadísticas avanzadas a partir de tus datos de BigQuery con un agente de análisis alojado previamente en el servidor. Las herramientas de esta extensión ayudan a la CLI de Gemini a enviar tu pregunta en lenguaje natural a un agente alojado integrado y a responder con estadísticas más detalladas de tus datos.
Herramientas de análisis de datos de BigQuery
La extensión de BigQuery Data Analytics proporciona las siguientes herramientas:
Categoría | Herramienta | Ejemplo de instrucción en lenguaje natural |
---|---|---|
Información del conjunto de datos y la tabla | get_dataset_info |
Obtén información sobre el conjunto de datos my_dataset |
get_table_info |
Obtén información sobre la tabla my_dataset.my_table | |
list_dataset_ids |
Enumera todos los conjuntos de datos del proyecto my_project | |
list_table_ids |
Enumera todas las tablas del conjunto de datos my_dataset | |
Buscar | search_catalog |
Cómo encontrar tablas relacionadas con las descargas de PyPI |
Ejecución de SQL | execute_sql |
Usa bigquery-public-data.pypi.file_downloads para mostrarme los 10 paquetes de PyPI más descargados este mes |
Previsión de series temporales | bigquery_forecast |
Prevé las ventas para 10 períodos a partir de la tabla my_table |
Análisis de contribuciones | analyze_contribution |
Analiza la contribución del país a los ingresos en la tabla my_table |
Herramientas de Conversational Analytics
La extensión de Conversational Analytics proporciona las siguientes herramientas:
Categoría | Herramienta | Ejemplo de instrucción en lenguaje natural |
---|---|---|
Buscar | search_catalog |
Cómo encontrar tablas relacionadas con las descargas de PyPI |
Estadísticas conversacionales | ask_data_insights |
Con ask_data_insights y las tablas en bigquery-public-data.google_analytics_sample , dime en qué canales debería enfocarme y por qué. |
Antes de comenzar
Antes de comenzar, necesitas lo siguiente:
- Acceso a al menos un proyecto de Google Cloud
Para la extensión de Data Analytics, habilita las siguientes APIs:
- BigQuery
- Para usar la herramienta
search_catalog
: Dataplex Universal Catalog
Para la extensión de Conversational Analytics, habilita las siguientes APIs:
- BigQuery
- Dataplex Universal Catalog
- Para usar la herramienta
ask_data_insights
: API de Gemini para Google Cloud, Gemini y API de Data Analytics con Gemini.
Roles requeridos
Para obtener los permisos que necesitas para usar las extensiones de BigQuery con la CLI de Gemini, pídele a tu administrador que te otorgue los siguientes roles de IAM en los recursos de Resource Manager (proyectos, carpetas y organizaciones) o en recursos de nivel inferior, como los conjuntos de datos:
-
Ejecuta consultas de BigQuery en un Google Cloud proyecto:
Usuario de BigQuery (
roles/bigquery.user
) -
Usa las herramientas de metadatos fundamentales para obtener metadatos de conjuntos de datos y tablas de BigQuery:
Visualizador de metadatos de BigQuery (
roles/bigquery.metadataViewer
) -
Usa la extensión de Conversational Analytics:
Usuario de Gemini para Google Cloud (
roles/cloudaicompanion.user
)
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Instala las extensiones de BigQuery
Instala las extensiones de BigQuery y, luego, úsalas para explorar y analizar tus datos.
Configura las variables de entorno para conectarte a tu proyecto de BigQuery:
export BIGQUERY_PROJECT="PROJECT_ID"
Reemplaza
PROJECT_ID
por el ID del proyecto Google Cloud.También puedes establecer estas variables de entorno opcionales:
BIGQUERY_LOCATION
: La ubicación del conjunto de datos, por ejemplo,export BIGQUERY_LOCATION="us"
BIGQUERY_USE_CLIENT_OAUTH
: Indica si se debe usar OAuth del cliente, por ejemplo,export BIGQUERY_USE_CLIENT_OAUTH=true
.
Instala la extensión BigQuery Data Analytics o Conversational Analytics con el comando
gemini extension install
:Opcional: Instala la extensión BigQuery Data Analytics:
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
Opcional: Instala la extensión de BigQuery Conversational Analytics:
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
Inicia la CLI de Gemini en modo interactivo para explorar y analizar tus datos:
gemini
La CLI carga automáticamente la extensión de BigQuery y sus herramientas, que puedes usar para interactuar con tus datos.
Ejemplos de instrucciones para explorar y analizar tus datos
Ingresa instrucciones en la CLI de Gemini. Puedes usar los siguientes ejemplos para comenzar.
Explora y analiza tablas
Las siguientes instrucciones te permiten explorar y analizar tus tablas.
Ejemplo de instrucción para encontrar tablas relacionadas con las descargas de PyPI:
Find tables related to PyPi downloads
Respuesta de ejemplo
La CLI de Gemini devuelve una lista de tablas relacionadas:
✦ I found the following tables related to PyPi downloads: * file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads * distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
Ejemplo de instrucción para mostrar los diez paquetes de PyPI más descargados este mes:
Using bigquery-public-data.pypi.file_downloads show me top 10 downloaded pypi packages this month
Respuesta de ejemplo
La CLI de Gemini devuelve los 10 paquetes principales:
✦ Here are the top 10 most downloaded PyPI packages this month: 1. boto3: 685,007,866 downloads 2. botocore: 531,034,851 downloads 3. urllib3: 512,611,825 downloads 4. requests: 464,595,806 downloads 5. typing-extensions: 459,505,780 downloads 6. certifi: 451,929,759 downloads 7. charset-normalizer: 428,716,731 downloads 8. idna: 409,262,986 downloads 9. grpcio-status: 402,535,938 downloads 10. aiobotocore: 399,650,559 downloads
Ejecuta estadísticas más detalladas con la herramienta ask_data_insights
La herramienta ask_data_insights
activa un agente en la API de BigQuery Conversational Analytics para responder tus preguntas. El agente del servidor recopila contexto adicional sobre tus datos y ofrece más estadísticas.
Ejemplo de instrucción para obtener estadísticas sobre los canales en los que debes enfocarte:
Using ask_data_insights and using the tables under bigquery-public-data.google_analytics_sample, tell me the channels I should focus on and why
Respuesta de ejemplo
La CLI de Gemini devuelve recomendaciones basadas en el análisis:
Based on the analysis of the Google Analytics sample data, here are the channels you should focus on and why: ┌─────────────────┬──────────────┬─────────────────┬────────────────────┬───────────────┐ │ Channel │ Total Visits │ Total Pageviews │ Total Transactions │ Total Revenue │ ├─────────────────┼──────────────┼─────────────────┼────────────────────┼───────────────┤ │ Referral │ 104,838 │ 707,597 │ 5,543 │ $651,429.91 │ │ Direct │ 143,026 │ 584,840 │ 2,219 │ $434,840.55 │ │ Organic Search │ 381,561 │ 1,569,218 │ 3,581 │ $326,380.51 │ │ Display │ 6,262 │ 34,202 │ 152 │ $78,337.46 │ │ Paid Search │ 25,326 │ 136,060 │ 479 │ $43,558.90 │ │ Social │ 226,117 │ 398,690 │ 131 │ $4,916.54 │ │ Affiliates │ 16,403 │ 47,417 │ 9 │ $597.38 │ │ (Other) │ 120 │ 442 │ 1 │ $9.99 │ └─────────────────┴──────────────┴─────────────────┴────────────────────┴───────────────┘ Recommendations: 1. Prioritize referral traffic: * Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and converts well. * Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with. 2. Nurture your direct traffic: * Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
Precios
No hay costos adicionales por usar las herramientas de metadatos (como get_dataset_info
, get_table_info
, list_dataset_ids
y list_table_ids
) ni la herramienta search_catalog
.
Las herramientas que ejecutan consultas, incluidas execute_sql
, bigquery_forecast
y analyze_contribution
, se facturan según los precios bajo demanda de BigQuery o los precios por capacidad de BigQuery, según la configuración de tu proyecto.
Durante la versión beta (anterior a la versión 1.0), la herramienta ask_data_insights
se ofrece sin costo adicional. Sin embargo, las consultas de BigQuery que active esta herramienta se facturarán según los precios estándares de BigQuery.
¿Qué sigue?
- Obtén más información para usar BigQuery con MCP, la CLI de Gemini y otros agentes.
- Obtén más información sobre Gemini en BigQuery.
- Consulta la extensión de Data Analytics en GitHub.
- Consulta la extensión de Conversational Analytics en GitHub.