Mit der Gemini-Befehlszeile entwickeln

Auf dieser Seite wird beschrieben, wie Sie in Ihrem Terminal mit BigQuery-Daten interagieren, indem Sie Prompts in natürlicher Sprache mit der Gemini CLI verwenden. Mit den speziellen BigQuery-Erweiterungen für die Gemini CLI können Sie KI-gestützte Datenanalysen und Statistiken direkt über die Befehlszeile durchführen. Sie können Daten aus Ihren BigQuery-Tabellen oder aus Tabellen in den öffentlichen BigQuery-Datasets analysieren.

Diese Erweiterungen von Google bieten einige gängige Tools für die Datenanalyse und Statistiken. Informationen zum Erstellen eigener Tools finden Sie unter BigQuery mit MCP, Gemini CLI und anderen Agents verwenden.

Gemini-Befehlszeile und Erweiterungen

Die Gemini CLI ist ein Open-Source-Agent für konversationelle KI von Google, der Entwicklungs-Workflows beschleunigt und beim Programmieren, Debuggen, der Datenexploration und der Inhaltserstellung unterstützt. Es bietet eine agentengesteuerte Umgebung für die Interaktion mit Data Cloud-Diensten wie BigQuery und anderen gängigen Google Cloud Datenbanken und Open-Source-Datenbanken.

Weitere Informationen zur Gemini-Befehlszeile finden Sie in der Dokumentation zur Gemini-Befehlszeile.

So funktionieren Erweiterungen

Erweiterungen erweitern die Funktionen der Gemini CLI, sodass sie eine Verbindung zu bestimmten Google Cloud Diensten und anderen Tools herstellen und diese steuern kann. Die Erweiterungen liefern Gemini Kontext und API-Informationen, die eine Konversationsinteraktion ermöglichen. Sie können die Erweiterungen über GitHub-URLs, lokale Verzeichnisse oder Registrierungen laden. Diese Erweiterungen bieten Tools, Slash-Befehle und Prompts. Diese unterscheiden sich von IDE-Erweiterungen wie Gemini Code Assist, die über die MCP Toolbox integriert werden.

BigQuery-Erweiterungen

BigQuery bietet die folgenden Erweiterungen für die Arbeit mit BigQuery-Daten über die Gemini CLI:

BigQuery Data Analytics-Erweiterung
Mit dieser Erweiterung können Sie Daten ermitteln, mehr über BigQuery-Tabellen und ‑Datasets erfahren und Fragen zu Ihren Datasets in natürlicher Sprache stellen. Sie können auch Prognosen erstellen oder eine Beitragssanalyse mit integrierten erweiterten Tools durchführen. Die Tools in dieser Erweiterung helfen der Gemini CLI, SQL-Abfragen auf Grundlage Ihrer Fragen in natürlicher Sprache zu schreiben und dann die Abfragen auszuführen, um Antworten auf Ihre Fragen zu liefern.
BigQuery Conversational Analytics-Erweiterung
Mit dieser Erweiterung können Sie mithilfe eines vorab gehosteten, serverseitigen Analyse-Agents erweiterte Statistiken aus Ihren BigQuery-Daten abrufen. Die Tools in dieser Erweiterung helfen der Gemini CLI, Ihre Frage in natürlicher Sprache an einen integrierten, gehosteten Agenten zu senden und mit detaillierteren Erkenntnissen aus Ihren Daten zu antworten.

BigQuery-Tools für die Datenanalyse

Die BigQuery Data Analytics-Erweiterung bietet die folgenden Tools:

Kategorie Tool Beispiel für einen Prompt in natürlicher Sprache
Dataset- und Tabelleninformationen get_dataset_info Informationen zum Dataset „my_dataset“ abrufen
get_table_info Informationen zur Tabelle „my_dataset.my_table“ abrufen
list_dataset_ids Alle Datasets im Projekt „my_project“ auflisten
list_table_ids Alle Tabellen im Dataset „my_dataset“ auflisten
Suchen search_catalog Tabellen zu PyPi-Downloads finden
SQL-Ausführung execute_sql Zeige mir die 10 am häufigsten heruntergeladenen PyPI-Pakete dieses Monats aus bigquery-public-data.pypi.file_downloads.
Zeitachsenprognosen bigquery_forecast Umsatz für 10 Zeiträume aus der Tabelle „my_table“ prognostizieren
Beitragsanalyse analyze_contribution Analysiere den Beitrag des Landes zum Umsatz in der Tabelle „my_table“.

Tools für Conversational Analytics

Die Erweiterung für konversationelle Analysen bietet die folgenden Tools:

Kategorie Tool Beispiel für einen Prompt in natürlicher Sprache
Suchen search_catalog Tabellen zu PyPi-Downloads finden
Konversationelle Analysen ask_data_insights Verwende „ask_data_insights“ und die Tabellen unter „bigquery-public-data.google_analytics_sample“, um mir zu sagen, auf welche Channels ich mich konzentrieren sollte und warum.

Hinweise

Für den Start ist Folgendes erforderlich:

  • Zugriff auf mindestens ein Google Cloud -Projekt.
  • Aktivieren Sie für die Data Analytics-Erweiterung die folgenden APIs:

    • BigQuery
    • search_catalog-Tool verwenden: Dataplex Universal Catalog
  • Aktivieren Sie für die Conversational Analytics-Erweiterung die folgenden APIs:

    • BigQuery
    • Dataplex Universal Catalog
    • ask_data_insights-Tool: Gemini for Google Cloud API, Gemini und Data Analytics API with Gemini.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Resource Manager-Ressourcen (Projekte, Ordner und Organisationen) oder Ressourcen auf niedrigerer Ebene wie Datasets zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung der BigQuery-Erweiterungen mit der Gemini CLI benötigen:

  • BigQuery-Abfragen in einem Google Cloud Projekt ausführen: BigQuery-Nutzer (roles/bigquery.user)
  • Verwenden Sie die grundlegenden Metadatentools, um Metadaten für BigQuery-Datasets und -Tabellen abzurufen: BigQuery-Metadaten-Betrachter (roles/bigquery.metadataViewer)
  • Conversational Analytics-Erweiterung verwenden: Gemini for Google Cloud User (roles/cloudaicompanion.user)

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

BigQuery-Erweiterungen installieren

Installieren Sie die BigQuery-Erweiterungen und verwenden Sie sie dann, um Ihre Daten zu untersuchen und zu analysieren.

  1. Installieren Sie die Gemini-Befehlszeile.

  2. Legen Sie die Umgebungsvariablen fest, um eine Verbindung zu Ihrem BigQuery-Projekt herzustellen:

    export BIGQUERY_PROJECT="PROJECT_ID"
    

    Ersetzen Sie PROJECT_ID durch Ihre Google CloudProjekt-ID.

    Sie können auch die folgenden optionalen Umgebungsvariablen festlegen:

    • BIGQUERY_LOCATION: der Standort des Datasets, z. B. export BIGQUERY_LOCATION="us"
    • BIGQUERY_USE_CLIENT_OAUTH: Gibt an, ob clientseitiges OAuth verwendet werden soll, z. B. export BIGQUERY_USE_CLIENT_OAUTH=true.
  3. Installieren Sie die Erweiterung „BigQuery Data Analytics“ oder „Conversational Analytics“ mit dem Befehl gemini extension install:

    • Optional: Installieren Sie die BigQuery Data Analytics-Erweiterung:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
      
    • Optional: Installieren Sie die Erweiterung „Konversationelle Analyse in BigQuery“:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
      
  4. Starten Sie die Gemini CLI im interaktiven Modus, um Ihre Daten zu analysieren:

    gemini
    

    Die CLI lädt automatisch die BigQuery-Erweiterung und ihre Tools, mit denen Sie mit Ihren Daten interagieren können.

Beispielprompts zum Analysieren Ihrer Daten

Prompts in der Gemini CLI eingeben Die folgenden Beispiele können Ihnen den Einstieg erleichtern.

Tabellen untersuchen und analysieren

Mit den folgenden Beispielprompts können Sie Ihre Tabellen untersuchen und analysieren.

  • Beispiel-Prompt zum Suchen nach Tabellen zu PyPi-Downloads:

    Find tables related to PyPi downloads
    

    Beispielantwort

    Die Gemini CLI gibt eine Liste der zugehörigen Tabellen zurück:

    ✦ I found the following tables related to PyPi downloads:
    
        *   file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads
        *   distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
    
  • Beispielprompt, um die zehn am häufigsten heruntergeladenen PyPI-Pakete dieses Monats aufzurufen:

    Using bigquery-public-data.pypi.file_downloads show me top 10
    downloaded pypi packages this month
    

    Beispielantwort

    Die Gemini-Befehlszeile gibt die 10 wichtigsten Pakete zurück:

    ✦ Here are the top 10 most downloaded PyPI packages this month:
    
        1.  boto3: 685,007,866 downloads
        2.  botocore: 531,034,851 downloads
        3.  urllib3: 512,611,825 downloads
        4.  requests: 464,595,806 downloads
        5.  typing-extensions: 459,505,780 downloads
        6.  certifi: 451,929,759 downloads
        7.  charset-normalizer: 428,716,731 downloads
        8.  idna: 409,262,986 downloads
        9.  grpcio-status: 402,535,938 downloads
        10. aiobotocore: 399,650,559 downloads
    

Mit dem ask_data_insights-Tool detailliertere Analysen durchführen

Das Tool ask_data_insights löst einen Agenten in der BigQuery Conversational Analytics API aus, der Ihre Fragen beantwortet. Der serverseitige Agent erfasst zusätzlichen Kontext zu Ihren Daten und bietet mehr Statistiken.

  • Beispiel-Prompt, um Informationen zu den Kanälen zu erhalten, auf die Sie sich konzentrieren sollten:

    Using ask_data_insights and using the tables under
    bigquery-public-data.google_analytics_sample, tell me the channels I should
    focus on and why
    

    Beispielantwort

    Die Gemini-Befehlszeile gibt Empfehlungen auf Grundlage der Analyse zurück:

    Based on the analysis of the Google Analytics sample data, here are the
    channels you should focus on and why:
      ┌─────────────────┬──────────────┬─────────────────┬────────────────────┬───────────────┐
      │ Channel         │ Total Visits │ Total Pageviews │ Total Transactions │ Total Revenue │
      ├─────────────────┼──────────────┼─────────────────┼────────────────────┼───────────────┤
      │ Referral        │ 104,838      │ 707,597         │ 5,543              │ $651,429.91   │
      │ Direct          │ 143,026      │ 584,840         │ 2,219              │ $434,840.55   │
      │ Organic Search  │ 381,561      │ 1,569,218       │ 3,581              │ $326,380.51   │
      │ Display         │ 6,262        │ 34,202          │ 152                │ $78,337.46    │
      │ Paid Search     │ 25,326       │ 136,060         │ 479                │ $43,558.90    │
      │ Social          │ 226,117      │ 398,690         │ 131                │ $4,916.54     │
      │ Affiliates      │ 16,403       │ 47,417          │ 9                  │ $597.38       │
      │ (Other)         │ 120          │ 442             │ 1                  │ $9.99         │
      └─────────────────┴──────────────┴─────────────────┴────────────────────┴───────────────┘
    
      Recommendations:
    
        1.  Prioritize referral traffic:
            *   Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and
              converts well.
            *   Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with.
    
        2.  Nurture your direct traffic:
            *   Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
    

Preise

Für die Verwendung von Metadatentools wie get_dataset_info, get_table_info, list_dataset_ids und list_table_ids oder des Tools search_catalog fallen keine zusätzlichen Kosten an.

Für Tools, mit denen Abfragen ausgeführt werden, einschließlich execute_sql, bigquery_forecast und analyze_contribution, wird je nach Projektkonfiguration BigQuery-On-Demand-Preisgestaltung oder BigQuery-Kapazitätspreise berechnet.

Während der Betaphase (vor Version 1.0) wird das ask_data_insights-Tool ohne zusätzliche Kosten angeboten. Alle BigQuery-Abfragen, die durch dieses Tool ausgelöst werden, werden jedoch gemäß den Standard-BigQuery-Preisen abgerechnet.

Nächste Schritte