Abfragen mit Unterstützung durch Gemini schreiben

In diesem Dokument wird beschrieben, wie Sie die KI-basierte Unterstützung in Gemini in BigQuery verwenden können, um Ihre Daten mit SQL-Abfragen und Python-Code abzufragen. Gemini in BigQuery kann Abfragen und Code generieren, Abfragen und Code während der Eingabe vervollständigen und Abfragen erklären.


Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud -Konsole aufzurufen:

Anleitung


Gemini für Google Cloud verwendet Ihre Prompts und die Antworten darauf nicht ohne Ihre ausdrückliche Erlaubnis zum Trainieren seiner Modelle. Weitere Informationen dazu, wie Google Ihre Daten verwendet, finden Sie unter So nutzt Gemini für Google Cloud Ihre Daten.

Nur Prompts auf Englisch werden für Gemini in BigQuery unterstützt.

Dieses Dokument richtet sich an Datenanalysten, Data Scientists und Datenentwickler, die mit SQL-Abfragen und Colab Enterprise-Notebooks in BigQuery arbeiten. Dabei wird davon ausgegangen, dass Sie wissen, wie Sie Daten in der BigQuery Studio-Umgebung abfragen oder wie Sie mit Python-Notebooks BigQuery-Daten analysieren.

Hinweise

  1. Achten Sie darauf, dass Gemini in BigQuery für Ihr Google Cloud -Projekt eingerichtet ist. Dieser Schritt wird normalerweise von einem Administrator ausgeführt. Gemini in BigQuery-Features sind möglicherweise deaktiviert oder nicht verfügbar, bis Sie die restlichen Schritte in diesem Abschnitt ausgeführt haben.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  4. Klicken Sie in der BigQuery-Symbolleiste auf pen_sparkGemini.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  5. Achten Sie darauf, dass in der Liste der Funktionen die folgenden Funktionen ausgewählt sind:

    • Liste der Gemini in SQL-Abfrage:

      • Automatische Vervollständigung (Vorabversion) Während Sie im Abfrageeditor tippen, kann Gemini logische nächste Schritte vorschlagen, die für den Kontext der aktuellen Abfrage relevant sind oder Ihnen bei der Iteration einer Abfrage helfen.
      • Automatische Generierung Sie können Gemini in BigQuery mit einem Kommentar in natürlicher Sprache im BigQuery-Abfrageeditor auffordern, eine SQL-Abfrage zu generieren.
      • SQL-Generierungstool Sie können Text in natürlicher Sprache in ein Tool eingeben, um eine SQL-Abfrage zu generieren. Mit Optionen können Sie Abfrageergebnisse verfeinern, Tabellenquellen auswählen und Ergebnisse vergleichen.
      • Erläuterung Sie können Gemini in BigQuery auffordern, eine SQL-Abfrage in natürlicher Sprache zu erklären.
    • Liste Gemini in Python-Notebook:

      • Codevervollständigung (Vorabversion) Gemini bietet kontextbezogene Empfehlungen, die auf dem Inhalt des Notebooks basieren.
      • Codegenerierung Sie können Gemini mit einer Anweisung oder Frage in natürlicher Sprache auffordern, um Python-Code zu generieren.
  6. Zum Ausführen der Aufgaben in diesem Dokument benötigen Sie die erforderlichen IAM-Berechtigungen (Identity and Access Management).

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Gemini for Google Cloud User (roles/cloudaicompanion.user) für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Schreiben von Abfragen mit Gemini-Unterstützung benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Abfragen mit Gemini-Unterstützung erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Abfragen mit Gemini-Unterstützung zu schreiben:

  • cloudaicompanion.entitlements.get
  • cloudaicompanion.instances.completeTask
  • So erklären Sie SQL-Abfragen: cloudaicompanion.companions.generateChat
  • Vollständigen SQL- oder Python-Code eingeben: cloudaicompanion.instances.completeCode
  • So generieren Sie SQL- oder Python-Code: cloudaicompanion.instances.generateCode

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Weitere Informationen zu IAM-Rollen und Berechtigungen in BigQuery finden Sie unter Einführung in IAM.

Eine SQL-Abfrage generieren

Um eine SQL-Abfrage anhand des Schemas Ihrer Daten zu generieren, können Sie Gemini in BigQuery mit einer Aussage oder Frage in natürlicher Sprache (auch bekannt als Prompt) bereitstellen. Selbst wenn Sie ohne Code, mit einer begrenzten Kenntnis des Datenschemas oder nur mit Grundkenntnissen der Google SQL-Syntax beginnen, kann Gemini in BigQuery SQL generieren, das Ihnen helfen kann, Ihre Daten zu untersuchen.

SQL-Generierungstool verwenden

Mit dem SQL-Generierungstool können Sie eine SQL-Abfrage zu Ihren zuletzt angesehenen oder abgefragten Tabellen in natürlicher Sprache generieren. Sie können das Tool auch verwenden, um eine vorhandene Abfrage zu ändern und die Tabellen, für die Sie SQL generieren möchten, manuell anzugeben.

So verwenden Sie das SQL-Generierungstool:

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie neben dem Abfrageeditor auf das SQL-Generierungstool pen_spark.

    Schaltfläche für das SQL-Generierungstool im BigQuery-Abfrageeditor

  3. Geben Sie im Dialogfeld SQL mit Gemini generieren einen Prompt in natürlicher Sprache zu einer Tabelle ein, die Sie sich vor Kurzem angesehen oder abgefragt haben. Wenn Sie sich beispielsweise vor Kurzem die Tabelle bigquery-public-data.austin_bikeshare.bikeshare_trips angesehen haben, können Sie Folgendes eingeben:

     Show me the duration and subscriber type for the ten longest trips.
    
  4. Klicken Sie auf Erstellen.

    Die generierte SQL-Abfrage sieht in etwa so aus:

    SELECT
        subscriber_type,
        duration_sec
      FROM
          `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips`
    ORDER BY
        duration_sec DESC
    LIMIT 10;
    
  5. Prüfen Sie die generierte SQL-Abfrage und führen Sie eine der folgenden Aktionen aus:

    • Um die generierte SQL-Abfrage zu akzeptieren, klicken Sie auf Einfügen. Dadurch fügen Sie die Anweisung in den Abfrageeditor ein. Klicken Sie dann auf Ausführen, um die vorgeschlagene SQL-Abfrage auszuführen.
    • Klicken Sie zum Bearbeiten der Prompts auf Bearbeiten und ändern oder ersetzen Sie dann die erste Prompt. Nachdem Sie den Prompt bearbeitet haben, klicken Sie auf Aktualisieren, um eine neue Abfrage zu generieren.
    • Klicken Sie auf Tabellenquellen bearbeiten, die als Kontext zum Generieren der vorgeschlagenen SQL-Abfrage verwendet wurden, wählen Sie die entsprechenden Kästchen aus und klicken Sie dann auf Anwenden.
    • Klicken Sie auf Abfragezusammenfassung, um eine Zusammenfassung der generierten Abfrage in natürlicher Sprache aufzurufen.
    • Wenn Sie die vorgeschlagene SQL-Abfrage verfeinern möchten, geben Sie Suchfilter in das Feld Verfeinern ein und klicken Sie dann auf Verfeinern. Geben Sie beispielsweise limit to 1000 ein, um die Anzahl der Abfrageergebnisse zu begrenzen. Wenn Sie die Änderungen an Ihrer Abfrage vergleichen möchten, klicken Sie das Kästchen Diff-Anzeige an.
    • Wenn Sie einen vorgeschlagenen Abfragetext schließen möchten, schließen Sie das SQL-Generierungstool.

SQL-Generierungstool deaktivieren

Informationen zum Deaktivieren des SQL-Generierungstools finden Sie unter Gemini-Abfrageassistentenfunktionen deaktivieren.

SQL aus einem Kommentar generieren

Sie können SQL im Abfrageeditor generieren, indem Sie die gewünschte Abfrage in einem Kommentar beschreiben.

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie im Abfrageeditor auf SQL-Abfrage.

  3. Schreiben Sie im Abfrageeditor einen SQL-Kommentar zu einer Tabelle, die Sie vor Kurzem angesehen oder abgefragt haben. Wenn Sie sich beispielsweise vor Kurzem die Tabelle bigquery-public-data.austin_bikeshare.bikeshare_trips angesehen haben, könnten Sie den folgenden Kommentar schreiben:

    # Show me the duration and subscriber type for the ten longest trips.
    
  4. Drücken Sie die Eingabetaste (Return unter macOS).

    Die vorgeschlagene SQL-Abfrage sieht in etwa so aus:

    # Show me the duration and subscriber type for the ten longest trips
    
    SELECT
      duration_sec,
      subscriber_type
      AVG(duration_minutes) AS average_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    ORDER BY
      duration_sec
    LIMIT 10;
    
  5. Drücken Sie die Tabulatortaste, um den Vorschlag zu akzeptieren.

Tipps für die SQL-Generierung

Die folgenden Tipps können die Vorschläge verbessern, die Gemini in BigQuery bietet:

  • Wenn Sie manuell angeben möchten, welche Tabellen verwendet werden sollen, können Sie den vollständig qualifizierten Tabellennamen in Graviszeichen (`) setzen, z. B. `PROJECT.DATASET.TABLE`.
  • Wenn die Spaltennamen oder ihre semantischen Beziehungen unklar oder komplex sind, können Sie im Prompt Kontext bereitstellen, um Gemini zur gewünschten Antwort zu führen. Wenn Sie beispielsweise möchten, dass eine generierte Abfrage auf einen Spaltennamen verweist, beschreiben Sie den Spaltennamen und die Relevanz für die gewünschte Antwort. Um eine Antwort zu erhalten, die sich auf komplexe Begriffe wie Lifetime-Wert oder Handelsspanne bezieht, beschreiben Sie das Konzept und seine Relevanz für Ihre Daten, um die Ergebnisse der SQL-Generierung zu verbessern.
  • Wenn Sie SQL aus einem Kommentar generieren, können Sie den Prompt über mehrere Zeilen hinweg formatieren, indem Sie jeder Zeile das Zeichen # voranstellen.
  • Spaltenbeschreibungen werden beim Generieren von SQL-Abfragen berücksichtigt. Fügen Sie Ihrem Schema Spaltenbeschreibungen hinzu, um die Genauigkeit zu verbessern. Weitere Informationen zu Spaltenbeschreibungen finden Sie unter Spaltenbeschreibungen im Abschnitt „Schema angeben“.

Gemini- und BigQuery-Daten

Gemini in BigQuery kann auf die Metadaten der Tabellen zugreifen, für die Sie eine Zugriffsberechtigung haben. Diese Metadaten können Tabellen-, Spaltennamen, Datentypen und Spaltenbeschreibungen sein. Gemini in BigQuery kann nicht auf die Daten in Ihren Tabellen, Ansichten oder Modellen zugreifen. Weitere Informationen dazu, wie Gemini Ihre Daten verwendet, finden Sie unter So nutzt Gemini für Google Cloud Ihre Daten.

SQL-Abfrage abschließen

Die SQL-Vervollständigung versucht, kontextrelevante Empfehlungen zu geben, die auf dem Inhalt des Query Editors basieren. Während der Eingabe kann Gemini logische nächste Schritte vorschlagen, die für den Kontext der aktuellen Abfrage relevant sind, oder Ihnen bei der Iteration einer Abfrage helfen.

So testen Sie die SQL-Vervollständigung mit Gemini in BigQuery:

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Kopieren Sie im Abfrageeditor Folgendes:

    SELECT
      subscriber_type
      , EXTRACT(HOUR FROM start_time) AS hour_of_day
      , AVG(duration_minutes) AS avg_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    

    Eine Fehlermeldung besagt, dass subscriber_type weder gruppiert noch aggregiert wird. Es ist nicht ungewöhnlich, dass Sie Hilfe bei der richtigen Abfrage benötigen.

  3. Drücken Sie am Ende der Zeile für subscriber_type die Leertaste.

    Die vorgeschlagenen Suchfilter für die Abfrage könnten in einem ähnlichen Text wie dem folgenden enden:

    GROUP BY
      subscriber_type, hour_of_day;
    

    Sie können auch die Eingabetaste (Return unter macOS) drücken, um Vorschläge zu generieren.

  4. Um den Vorschlag anzunehmen, drücken Sie die Tabulatortaste oder halten Sie den Mauszeiger über den vorgeschlagenen Text und klicken Sie auf alternative Vorschläge. Drücken Sie ESC oder fahren Sie mit der Eingabe fort, um einen Vorschlag zu verwerfen.

    Navigationsschaltflächen für SQL-Vorschläge.

SQL-Abfrage erklären

Sie können Gemini in BigQuery auffordern, eine SQL-Abfrage in natürlicher Sprache zu erklären. Diese Erklärung kann Ihnen helfen, eine Abfrage zu verstehen, deren Syntax, das zugrunde liegende Schema und der geschäftliche Kontext aufgrund der Länge oder Komplexität der Abfrage möglicherweise schwer zu beurteilen sind.

So erhalten Sie eine Erklärung für eine SQL-Abfrage:

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Öffnen Sie im Abfrageeditor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.

  3. Markieren Sie die Abfrage, die Gemini in BigQuery erklären soll.

  4. Klicken Sie auf astrophotography_mode Gemini und dann auf Diese Abfrage erklären.

    Das Symbol „Diese Abfrage erklären“ und der Text werden im BigQuery-Query Editor hervorgehoben.

    Die SQL-Erklärung wird im Gemini-Bereich angezeigt.

Python-Code generieren

Sie können Gemini in BigQuery mit einer Aufforderung (einer Anweisung oder Frage in natürlicher Sprache) auffordern, Python-Code zu generieren. Gemini in BigQuery antwortet mit einem oder mehreren Python-Codevorschlägen.

Im folgenden Beispiel generieren Sie Code für ein öffentliches BigQuery-Dataset, bigquery-public-data.ml_datasets.penguins.

  1. Rufen Sie die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie in der Tableiste des Abfrageeditors auf den Drop-down-Pfeil neben SQL-Abfrage und dann auf Python-Notebook.

    Das neue Notebook wird geöffnet und enthält Zellen, die Beispielabfragen für das öffentliche Dataset bigquery-public-data.ml_datasets.penguins zeigen.

  3. Wenn Sie eine neue Codezelle einfügen möchten, klicken Sie in der Symbolleiste auf Code. Die neue Codezelle enthält die Meldung Start coding or generate with AI (Mit KI programmieren oder generieren).

  4. Klicken Sie in der neuen Codezelle auf Generieren.

  5. Geben Sie im Editor Generate (Generieren) den folgenden Natural Language Prompt ein:

    Using bigquery magics, query the `bigquery-public-data.ml_datasets.penguins` table
    
  6. Drücken Sie die Eingabetaste (Return unter macOS).

    Der vorgeschlagene Python-Code sieht in etwa so aus:

    %%bigquery
    SELECT *
    FROM `bigquery-public-data.ml_datasets.penguins`
    LIMIT 10
    
  7. Drücken Sie zum Ausführen des Codes die Taste  Zelle ausführen.

Vollständiger Python-Code

Die Python-Codevervollständigung versucht, kontextgerechte Empfehlungen zu geben, die auf den Inhalten des Abfrageeditors basieren. Während der Eingabe kann Gemini in BigQuery logische nächste Schritte vorschlagen, die für den Kontext Ihres aktuellen Codes relevant sind, oder Ihnen bei der Iteration Ihres Codes helfen.

So testen Sie die Python-Codevervollständigung mit Gemini in BigQuery:

  1. Rufen Sie die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie in der Tableiste des Abfrageeditors auf den Drop-down-Pfeil neben SQL-Abfrage und dann auf Python-Notebook.

    Das neue Notebook wird geöffnet und enthält Zellen, die Beispielabfragen für das öffentliche Dataset bigquery-public-data.ml_datasets.penguins zeigen.

  3. Geben Sie im Editor Python-Code ein. Beispiel: %%bigquery Gemini in BigQuery schlägt während der Eingabe Code vor.

  4. Drücken Sie die Tabulatortaste, um den Vorschlag zu akzeptieren.

Funktionen des Gemini-Abfrageassistenten deaktivieren

So deaktivieren Sie bestimmte Funktionen in Gemini in BigQuery:

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie in der BigQuery-Symbolleiste auf pen_sparkGemini.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Entfernen Sie in der Liste die Häkchen bei den Abfrageassistenten-Funktionen, die Sie deaktivieren möchten.

Informationen zum Deaktivieren von Gemini in BigQuery finden Sie unter Gemini in BigQuery deaktivieren.

Feedback geben

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie in der BigQuery-Symbolleiste auf pen_sparkGemini.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Klicken Sie auf Feedback senden.

Vorschläge zur Verbesserung der Vorschläge

Sie können zur Verbesserung von Gemini-Vorschlägen beitragen, indem Sie die Prompt-Daten, die Sie für Funktionen in der Vorabversion einreichen, mit Google teilen.

So geben Sie Ihre Prompt-Daten frei:

  1. Rufen Sie in der Google Cloud -Konsole die Seite BigQuery Studio auf.

    Zu BigQuery Studio

  2. Klicken Sie in der BigQuery-Symbolleiste auf pen_sparkGemini.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Wählen Sie Daten weitergeben, um Gemini in BigQuery zu verbessern aus.

  4. Aktualisieren Sie im Dialogfeld Einstellungen für die Datennutzung Ihre Einstellungen für die Datennutzung.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Trusted Tester-Programm für Google Cloud .

Preise

Weitere Informationen zu den Preisen für diese Funktion finden Sie unter Preisübersicht für Gemini in BigQuery.

Kontingente und Limits

Informationen zu Kontingenten und Limits für diese Funktion finden Sie unter Kontingente für Gemini in BigQuery.

Nächste Schritte