Daten mit Gemini zur Unterstützung von Google Cloud analysieren

In dieser Anleitung wird beschrieben, wie Sie Gemini für Google Cloud, einen KI-gestützten Mitbearbeiter für Google Cloud, zum Analysieren von Daten verwenden können. In dieser Anleitung verwenden Sie Gemini in BigQuery, um Produktverkäufe zu analysieren und vorherzusagen.

In dieser Anleitung wird davon ausgegangen, dass Sie mit SQL und grundlegenden Datenanalyseaufgaben vertraut sind. Es werden keine Kenntnisse zu Google-Cloud-Produkten vorausgesetzt. Wenn Sie BigQuery noch nicht kennen, lesen Sie die BigQuery-Kurzanleitungen.

Lernziele

  • Verwenden Sie Gemini, um Ihre Fragen zu Datenanalyseprodukten und -anwendungsfällen von Google Cloud zu beantworten.
  • Gemini dazu auffordern, SQL-Abfragen in BigQuery zu erklären und zu generieren.
  • Ein Machine Learning Modell (ML) für Prognosen zu künftigen Zeiträumen entwickeln

Kosten

In dieser Anleitung werden die folgenden kostenpflichtigen Komponenten von Google Cloud verwendet:

Mit dem Preisrechner können Sie die Kosten basierend auf der voraussichtlichen Nutzung schätzen.

Hinweise

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Prüfen Sie, ob in Ihrem Google Cloud-Projekt Gemini in BigQuery eingerichtet ist.
  3. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  4. Erstellen Sie ein Dataset mit dem Namen bqml_tutorial. Das Dataset wird zum Speichern von Datenbankobjekten wie Tabellen und Modellen verwendet.

  5. Aktivieren Sie die Gemini-Features in BigQuery, die Sie für diese Anleitung benötigen:

    1. Klicken Sie zum Aufrufen von Gemini-Features in BigQuery in der Symbolleiste auf pen_spark Gemini.

    2. Wählen Sie in der Liste Gemini im BigQuery SQL-Editor alle folgenden Optionen aus:

      • Automatische Vervollständigung
      • Automatische Generierung
      • Erklärung

    Zum Deaktivieren von Gemini-Features in BigQuery heben Sie die Auswahl der gewünschten Gemini-Features auf.

Gemini zur Datenanalyse verwenden

Gemini zeigt Ihnen, auf welche Daten Sie für die Analyse zugreifen können und wie Sie diese Daten analysieren können.

Bevor Sie Daten abfragen können, müssen Sie die verfügbaren Daten ermitteln. Jedes Datenprodukt organisiert und speichert Daten unterschiedlich. Um Hilfe zu erhalten, können Sie an Gemini eine Erklärung in natürlicher Sprache (oder eine Aufforderung) senden, z. B. „Wie sehe ich mir an, welche Datasets und Tabellen in BigQuery zur Verfügung stehen?“.

Wenn Sie die Eigenschaften verschiedener Datenabfragesysteme verstehen möchten, können Sie Gemini bestimmte Produktinformationen wie die folgenden anfordern:

  • „Was sind die ersten Schritte in BigQuery?“
  • „Welche Vorteile hat es, BigQuery zur Datenanalyse zu verwenden?“
  • „Wie geht BigQuery mit Autoscaling bei Anfragen um?“

Gemini kann auch Informationen zur Datenanalyse liefern. Für diese Art von Hilfe können Sie Gemini-Aufforderungen wie die folgenden senden:

  • „Wie erstelle ich ein Zeitreihen-Prognosemodell in BigQuery?“
  • „Wie lade ich verschiedene Datentypen in BigQuery?“

Gehen Sie so vor, um Gemini dazu aufzufordern, Fragen zu Ihren Daten zu beantworten:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie in der Symbolleiste der Google Cloud Console auf spark Open Gemini.

  3. Geben Sie im Bereich Gemini einen Prompt wie How do I learn which datasets and tables are available to me in BigQuery? ein.

  4. Klicken Sie auf Aufforderung senden.

    Gemini for Google Cloud verwendet Ihre Prompts oder deren Antworten nicht als Daten, um seine Modelle zu trainieren. Weitere Informationen finden Sie unter So verwendet Gemini for Google Cloud Ihre Daten.

    Gemini gibt eine Antwort aus, die ungefähr so aussieht:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Optional: Klicken Sie im Bereich Gemini auf das Symbol Löschen und dann auf Chat zurücksetzen, um das Chatprotokoll zurückzusetzen.

Mit Gemini SQL-Code in BigQuery verstehen und schreiben

Gemini kann Sie bei der Arbeit mit SQL unterstützen. Wenn Sie beispielsweise mit SQL-Abfragen arbeiten, die andere geschrieben haben, kann Gemini in BigQuery eine komplexe Abfrage leicht verständlich erklären. Solche Erläuterungen können Ihnen helfen, die Abfragesyntax, das zugrunde liegende Schema und den Geschäftskontext zu verstehen.

Gemini auffordern, SQL-Abfragen in einem Verkaufs-Dataset zu erklären

Führen Sie die folgenden Schritte aus, um Gemini dazu aufzufordern, eine Beispiel-SQL-Abfrage zu erklären:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Öffnen Sie im Abfrageeditor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.

    Sie möchten beispielsweise verstehen, wie Datentabellen und Abfragen in einem Verkaufs-Dataset zusammenhängen, und Sie können Hilfe beim Schreiben von Abfragen erhalten, in denen das Dataset verwendet wird. In der folgenden Beispielabfrage verstehen Sie vielleicht, welche Tabellen verwendet werden, aber andere Abschnitte der Abfrage benötigen möglicherweise Zeit zum Parsen und Verständnis.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Markieren Sie die Abfrage, die Gemini erklären soll, und klicken Sie dann auf pen_spark Diese Abfrage erklären.

    Die SQL-Erklärung wird im Gemini-Bereich angezeigt.

    Unter Verwendung der Beispielabfrage aus dem vorherigen Schritt gibt Gemini eine Erklärung wie die folgende zurück:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

SQL-Abfrage generieren, die Verkäufe nach Tag und Produkt gruppiert

Sie können Gemini dazu auffordern, eine SQL-Abfrage anhand des Schemas Ihrer Daten zu generieren. Auch wenn Sie ohne Code, nur begrenzte Kenntnisse des Datenschemas oder nur grundlegende Kenntnisse der SQL-Syntax beginnen, kann Gemini eine oder mehrere SQL-Anweisungen vorschlagen.

Im folgenden Beispiel generieren Sie eine Abfrage, mit der Ihre Top-Produkte für jeden Tag aufgelistet werden. Dieser Abfragetyp ist oft komplex, aber mit Gemini können Sie automatisch eine Anweisung erstellen. Anschließend verwenden Sie Tabellen im Dataset thelook_ecommerce und fordern Gemini dazu auf, eine Abfrage zu generieren, um den Umsatz nach Bestellartikel und Produktname zu berechnen.

Gehen Sie so vor, um Gemini eine Abfrage zu generieren, in der Ihre Top-Produkte aufgelistet werden:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im Navigationsmenü auf BigQuery Studio.

  3. Klicken Sie auf Neue Abfrage erstellen. Im Bereich Explorer wird die ausgewählte Datenbank automatisch geladen.

  4. Geben Sie im Query Editor die folgende Eingabeaufforderung ein und drücken Sie dann die Eingabetaste. Das Rautezeichen (#) fordert Gemini dazu auf, SQL zu generieren.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini schlägt eine SQL-Abfrage vor, die in etwa so aussieht:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Um den vorgeschlagenen Code anzunehmen, klicken Sie auf die Tabulatortaste und dann auf Ausführen, um die SQL-Anweisung auszuführen. Sie können auch durch die SQL-Vorschläge scrollen und bestimmte Wörter übernehmen.

  6. Im Bereich Abfrageergebnisse können Sie eben diese anzeigen lassen.

Prognosemodell erstellen und Ergebnisse aufrufen

In diesem Abschnitt verwenden Sie BigQuery ML für folgende Aufgaben:

  • Verwenden Sie eine Trendabfrage, um ein Prognosemodell zu erstellen.
  • Mit Gemini erklären und schreiben Sie eine Abfrage, um die Ergebnisse des Prognosemodells anzusehen.

Sie verwenden die folgende Beispielabfrage mit tatsächlichen Verkäufen, die als Eingabe für das Modell verwendet werden. Die Abfrage wird bei der Erstellung des ML-Modells verwendet.

  1. Führen Sie den folgenden SQL-Code im BigQuery-SQL-Editor aus, um ein ML-Prognosemodell zu erstellen:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Sie können Gemini verwenden, um diese Abfrage zu verstehen.

    Wenn das Modell erstellt ist, wird im Bereich Ergebnisse eine Meldung ähnlich der folgenden angezeigt:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Geben Sie im Bereich Gemini eine Eingabeaufforderung für Gemini ein, um eine Abfrage zu schreiben, um eine Prognose vom Modell zu erhalten, wenn es abgeschlossen ist. Geben Sie beispielsweise How can I get a forecast in SQL from the model? ein.

    Je nach Kontext des Prompts gibt Gemini ein Beispiel für ein ML-Modell zurück, das Verkäufe prognostiziert:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Kopieren Sie die SQL-Abfrage aus dem Gemini-Bereich.

  4. Fügen Sie die SQL-Abfrage in den BigQuery-SQL-Editor ein und führen Sie sie dann aus.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie das Google Cloud-Projekt löschen, das Sie für diese Anleitung erstellt haben. Alternativ haben Sie die Möglichkeit, die einzelnen Ressourcen zu löschen.

  1. Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Dataset löschen

Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt lieber wiederverwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen.

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Wählen Sie im Navigationsbereich das Dataset bqml_tutorial aus, das Sie erstellt haben.

  3. Klicken Sie auf Dataset löschen, um das Dataset, die Tabelle und alle Daten zu löschen.

  4. Geben Sie im Dialogfeld Dataset löschen den Namen des Datasets (bqml_tutorial) ein und klicken Sie auf Löschen, um das Löschen zu bestätigen.

Nächste Schritte