Daten mit Gemini zur Unterstützung durch Google Cloud analysieren

In dieser Anleitung wird beschrieben, wie Sie mit Gemini für Google Cloud, einem KI-gestützten Kollaborator für Google Cloud, Daten analysieren können. In dieser Anleitung verwenden Sie Gemini in BigQuery, um Produktverkäufe zu analysieren und vorherzusagen.

In dieser Anleitung wird davon ausgegangen, dass Sie mit SQL und grundlegenden Datenanalyseaufgaben vertraut sind. Es werden keine Kenntnisse zu Google-Cloud-Produkten vorausgesetzt. Wenn Sie BigQuery noch nicht kennen, lesen Sie die BigQuery-Kurzanleitungen.

Lernziele

  • Verwenden Sie Gemini, um Ihre Fragen zu Datenanalyseprodukten und Anwendungsfällen von Google Cloud zu beantworten.
  • Fordern Sie Gemini auf, SQL-Abfragen in BigQuery zu erklären und zu generieren.
  • Ein Machine Learning Modell (ML) für Prognosen zu künftigen Zeiträumen entwickeln

Kosten

In dieser Anleitung werden die folgenden kostenpflichtigen Komponenten von Google Cloud verwendet:

Mit dem Preisrechner können Sie die Kosten basierend auf der voraussichtlichen Nutzung schätzen.

Hinweise

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. In Ihrem Google Cloud-Projekt muss Gemini in BigQuery eingerichtet sein.
  3. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  4. Erstellen Sie ein Dataset mit dem Namen bqml_tutorial. Sie verwenden das Dataset zum Speichern von Datenbankobjekten, einschließlich Tabellen und Modelle.

  5. Aktivieren Sie die Gemini-Funktionen in BigQuery, die Sie für diese Anleitung benötigen:

    1. Um Gemini-Funktionen in BigQuery aufzurufen, klicken Sie in der Symbolleiste auf pen_spark Gemini.

    2. Wählen Sie in der Liste Gemini in BigQuery SQL-Editor alle folgenden Optionen aus:

      • Automatische Vervollständigung
      • Automatische Generierung
      • Erklärung

    Zum Deaktivieren von Gemini-Funktionen in BigQuery heben Sie die Auswahl der Gemini-Funktionen auf, die Sie deaktivieren möchten.

Gemini zur Datenanalyse verwenden

Mit Gemini können Sie herausfinden, auf welche Daten Sie für die Analyse zugreifen können und wie Sie diese Daten analysieren können.

Bevor Sie Daten abfragen können, müssen Sie die verfügbaren Daten ermitteln. Jedes Datenprodukt organisiert und speichert Daten unterschiedlich. Wenn Sie Hilfe benötigen, können Sie Gemini eine Erklärung in natürlicher Sprache (oder einen Prompt) senden, z. B. „Wie sehe ich, welche Datasets und Tabellen für mich in BigQuery verfügbar sind?“.

Wenn Sie die Eigenschaften verschiedener Datenabfragesysteme verstehen möchten, können Sie Gemini nach spezifischen Produktinformationen wie den folgenden auffordern:

  • „Was sind die ersten Schritte in BigQuery?“
  • „Welche Vorteile hat es, BigQuery zur Datenanalyse zu verwenden?“
  • „Wie geht BigQuery mit Autoscaling bei Anfragen um?“

Gemini kann Ihnen auch Informationen dazu liefern, wie Sie Ihre Daten analysieren können. Für diese Art von Hilfe können Sie Gemini-Prompts wie die folgenden senden:

  • „Wie erstelle ich ein Zeitachsen-Prognosemodell in BigQuery?“
  • „Wie lade ich verschiedene Datentypen in BigQuery?“

So fordern Sie Gemini auf, Fragen zu Ihren Daten zu beantworten:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie in der Symbolleiste der Google Cloud Console auf spark Gemini öffnen.

  3. Geben Sie im Bereich Gemini einen Prompt wie How do I learn which datasets and tables are available to me in BigQuery? ein.

  4. Klicken Sie auf Prompt senden Prompt senden.

    Informationen dazu, wie und wann Gemini für Google Cloud Ihre Daten verwendet

    Gemini gibt eine Antwort aus, die ungefähr so aussieht:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Optional: Wenn Sie den Chatverlauf zurücksetzen möchten, klicken Sie im Bereich Gemini auf das Symbol Löschen und dann auf Chat zurücksetzen.

Mit Gemini SQL in BigQuery verstehen und schreiben

Gemini kann Sie bei der Arbeit mit SQL unterstützen. Wenn Sie beispielsweise mit SQL-Abfragen arbeiten, die von anderen Personen geschrieben wurden, kann Gemini in BigQuery eine komplexe Abfrage in Klartext erklären. Solche Erläuterungen können Ihnen helfen, die Abfragesyntax, das zugrunde liegende Schema und den geschäftlichen Kontext besser zu verstehen.

Gemini auffordern, SQL-Abfragen in einem Verkaufs-Dataset zu erklären

So fordern Sie Gemini auf, eine Beispiel-SQL-Abfrage zu erklären:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Öffnen Sie im Abfrageeditor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.

    Vielleicht möchten Sie beispielsweise verstehen, wie Datentabellen und Abfragen in einem Verkaufs-Dataset zusammenhängen, und benötigen Hilfe beim Schreiben von Abfragen, die das Dataset verwenden. In der folgenden Beispielabfrage können Sie möglicherweise nachvollziehen, welche Tabellen verwendet werden, aber für andere Abschnitte der Abfrage benötigen Sie möglicherweise Zeit, um sie zu parsen und zu verstehen.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Markieren Sie die Abfrage, die Gemini erklären soll, und klicken Sie dann auf pen_spark Diese Abfrage erklären.

    Die SQL-Erklärung wird im Gemini-Bereich angezeigt.

    Bei Verwendung der Beispielabfrage aus dem vorherigen Schritt gibt Gemini eine Erklärung wie diese zurück:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

SQL-Abfrage generieren, die Verkäufe nach Tag und Produkt gruppiert

Sie können Gemini einen Prompt geben, um eine SQL-Abfrage basierend auf dem Schema Ihrer Daten zu generieren. Auch wenn Sie ohne Code, mit begrenzten Kenntnissen des Datenschemas oder nur mit Grundkenntnissen der SQL-Syntax beginnen, kann Gemini eine oder mehrere SQL-Anweisungen vorschlagen.

Im folgenden Beispiel generieren Sie eine Abfrage, mit der Ihre Top-Produkte für jeden Tag aufgelistet werden. Diese Art von Abfrage ist oft komplex, aber mit Gemini können Sie automatisch eine Anweisung erstellen. Anschließend verwenden Sie Tabellen im Dataset thelook_ecommerce und fordern Gemini auf, eine Abfrage zu generieren, um Verkäufe nach Bestellartikeln und Produktnamen zu berechnen.

So fordern Sie Gemini auf, eine Abfrage zu generieren, in der Ihre beliebtesten Produkte aufgelistet werden:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im Navigationsmenü auf BigQuery Studio.

  3. Klicken Sie auf Neue Abfrage erstellen. Im Bereich Explorer wird die ausgewählte Datenbank automatisch geladen.

  4. Geben Sie im Abfrageeditor den folgenden Prompt ein und drücken Sie die Eingabetaste. Das Rautezeichen (#) fordert Gemini auf, SQL zu generieren.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini schlägt eine SQL-Abfrage vor, die in etwa so aussieht:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Um den vorgeschlagenen Code zu übernehmen, klicken Sie auf die Tabulatortaste und dann auf Ausführen, um die SQL-Anweisung auszuführen. Sie können auch durch die SQL-Vorschläge scrollen und bestimmte Wörter übernehmen, die in der Anweisung vorgeschlagen werden.

  6. Im Bereich Abfrageergebnisse können Sie eben diese anzeigen lassen.

Prognosemodell erstellen und Ergebnisse aufrufen

In diesem Abschnitt verwenden Sie BigQuery ML für folgende Aufgaben:

  • Verwenden Sie eine Trendabfrage, um ein Prognosemodell zu erstellen.
  • Verwenden Sie Gemini, um eine Abfrage zu erklären und zu schreiben, um Ergebnisse des Prognosemodells anzusehen.

Sie verwenden die folgende Beispielabfrage mit tatsächlichen Verkäufen, die als Eingabe für das Modell verwendet werden. Die Abfrage wird bei der Erstellung des ML-Modells verwendet.

  1. Führen Sie im BigQuery-SQL-Editor den folgenden SQL-Code aus, um ein ML-Prognosemodell zu erstellen:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Mithilfe von Gemini können Sie diese Abfrage besser verstehen.

    Nachdem das Modell erstellt wurde, wird im Bereich Ergebnisse eine Meldung ähnlich der folgenden angezeigt:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Geben Sie im Bereich Gemini einen Prompt für Gemini ein, um eine Abfrage zu schreiben, mit der Sie nach Abschluss des Modells eine Prognose vom Modell erhalten. Geben Sie beispielsweise How can I get a forecast in SQL from the model? ein.

    Je nach Kontext des Prompts gibt Gemini ein Beispiel für ein ML-Modell zurück, das Verkäufe prognostiziert:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Kopieren Sie die SQL-Abfrage aus dem Gemini-Bereich.

  4. Fügen Sie die SQL-Abfrage im BigQuery-SQL-Editor ein und führen Sie sie dann aus.

Bereinigen

Wenn Sie vermeiden möchten, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden, können Sie das für diese Anleitung erstellte Google Cloud-Projekt löschen. Alternativ haben Sie die Möglichkeit, die einzelnen Ressourcen zu löschen.

  1. Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Dataset löschen

Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt wiederverwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen.

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Wählen Sie im Navigationsbereich das Dataset bqml_tutorial aus, das Sie erstellt haben.

  3. Klicken Sie auf Dataset löschen, um das Dataset, die Tabelle und alle Daten zu löschen.

  4. Geben Sie im Dialogfeld Dataset löschen den Namen des Datasets (bqml_tutorial) ein und klicken Sie auf Löschen, um das Löschen zu bestätigen.

Nächste Schritte