In dieser Anleitung wird beschrieben, wie Sie mit Gemini für Google Cloud, einem KI-gestützten Kollaborator für Google Cloud, Daten analysieren können. In dieser Anleitung verwenden Sie Gemini in BigQuery, um Produktverkäufe zu analysieren und vorherzusagen.
In dieser Anleitung wird davon ausgegangen, dass Sie mit SQL und grundlegenden Datenanalyseaufgaben vertraut sind. Es werden keine Kenntnisse zu Google-Cloud-Produkten vorausgesetzt. Wenn Sie BigQuery noch nicht kennen, lesen Sie die BigQuery-Kurzanleitungen.
Lernziele
- Verwenden Sie Gemini, um Ihre Fragen zu Datenanalyseprodukten und Anwendungsfällen von Google Cloud zu beantworten.
- Fordern Sie Gemini auf, SQL-Abfragen in BigQuery zu erklären und zu generieren.
- Ein Machine Learning Modell (ML) für Prognosen zu künftigen Zeiträumen entwickeln
Kosten
In dieser Anleitung werden die folgenden kostenpflichtigen Komponenten von Google Cloud verwendet:
Mit dem Preisrechner können Sie die Kosten basierend auf der voraussichtlichen Nutzung schätzen.
Hinweise
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- In Ihrem Google Cloud-Projekt muss Gemini in BigQuery eingerichtet sein.
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Erstellen Sie ein Dataset mit dem Namen
bqml_tutorial
. Sie verwenden das Dataset zum Speichern von Datenbankobjekten, einschließlich Tabellen und Modelle.Aktivieren Sie die Gemini-Funktionen in BigQuery, die Sie für diese Anleitung benötigen:
Um Gemini-Funktionen in BigQuery aufzurufen, klicken Sie in der Symbolleiste auf pen_spark Gemini.
Wählen Sie in der Liste Gemini in BigQuery SQL-Editor alle folgenden Optionen aus:
- Automatische Vervollständigung
- Automatische Generierung
- Erklärung
Zum Deaktivieren von Gemini-Funktionen in BigQuery heben Sie die Auswahl der Gemini-Funktionen auf, die Sie deaktivieren möchten.
Gemini zur Datenanalyse verwenden
Mit Gemini können Sie herausfinden, auf welche Daten Sie für die Analyse zugreifen können und wie Sie diese Daten analysieren können.
Bevor Sie Daten abfragen können, müssen Sie die verfügbaren Daten ermitteln. Jedes Datenprodukt organisiert und speichert Daten unterschiedlich. Wenn Sie Hilfe benötigen, können Sie Gemini eine Erklärung in natürlicher Sprache (oder einen Prompt) senden, z. B. „Wie sehe ich, welche Datasets und Tabellen für mich in BigQuery verfügbar sind?“.
Wenn Sie die Eigenschaften verschiedener Datenabfragesysteme verstehen möchten, können Sie Gemini nach spezifischen Produktinformationen wie den folgenden auffordern:
- „Was sind die ersten Schritte in BigQuery?“
- „Welche Vorteile hat es, BigQuery zur Datenanalyse zu verwenden?“
- „Wie geht BigQuery mit Autoscaling bei Anfragen um?“
Gemini kann Ihnen auch Informationen dazu liefern, wie Sie Ihre Daten analysieren können. Für diese Art von Hilfe können Sie Gemini-Prompts wie die folgenden senden:
- „Wie erstelle ich ein Zeitachsen-Prognosemodell in BigQuery?“
- „Wie lade ich verschiedene Datentypen in BigQuery?“
So fordern Sie Gemini auf, Fragen zu Ihren Daten zu beantworten:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Klicken Sie in der Symbolleiste der Google Cloud Console auf spark Gemini öffnen.
Geben Sie im Bereich Gemini einen Prompt wie
How do I learn which datasets and tables are available to me in BigQuery?
ein.Klicken Sie auf Prompt senden Prompt senden.
Informationen dazu, wie und wann Gemini für Google Cloud Ihre Daten verwendet
Gemini gibt eine Antwort aus, die ungefähr so aussieht:
To learn which datasets and tables are available to you in BigQuery, you can use the Google Cloud console, the Google Cloud CLI, or the BigQuery API. ...
Optional: Wenn Sie den Chatverlauf zurücksetzen möchten, klicken Sie im Bereich Gemini auf das Symbol Löschen und dann auf Chat zurücksetzen.
Mit Gemini SQL in BigQuery verstehen und schreiben
Gemini kann Sie bei der Arbeit mit SQL unterstützen. Wenn Sie beispielsweise mit SQL-Abfragen arbeiten, die von anderen Personen geschrieben wurden, kann Gemini in BigQuery eine komplexe Abfrage in Klartext erklären. Solche Erläuterungen können Ihnen helfen, die Abfragesyntax, das zugrunde liegende Schema und den geschäftlichen Kontext besser zu verstehen.
Gemini auffordern, SQL-Abfragen in einem Verkaufs-Dataset zu erklären
So fordern Sie Gemini auf, eine Beispiel-SQL-Abfrage zu erklären:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Öffnen Sie im Abfrageeditor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.
Vielleicht möchten Sie beispielsweise verstehen, wie Datentabellen und Abfragen in einem Verkaufs-Dataset zusammenhängen, und benötigen Hilfe beim Schreiben von Abfragen, die das Dataset verwenden. In der folgenden Beispielabfrage können Sie möglicherweise nachvollziehen, welche Tabellen verwendet werden, aber für andere Abschnitte der Abfrage benötigen Sie möglicherweise Zeit, um sie zu parsen und zu verstehen.
SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` as u JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi ON u.id = oi.user_id GROUP BY 1,2,3 ORDER BY avg_sale_price DESC LIMIT 10
Markieren Sie die Abfrage, die Gemini erklären soll, und klicken Sie dann auf pen_spark Diese Abfrage erklären.
Die SQL-Erklärung wird im Gemini-Bereich angezeigt.
Bei Verwendung der Beispielabfrage aus dem vorherigen Schritt gibt Gemini eine Erklärung wie diese zurück:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id , first_name , and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
SQL-Abfrage generieren, die Verkäufe nach Tag und Produkt gruppiert
Sie können Gemini einen Prompt geben, um eine SQL-Abfrage basierend auf dem Schema Ihrer Daten zu generieren. Auch wenn Sie ohne Code, mit begrenzten Kenntnissen des Datenschemas oder nur mit Grundkenntnissen der SQL-Syntax beginnen, kann Gemini eine oder mehrere SQL-Anweisungen vorschlagen.
Im folgenden Beispiel generieren Sie eine Abfrage, mit der Ihre Top-Produkte für jeden Tag aufgelistet werden.
Diese Art von Abfrage ist oft komplex, aber mit Gemini können Sie automatisch eine Anweisung erstellen. Anschließend verwenden Sie Tabellen im Dataset thelook_ecommerce
und fordern Gemini auf, eine Abfrage zu generieren, um Verkäufe nach Bestellartikeln und Produktnamen zu berechnen.
So fordern Sie Gemini auf, eine Abfrage zu generieren, in der Ihre beliebtesten Produkte aufgelistet werden:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Klicken Sie im Navigationsmenü auf BigQuery Studio.
Klicken Sie auf
Neue Abfrage erstellen. Im Bereich Explorer wird die ausgewählte Datenbank automatisch geladen.Geben Sie im Abfrageeditor den folgenden Prompt ein und drücken Sie die Eingabetaste. Das Rautezeichen (
#
) fordert Gemini auf, SQL zu generieren.# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
Gemini schlägt eine SQL-Abfrage vor, die in etwa so aussieht:
SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
Um den vorgeschlagenen Code zu übernehmen, klicken Sie auf die Tabulatortaste und dann auf Ausführen, um die SQL-Anweisung auszuführen. Sie können auch durch die SQL-Vorschläge scrollen und bestimmte Wörter übernehmen, die in der Anweisung vorgeschlagen werden.
Im Bereich Abfrageergebnisse können Sie eben diese anzeigen lassen.
Prognosemodell erstellen und Ergebnisse aufrufen
In diesem Abschnitt verwenden Sie BigQuery ML für folgende Aufgaben:
- Verwenden Sie eine Trendabfrage, um ein Prognosemodell zu erstellen.
- Verwenden Sie Gemini, um eine Abfrage zu erklären und zu schreiben, um Ergebnisse des Prognosemodells anzusehen.
Sie verwenden die folgende Beispielabfrage mit tatsächlichen Verkäufen, die als Eingabe für das Modell verwendet werden. Die Abfrage wird bei der Erstellung des ML-Modells verwendet.
Führen Sie im BigQuery-SQL-Editor den folgenden SQL-Code aus, um ein ML-Prognosemodell zu erstellen:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS(MODEL_TYPE='ARIMA_PLUS', time_series_timestamp_col='date_col', time_series_data_col='total_sales', time_series_id_col='product_id') AS SELECT sum(sale_price) as total_sales, DATE(created_at) as date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
Mithilfe von Gemini können Sie diese Abfrage besser verstehen.
Nachdem das Modell erstellt wurde, wird im Bereich Ergebnisse eine Meldung ähnlich der folgenden angezeigt:
This statement will replace the model named sales_forecasting_model. Depending on the type of model, this may take several hours to complete.
Geben Sie im Bereich Gemini einen Prompt für Gemini ein, um eine Abfrage zu schreiben, mit der Sie nach Abschluss des Modells eine Prognose vom Modell erhalten. Geben Sie beispielsweise
How can I get a forecast in SQL from the model?
ein.Je nach Kontext des Prompts gibt Gemini ein Beispiel für ein ML-Modell zurück, das Verkäufe prognostiziert:
To get a forecast in SQL from the model, you can use the following query: SELECT * FROM ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`, STRUCT( 7 AS horizon, 0.95 AS confidence_level ) )
Kopieren Sie die SQL-Abfrage aus dem Gemini-Bereich.
Fügen Sie die SQL-Abfrage im BigQuery-SQL-Editor ein und führen Sie sie dann aus.
Bereinigen
Wenn Sie vermeiden möchten, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden, können Sie das für diese Anleitung erstellte Google Cloud-Projekt löschen. Alternativ haben Sie die Möglichkeit, die einzelnen Ressourcen zu löschen.
- Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.
Dataset löschen
Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt wiederverwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen.
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Wählen Sie im Navigationsbereich das Dataset
bqml_tutorial
aus, das Sie erstellt haben.Klicken Sie auf Dataset löschen, um das Dataset, die Tabelle und alle Daten zu löschen.
Geben Sie im Dialogfeld Dataset löschen den Namen des Datasets (
bqml_tutorial
) ein und klicken Sie auf Löschen, um das Löschen zu bestätigen.
Nächste Schritte
Informationen zu Standorten für Gemini