Daten mit Gemini analysieren
In dieser Anleitung wird beschrieben, wie Sie die KI-basierte Unterstützung in Gemini in BigQuery zur Analyse von Daten verwenden können.
Nehmen Sie für das Beispiel in dieser Anleitung an, dass Sie ein Datenanalyst sind, der Produktverkäufe aus einem Dataset analysieren und vorhersagen muss.
In dieser Anleitung wird davon ausgegangen, dass Sie mit SQL und grundlegenden Datenanalyseaufgaben vertraut sind. Es werden keine Kenntnisse zu Google-Cloud-Produkten vorausgesetzt. Wenn BigQuery noch neu für Sie ist, nutzen Sie die BigQuery-Kurzanleitungen.
Ziele
- Mit Gemini in BigQuery Fragen dazu beantworten, wie BigQuery bestimmte Datenanalyseaufgaben verarbeitet.
- Gemini in BigQuery auffordern, Datasets zu suchen und SQL-Abfragen zu erklären und zu generieren.
- Ein Machine Learning Modell (ML) für Prognosen zu künftigen Zeiträumen entwickeln
Kosten
In dieser Anleitung werden die folgenden kostenpflichtigen Google Cloud-Produkte verwendet:
Mit dem Preisrechner können Sie Ihre Kosten anhand Ihrer voraussichtlichen Nutzung schätzen.
Hinweise
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- Achten Sie darauf, dass Gemini in BigQuery für Ihr Google Cloud-Projekt eingerichtet ist.
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Erstellen Sie einen Datensatz mit dem Namen
bqml_tutorial
. Sie verwenden das Dataset, um Datenbankobjekte zu speichern, einschließlich Tabellen und Modellen.Um die Gemini in BigQuery-Features zu aktivieren, die Sie für diese Anleitung benötigen, klicken Sie in der BigQuery-Symbolleiste auf pen_spark Gemini. Wählen Sie die folgenden Optionen aus:
- Automatische Vervollständigung
- Automatische Generierung
- Erklärung
Informationen zu BigQuery-Funktionen
Bevor Sie beginnen, möchten Sie sich darüber informieren, wie BigQuery Datenabfragen verarbeitet. Um Hilfe zu erhalten, können Sie Gemini in BigQuery eine Anweisung in natürlicher Sprache (oder Eingabeaufforderung) wie die folgende senden:
- „Was sind die ersten Schritte in BigQuery?“
- „Welche Vorteile hat es, BigQuery zur Datenanalyse zu verwenden?“
- „Wie geht BigQuery mit Autoscaling bei Anfragen um?“
Gemini in BigQuery kann auch Informationen zur Analyse Ihrer Daten liefern. Für diese Art von Hilfe können Sie Aufforderungen wie die folgenden senden:
- „Wie erstelle ich ein Zeitachsen-Prognosemodell in BigQuery?“
- „Wie lade ich verschiedene Datentypen in BigQuery hoch?“
Daten aufrufen und analysieren
Mit Gemini in BigQuery können Sie herausfinden, auf welche Daten Sie zur Analyse zugreifen können und wie Sie diese Daten analysieren können.
Angenommen, Sie benötigen Hilfe bei Folgendem:
- Verkaufs-Dataset und zu analysierende Tabellen finden.
- Sie möchten wissen, wie Datentabellen und Abfragen in einem Verkaufs-Dataset zusammenhängen.
- Komplexe Abfragen verstehen und Abfragen schreiben, die den Datensatz verwenden.
Daten aufrufen
Bevor Sie Daten abfragen können, müssen Sie die verfügbaren Daten ermitteln. Jedes Datenprodukt organisiert und speichert Daten anders.
Unterstützung dabei bekommen Sie von Gemini in BigQuery mit einer Anweisung (bzw. einem Prompt) in natürlicher Sprache. Beispiel: „Wie kann ich die Datasets und Tabellen anzeigen, die mir in BigQuery zur Verfügung stehen?“
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Klicken Sie in der Symbolleiste der Google Cloud Console auf spark Gemini-KI-Chat öffnen oder schließen.
Geben Sie im Gemini-Bereich den Prompt
How do I learn which datasets and tables are available to me in BigQuery?
ein:Klicken Sie auf send Anfrage senden.
Weitere Informationen dazu, wie und wann Gemini for Google Cloud Ihre Daten verwendet
Die Antwort enthält mehrere Möglichkeiten, Projekte, Datensätze oder Tabellen innerhalb eines Datensatzes aufzulisten.
Optional: Wenn Sie den Chatverlauf zurücksetzen möchten, klicken Sie im Bereich Gemini auf delete Gemini und dann auf Gemini.
SQL in BigQuery verstehen und schreiben
Angenommen, Sie haben Daten zur Analyse ausgewählt und möchten diese jetzt abfragen. Gemini in BigQuery kann Ihnen bei der Arbeit mit SQL helfen, sei es, um Abfragen zu verstehen, die komplex und schwer zu parsen sind, oder um neue SQL-Abfragen zu generieren.
Gemini auffordern, SQL-Abfragen zu erklären
Angenommen, Sie möchten eine komplexe Abfrage verstehen, die von jemand anderem geschrieben wurde. Gemini in BigQuery kann die Abfrage in Nur-Sprache erklären, z. B. die Abfragesyntax, das zugrunde liegende Schema und den Geschäftskontext.
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Öffnen Sie im Abfrageeditor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein. Beispiel:
SELECT u.id AS user_id, u.first_name, u.last_name, avg(oi.sale_price) AS avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` AS u JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi ON u.id = oi.user_id GROUP BY 1, 2, 3 ORDER BY avg_sale_price DESC LIMIT 10
Markieren Sie die Abfrage und klicken Sie dann auf auto_awesome Diese ausgewählte Abfrage erklären.
Im Bereich Gemini wird eine Antwort wie diese zurückgegeben:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id, first_name, and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
SQL-Abfrage generieren, die Verkäufe nach Tag und Produkt gruppiert
In diesem Beispiel möchten Sie eine Abfrage generieren, in der Ihre Top-Produkte für jeden Tag aufgeführt sind. Anschließend verwenden Sie die Tabellen im Dataset thelook_ecommerce
und fordern Gemini in BigQuery auf, eine Abfrage zur Berechnung der Verkäufe nach bestelltem Produkt und Produktname zu generieren.
Dieser Abfragetyp ist häufig komplex, aber mit Gemini in BigQuery können Sie automatisch eine Anweisung erstellen. Sie können eine Eingabeaufforderung zum Generieren einer SQL-Abfrage basierend auf dem Datenschema angeben. Selbst wenn Sie ohne Code, mit einer begrenzten Kenntnis des Datenschemas oder nur mit Grundkenntnissen der SQL-Syntax beginnen, kann Gemini eine oder mehrere SQL-Anweisungen vorschlagen.
So fordern Sie Gemini in BigQuery auf, eine Abfrage zu generieren, die Ihre Top-Produkte auflistet:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Klicken Sie im Navigationsmenü auf BigQuery Studio.
Klicken Sie auf
Neue Abfrage erstellen. Der Explorer-Bereich lädt automatisch die ausgewählte Datenbank.Geben Sie im Abfrageeditor den folgenden Prompt ein und drücken Sie die Eingabetaste:
# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
Das Rautezeichen (
#
) fordert Gemini in BigQuery auf, SQL zu generieren. Gemini in BigQuery schlägt eine SQL-Abfrage vor, die in etwa so aussieht:SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
Wenn Sie den vorgeschlagenen Code akzeptieren möchten, klicken Sie auf den Tab und auf Ausführen, um die SQL-Anweisung auszuführen. Sie können auch durch die vorgeschlagene SQL-Anweisung scrollen und bestimmte darin vorgeschlagene Wörter akzeptieren.
Im Bereich Abfrageergebnisse können Sie eben diese anzeigen lassen.
Prognosemodell erstellen und Ergebnisse aufrufen
In diesem Beispiel verwenden Sie BigQuery ML für Folgendes:
- Verwenden Sie eine Trendabfrage, um ein Prognosemodell zu erstellen.
- Verwenden Sie Gemini in BigQuery, um eine Abfrage zu erklären und zu unterstützen, um Ergebnisse des Prognosemodells aufzurufen.
Sie verwenden die folgende Beispielabfrage mit realen Verkäufen, die als Input für das Modell verwendet werden. Die Abfrage wird bei der Erstellung des ML-Modells verwendet.
Führen Sie im Abfrageeditor die folgende SQL-Abfrage aus, um ein ML-Modell zur Prognose zu erstellen:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date_col', time_series_data_col = 'total_sales', time_series_id_col = 'product_id') AS SELECT sum(sale_price) AS total_sales, DATE(created_at) AS date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
Sie können Gemini in BigQuery verwenden, um Ihnen diese Abfrage zu verstehen.
Beim Erstellen des Modells wird auf dem Tab Ergebnisse im Bereich Abfrageergebnisse eine Meldung angezeigt, die in etwa so aussieht:
Successfully created model named sales_forecasting_model.
Geben Sie im Bereich Gemini einen Prompt für Gemini in BigQuery ein, damit Sie eine Abfrage schreiben können, um eine Prognose vom Modell zu erhalten, wenn es abgeschlossen ist. Geben Sie beispielsweise
How can I get a forecast in SQL from the model?
ein.Basierend auf dem Kontext des Prompts enthält die Antwort ein Beispiel für ein ML-Modell, das den Umsatz prognostiziert:
SELECT * FROM ML.FORECAST( MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`, STRUCT( 7 AS horizon, 0.95 AS confidence_level))
In dieser Antwort steht
PROJECT_ID
für Ihr Google Cloud-Projekt.Kopieren Sie die SQL-Abfrage aus dem Gemini-Bereich.
Führen Sie im Abfrageeditor die SQL-Abfrage aus.
Bereinigen
Wenn Sie vermeiden möchten, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden, können Sie das dafür erstellte Google Cloud-Projekt löschen. Alternativ haben Sie die Möglichkeit, die einzelnen Ressourcen zu löschen.
Projekt löschen
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Dataset löschen
Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt wiederverwenden möchten, können Sie den Datensatz löschen, den Sie in dieser Anleitung erstellt haben.
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Wählen Sie im Navigationsmenü das Dataset
bqml_tutorial
aus, das Sie erstellt haben.Wenn Sie das Dataset, die Tabelle und alle Daten löschen möchten, klicken Sie auf Dataset löschen.
Bestätigen Sie das Löschen, indem Sie im Dialogfeld Dataset löschen den Namen des Datasets (
bqml_tutorial
) eingeben und dann auf Löschen klicken.
Nächste Schritte
- Übersicht über Gemini für Google Cloud
- Kontingente und Limits von Gemini für Google Cloud
- Weitere Informationen zu Standorten für Gemini for Google Cloud