Daten mit Unterstützung von Duet-KI analysieren

In dieser Anleitung wird beschrieben, wie Sie mit Duet-KI, einem KI-gestützten Team in Google Cloud, Daten analysieren können. In dieser Anleitung verwenden Sie Duet-KI in BigQuery, um Produktverkäufe zu analysieren und vorherzusagen.

In dieser Anleitung wird davon ausgegangen, dass Sie mit SQL und grundlegenden Datenanalyseaufgaben vertraut sind. Kenntnisse der Google Cloud-Produkte werden nicht vorausgesetzt. Wenn Sie BigQuery noch nicht kennen, lesen Sie die BigQuery-Kurzanleitungen.

Lernziele

  • Verwenden Sie Duet-KI, um Ihre Fragen zu Datenanalyseprodukten und Anwendungsfällen von Google Cloud zu beantworten.
  • Fordern Sie Duet-KI auf, SQL-Abfragen in BigQuery zu erklären und zu generieren.
  • Erstellen Sie ein Modell für maschinelles Lernen (ML), um zukünftige Zeiträume vorherzusagen.

Kosten

In dieser Anleitung werden die folgenden kostenpflichtigen Komponenten von Google Cloud verwendet:

Mit dem Preisrechner können Sie die Kosten anhand der voraussichtlichen Nutzung schätzen.

Hinweise

  1. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  2. Prüfen Sie, ob Duet AI für Ihr Google Cloud-Nutzerkonto und -Projekt eingerichtet ist.
  3. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  4. Erstellen Sie ein Dataset mit dem Namen bqml_tutorial. Sie verwenden das Dataset zum Speichern von Datenbankobjekten, einschließlich Tabellen und Modellen.

  5. Aktivieren Sie die Duet-KI-Features in BigQuery, die Sie für diese Anleitung benötigen:

    1. Klicken Sie in der Symbolleiste auf pen_spark Duet-KI, um Duet-KI-Features in BigQuery aufzurufen.

    2. Wählen Sie in der Liste Duet-KI im BigQuery-SQL-Editor alle folgenden Optionen aus:

      • Automatische Vervollständigung
      • Automatische Generierung
      • Erläuterung

    Wenn Sie Duet-KI-Features in BigQuery deaktivieren möchten, heben Sie die Auswahl der Duet-KI-Features auf, die Sie deaktivieren möchten.

Daten mit Duet-KI analysieren

Duet-KI kann Ihnen helfen zu wissen, auf welche Daten Sie für die Analyse zugreifen können und wie Sie diese Daten analysieren können.

Bevor Sie Daten abfragen können, müssen Sie wissen, auf welche Daten Sie zugreifen können. Jedes Datenprodukt organisiert und speichert Daten unterschiedlich. Um Hilfe zu erhalten, können Sie Duet-KI eine Erklärung in natürlicher Sprache (oder eine Aufforderung) senden, z. B. „Wie sehe ich mir an, welche Datasets und Tabellen in BigQuery zur Verfügung stehen?“

Wenn Sie die Eigenschaften verschiedener Datenabfragesysteme verstehen möchten, können Sie Duet-KI zur Eingabe bestimmter Produktinformationen wie den folgenden auffordern:

  • „Wie fange ich am besten mit BigQuery an?“
  • „Welche Vorteile bietet BigQuery für die Datenanalyse?“
  • „Wie geht BigQuery mit Autoscaling für Abfragen um?“

Duet-KI kann auch Informationen zur Analyse Ihrer Daten liefern. Für diese Art von Hilfe können Sie beispielsweise folgende Duet-KI-Aufforderungen senden:

  • „Wie erstelle ich in BigQuery ein Zeitreihenprognosemodell?“
  • „Wie lade ich verschiedene Datentypen in BigQuery?“

So bitten Sie Duet-KI, Fragen zu Ihren Daten zu beantworten:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie in der Symbolleiste der Google Cloud Console auf chat_spark Duet-KI öffnen.

  3. Geben Sie im Bereich Duet-KI eine Eingabeaufforderung wie How do I learn which datasets and tables are available to me in BigQuery? ein.

  4. Klicken Sie auf Senden Aufforderung senden.

    Duet AI verwendet Ihre Prompts oder seine Antworten nicht als Daten zum Trainieren seines Modells. Weitere Informationen finden Sie unter So nutzt Duet AI in Google Cloud Ihre Daten.

    Duet-KI gibt eine Antwort wie diese zurück:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Optional: Wenn Sie den Chatverlauf zurücksetzen möchten, klicken Sie im Bereich Duet-KI auf das Symbol Löschen und dann auf Chat zurücksetzen.

Mit Duet-KI SQL in BigQuery verstehen und schreiben

Duet-KI unterstützt Sie bei der Arbeit mit SQL. Wenn Sie beispielsweise mit SQL-Abfragen arbeiten, die andere geschrieben haben, kann Duet-KI in BigQuery eine komplexe Abfrage in einfachen Worten erklären. Solche Erläuterungen können Ihnen helfen, die Abfragesyntax, das zugrunde liegende Schema und den Geschäftskontext zu verstehen.

Duet-KI auffordern, SQL-Abfragen in einem Verkaufs-Dataset zu erklären

So fordern Sie Duet-KI auf, eine Beispiel-SQL-Abfrage zu erklären:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Öffnen im Query Editor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.

    Wenn Sie beispielsweise verstehen möchten, wie Datentabellen und Abfragen in einem Verkaufs-Dataset zusammenhängen, benötigen Sie Hilfe beim Schreiben von Abfragen, die das Dataset verwenden. In der folgenden Beispielabfrage sehen Sie vielleicht, welche Tabellen verwendet werden. Für andere Abschnitte der Abfrage benötigen Sie jedoch möglicherweise Zeit zum Parsen und Verständnis.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Markieren Sie die Abfrage, die Duet-KI erklären soll, und klicken Sie dann auf pen_spark Diese Abfrage erklären.

    Die SQL-Erläuterung wird im Bereich Duet AI angezeigt.

    Anhand der Beispielabfrage aus dem vorherigen Schritt gibt Duet-KI eine Erklärung ähnlich der folgenden zurück:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Eine SQL-Abfrage generieren, die Verkäufe nach Tag und Produkt gruppiert

Sie können Duet-KI eine Aufforderung zum Generieren einer SQL-Abfrage basierend auf dem Schema Ihrer Daten geben. Selbst wenn Sie ohne Code, mit begrenzten Kenntnissen des Datenschemas oder nur mit Grundkenntnissen in der SQL-Syntax beginnen, kann Duet-KI eine oder mehrere SQL-Anweisungen vorschlagen.

Im folgenden Beispiel generieren Sie eine Abfrage, mit der Ihre Top-Produkte für jeden Tag aufgelistet werden. Diese Art von Abfrage ist oft komplex, aber mit Duet-KI können Sie automatisch eine Anweisung erstellen. Anschließend verwenden Sie Tabellen im Dataset thelook_ecommerce und fordern Duet-KI auf, eine Abfrage zu generieren, mit der Verkäufe nach Bestellartikel und Produktname berechnet werden.

So fordern Sie Duet-KI auf, eine Abfrage zu generieren, in der Ihre Top-Produkte aufgelistet werden:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im Navigationsmenü auf BigQuery Studio.

  3. Klicken Sie auf Neue Abfrage erstellen. Die ausgewählte Datenbank wird automatisch im Bereich Explorer geladen.

  4. Geben Sie im Abfrageeditor die folgende Eingabeaufforderung ein und drücken Sie die Eingabetaste. Das Rautezeichen (#) fordert Duet-KI zum Generieren von SQL auf.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with products
    

    Duet AI schlägt eine SQL-Abfrage vor, die in etwa so aussieht:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Zum Übernehmen des vorgeschlagenen Codes klicken Sie auf die Tabulatortaste und dann auf Ausführen, um die SQL-Anweisung auszuführen. Sie können auch durch die vorgeschlagene SQL- Anweisung scrollen und bestimmte Wörter übernehmen.

  6. Sehen Sie sich im Bereich Abfrageergebnisse die Abfrageergebnisse an.

Prognosemodell erstellen und Ergebnisse ansehen

In diesem Abschnitt verwenden Sie BigQuery ML für Folgendes:

  • Verwenden Sie eine Trendabfrage, um ein Prognosemodell zu erstellen.
  • Verwenden Sie Duet-KI, um eine Abfrage zu erklären und zu schreiben, um die Ergebnisse des Prognosemodells anzusehen.

Sie verwenden die folgende Beispielabfrage mit tatsächlichen Verkäufen, die als Eingabe für das Modell verwendet werden. Die Abfrage wird beim Erstellen des ML-Modells verwendet.

  1. Führen Sie zum Erstellen eines ML-Prognosemodells im BigQuery-SQL-Editor den folgenden SQL-Code aus:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Sie können Duet-KI verwenden, um diese Abfrage zu verstehen.

    Wenn das Modell erstellt wurde, wird im Bereich Ergebnisse eine Meldung ähnlich der folgenden angezeigt:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Geben Sie im Bereich Duet-KI eine Eingabeaufforderung für Duet-KI ein, mit der Sie eine Abfrage schreiben können, um eine Prognose vom Modell zu erhalten, wenn es abgeschlossen ist. Geben Sie beispielsweise How can I get a forecast in SQL from the model? ein.

    Je nach Kontext des Prompts gibt Duet-KI ein Beispiel für ein ML-Modell zurück, das Verkäufe prognostiziert:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Kopieren Sie im Bereich Duet-KI die SQL-Abfrage.

  4. Fügen Sie die SQL-Abfrage im BigQuery-SQL-Editor ein und führen Sie sie dann aus.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie das für diese Anleitung erstellte Google Cloud-Projekt löschen. Alternativ haben Sie die Möglichkeit, die einzelnen Ressourcen zu löschen.

  1. Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Dataset löschen

Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt lieber wiederverwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen.

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Wählen Sie im Navigationsbereich das Dataset bqml_tutorial aus, das Sie erstellt haben.

  3. Klicken Sie auf Dataset löschen, um das Dataset, die Tabelle und alle Daten zu löschen.

  4. Geben Sie im Dialogfeld Dataset löschen den Namen des Datasets (bqml_tutorial) ein und klicken Sie auf Löschen, um das Löschen zu bestätigen.

Nächste Schritte