Mit BigQuery-Daten-Canvas analysieren

Wenn Sie Feedback geben oder Support für BigQuery Studio Data Canvas anfordern möchten, senden Sie eine E-Mail an datacanvas-feedback@google.com.

Mit dem Data Canvas von BigQuery Studio, einem Feature von Gemini in BigQuery, können Sie Daten mithilfe natürlicher Sprach-Prompts und einer grafischen Benutzeroberfläche für Analyse-Workflows Daten transformieren, abfragen und visualisieren.

Für Analyse-Workflows verwendet das BigQuery-Daten-Canvas einen gerichteten azyklischen Graphen (Directed Acyclic Graph, DAG), der eine grafische Ansicht Ihres Workflows bietet. Im BigQuery-Data-Canvas können Sie zentralisiert Abfrageergebnisse iterieren und mit mehreren Abfragezweigen arbeiten.

Der Daten-Canvas von BigQuery soll Ihnen dabei helfen, Daten in Einblicke zu verwandeln. Sie können mit Daten arbeiten, ohne technische Kenntnisse über bestimmte Tools oder Produkte zu benötigen. Der Daten-Canvas in BigQuery funktioniert mit Dataplex-Metadaten zur Identifizierung entsprechender Tabellen auf Basis natürlicher Sprache.

BigQuery-Daten-Canvas verwendet Gemini in BigQuery, um Ihre Daten zu suchen, SQL zu erstellen, Diagramme zu generieren und Datenzusammenfassungen auszugeben.

Informationen dazu, wie und wann Gemini für Google Cloud Ihre Daten verwendet.

Leistungsspektrum

Mit BigQuery Data Canvas können Sie Folgendes tun:

  • Verwenden Sie die Syntax für die Keyword-Suche zusammen mit Dataplex-Metadaten, um Assets wie Tabellen, Ansichten oder materialisierte Ansichten zu finden.

  • Verwenden Sie für grundlegende SQL-Abfragen wie die folgenden natürliche Sprache:

    • Abfragen, die FROM-Klauseln, mathematische Funktionen, Arrays und Structs enthalten.
    • JOIN-Vorgänge für zwei Tabellen.
  • Sie können Daten mithilfe der folgenden Grafiktypen visualisieren:

    • Balkendiagramm
    • Heatmap
    • Liniendiagramm
    • Kreisdiagramm
    • Streudiagramm
  • Erstellen Sie benutzerdefinierte Visualisierungen mit natürlicher Sprache, um Ihre gewünschten Ergebnisse zu beschreiben.

  • Datenstatistiken automatisieren.

Beschränkungen

  • Natural Language-Befehle funktionieren in folgenden Fällen möglicherweise nicht gut:

    • BigQuery ML
    • Apache Spark
    • Objekttabellen
    • BigLake
    • INFORMATION_SCHEMA Ansichten
    • JSON
    • Verschachtelte und wiederkehrende Felder
    • Komplexe Funktionen und Datentypen wie DATETIME und TIMEZONE
  • Datenvisualisierungen funktionieren nicht mit Geokartendiagrammen.

Hinweise

  1. Prüfen Sie, ob Gemini in BigQuery für Ihr Google Cloud-Projekt aktiviert ist. Ein Administrator führt diesen Schritt in der Regel aus.
  2. Sie benötigen die erforderliche IAM-Berechtigungen (Identity and Access Management), um den BigQuery-Daten-Canvas zu verwenden.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung von BigQuery-Daten-Canvas benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Weitere Informationen zu IAM-Rollen und Berechtigungen in BigQuery finden Sie unter Einführung in IAM.

BigQuery-Daten-Canvas verwenden

Sie können BigQuery-Data-Canvas in der Google Cloud Console, eine Abfrage oder eine Tabelle verwenden.

  1. Rufen Sie die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie auf Daten-Canvas erstellen.

    Symbol „Daten-Canvas erstellen“

  3. Geben Sie im Prompt-Feld Natural Language einen Prompt in natürlicher Sprache ein.

    Wenn Sie beispielsweise Find me tables related to trees eingeben, gibt der BigQuery-Daten-Canvas eine Liste möglicher Tabellen zurück, einschließlich öffentlicher Datasets wie bigquery-public-data.usfs_fia.plot_tree oder bigquery-public-data.new_york_trees.tree_species.

  4. Wählen Sie eine Tabelle aus.

    Ein Tabellenknoten für die ausgewählte Tabelle wird dem BigQuery-Daten-Canvas hinzugefügt. Wählen Sie die verschiedenen Tabs im Tabellenknoten aus, um Schemainformationen, Tabellendetails oder eine Vorschau der Daten aufzurufen.

Beispiel-Workflows ausprobieren

In diesem Abschnitt werden verschiedene Möglichkeiten zur Verwendung von BigQuery-Daten-Canvas in Analyse-Workflows gezeigt.

Beispielworkflow: Daten suchen, abfragen und visualisieren

In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Data-Canvas, um Daten zu suchen, eine Abfrage zu generieren und die Abfrage zu bearbeiten. Dann erstellen Sie ein Diagramm.

Prompt 1: Daten finden

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie auf Daten-Canvas erstellen.

    Symbol „Daten-Canvas erstellen“

  3. Geben Sie im Prompt-Feld Natural Language den folgenden Prompt in natürlicher Sprache ein:

    Chicago taxi trips
    

    Der BigQuery-Daten-Canvas generiert eine Liste potenzieller Tabellen anhand von Dataplex-Metadaten. Sie können mehrere Tabellen auswählen.

  4. Wählen Sie die Tabelle bigquery-public-data.chicago_taxi_trips.taxi_trips aus und klicken Sie dann auf Zum Canvas hinzufügen.

    Ein Tabellenknoten für taxi_trips wird dem BigQuery-Daten-Canvas hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.

Prompt 2: SQL-Abfrage in der ausgewählten Tabelle generieren

Um eine SQL-Abfrage für den bigquery-public-data.chicago_taxi_trips.taxi_trips zu erstellen, gehen Sie so vor:

  1. Klicken Sie im Daten-Canvas auf Abfrage.

  2. Geben Sie im Prompt-Feld Natural Language Folgendes ein:

    Get me the 100 longest trips
    

    Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;
    

Aufforderung 3: Abfrage bearbeiten

Um die generierte Abfrage zu bearbeiten, können Sie die Abfrage manuell bearbeiten oder die Eingabeaufforderung in natürlicher Sprache ändern und die Abfrage neu generieren. In diesem Beispiel verwenden Sie einen Prompt in natürlicher Sprache, um die Abfrage so zu bearbeiten, dass nur Fahrten ausgewählt werden, bei denen der Kunde bar bezahlt hat.

  1. Geben Sie im Prompt-Feld Natural Language Folgendes ein:

    Get me the 100 longest trips where the payment type is cash
    

    Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;
    

    Im vorherigen Beispiel ist PROJECT_ID die ID Ihres Google Cloud-Projekts.

  2. Klicken Sie auf Ausführen, um sich die Ergebnisse der Abfrage anzusehen.

Diagramme erstellen

  1. Klicken Sie im Daten-Canvas auf Visualisieren.
  2. Klicken Sie auf Balkendiagramm erstellen.

    Der BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das die Fahrten mit den meisten gefahrenen Kilometer nach Fahrt-ID anzeigt. Neben der Bereitstellung eines Diagramms fasst BigQuery-Daten-Canvas einige der wichtigsten Details der Daten zusammen, die der Visualisierung zugrunde liegen.

  3. Optional: Führen Sie einen oder mehrere der folgenden Schritte aus:

    • Klicken Sie zum Ändern des Diagramms auf Bearbeiten und bearbeiten Sie dann das Diagramm im Bereich Visualisierung bearbeiten.
    • Klicken Sie zum Freigeben des Daten-Canvas auf Freigeben und dann auf Link freigeben, um den BigQuery-Data-Canvas-Link zu kopieren.
    • Wählen Sie zum Bereinigen des Daten-Canvas more_vert Weitere Aktionen und dann more_vert Canvas löschen aus. 3}. Mit diesem Schritt wird ein leerer Canvas angezeigt.

Beispielworkflow: Tabellen zusammenführen

In diesem Beispiel verwenden Sie Aufforderungen in natürlicher Sprache im BigQuery-Data-Canvas, um Daten zu suchen und Tabellen zusammenzuführen. Anschließend exportieren Sie eine Abfrage als Notebook.

Prompt 1: Daten finden

  1. Geben Sie im Prompt-Feld Natural Language den folgenden Prompt ein:

    Information about trees
    

    Im BigQuery-Daten-Canvas werden mehrere Tabellen mit Informationen zu Bäumen vorgeschlagen.

  2. Wählen Sie für dieses Beispiel die Tabelle bigquery-public-data.new_york_trees.tree_census_1995 aus und klicken Sie auf Zum Canvas hinzufügen.

    Die Tabelle wird auf dem Canvas angezeigt.

Prompt 2: Tabellen unter ihrer Adresse zusammenführen

  1. Klicken Sie im Daten-Canvas auf Zusammenführen.

    BigQuery-Daten-Canvas schlägt Tabellen vor, die zusammengeführt werden könnten.

  2. Klicken Sie zum Öffnen eines neuen Eingabefelds für Natürliche Sprache auf Nach Tabellen suchen.

  3. Geben Sie im Prompt-Feld Natural Language den folgenden Prompt ein:

    Information about trees
    
  4. Wählen Sie die Tabelle bigquery-public-data.new_york_trees.tree_census_2005 aus und klicken Sie auf Zum Canvas hinzufügen.

    Die Tabelle wird auf dem Canvas angezeigt.

  5. Klicken Sie im Daten-Canvas auf Zusammenführen.

  6. Klicken Sie im Bereich In diesem Canvas das Kästchen Tabellenzelle an und klicken Sie dann auf OK.

  7. Geben Sie im Prompt-Feld Natural Language den folgenden Prompt ein:

    Join on address
    

    BigQuery-Daten-Canvas schlägt eine SQL-Abfrage vor, um diese beiden Tabellen anhand ihrer Adresse zusammenzuführen.

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
    
  8. Klicken Sie auf Ausführen, um die Abfrage auszuführen und die Ergebnisse aufzurufen.

Abfrage als Notebook exportieren

Mit BigQuery-Daten-Canvas können Sie Ihre Abfragen als Notebook exportieren.

  1. Klicken Sie im Daten-Canvas auf Als Notebook exportieren.
  2. Geben Sie im Bereich Notebook speichern den Namen des Notebooks und die Region ein, in der Sie es speichern möchten.
  3. Klicken Sie auf Speichern. Das Notebook wurde erstellt.
  4. Optional: Klicken Sie auf Öffnen, um das erstellte Notebook aufzurufen.

Beispielworkflow: Diagramm mithilfe einer Eingabeaufforderung bearbeiten

In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Data-Canvas, um Daten zu suchen, abzufragen und zu filtern sowie Visualisierungsdetails zu bearbeiten.

Prompt 1: Daten finden

  1. Geben Sie den folgenden Prompt ein, um Daten zu US-Namen zu finden:

    Find data about USA names
    

    Mit dem BigQuery-Daten-Canvas wird eine Liste von Tabellen generiert.

  2. Wählen Sie für dieses Beispiel die Tabelle bigquery-public-data.usa_names.usa_1910_current aus und klicken Sie dann auf Zu Canvas hinzufügen.

Prompt 2: Daten abfragen

  1. Klicken Sie zum Abfragen der Daten im Daten-Canvas auf Abfrage und geben Sie die folgende Eingabeaufforderung ein:

    Summarize this data
    

    Mit dem BigQuery-Daten-Canvas wird eine Abfrage wie die folgende generiert:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
    
  2. Klicken Sie auf Ausführen. Die Abfrageergebnisse werden angezeigt.

Prompt 3: Daten filtern

  1. Klicken Sie im Daten-Canvas auf Diese Ergebnisse abfragen.
  2. Geben Sie zum Filtern der Daten im Feld der Eingabeaufforderung SQL den folgenden Prompt ein:

    Get me the top 10 most popular names in 1980
    

    Mit dem BigQuery-Daten-Canvas wird eine Abfrage wie die folgende generiert:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;
    

    Wenn Sie die Abfrage ausführen, erhalten Sie eine Tabelle mit den zehn häufigsten Namen von Kindern, die 1980 geboren wurden.

Diagramm erstellen und bearbeiten

  1. Klicken Sie im Daten-Canvas auf Visualisieren.

    Im BigQuery-Daten-Canvas werden verschiedene Visualisierungsoptionen vorgeschlagen (Balkendiagramm, Kreisdiagramm, Liniendiagramm, benutzerdefinierte Visualisierung usw.).

  2. Klicken Sie für dieses Beispiel auf Balkendiagramm erstellen.

    Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

    Balkendiagramm mit den Top-Ten-Namen.

Neben der Bereitstellung eines Diagramms fasst BigQuery-Daten-Canvas einige der wichtigsten Details der Daten zusammen, die der Visualisierung zugrunde liegen. Um das Diagramm anzupassen, klicken Sie auf Visualisierungsdetails und bearbeiten das Diagramm in der Seitenleiste.

Prompt 4: Visualisierungsdetails bearbeiten

  1. Geben Sie im Prompt-Feld Visualisierung Folgendes ein:

    Create a bar chart sorted high to low, with a gradient
    

    Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

    Balkendiagramm mit den Top-10-Namen, sortiert.

  2. Optional: Wenn Sie weitere Änderungen vornehmen möchten, klicken Sie auf Bearbeiten.

    Der Bereich Visualisierung bearbeiten wird angezeigt. Sie können Details wie den Diagrammtitel, den Namen der X-Achse und der Y-Achse bearbeiten. Wenn Sie auf den Tab JSON-Editor klicken, können Sie das Diagramm auch direkt anhand der JSON-Werte bearbeiten.

Preise

Die Abrechnung erfolgt nach dem computing- oder speicherbasierten Preismodell, wenn Sie mit BigQuery-Daten-Canvas arbeiten. Für die Verwendung von Gemini mit BigQuery-Data-Canvas während der Vorschau fallen keine zusätzlichen Gebühren an.

Feedback geben

Um dazu beitragen, die Vorschläge im BigQuery-Data Canvas zu verbessern, senden Sie Ihr Feedback an Google. So geben Sie Feedback:

  1. Klicken Sie in der Symbolleiste der Google Cloud Console auf Feedback geben.

  2. Optional: Klicken Sie auf Kopieren, um die DAG-JSON-Informationen zu kopieren, um zusätzlichen Kontext für Ihr Feedback bereitzustellen.

  3. Klicken Sie auf Formular, um das Formular auszufüllen und Feedback zu geben.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud Trusted Tester-Programm.

Wenn Sie direktes Feedback zu dieser Funktion geben möchten, können Sie auch eine E-Mail an datacanvas-feedback@google.com senden.

Nächste Schritte