Mit BigQuery Data Canvas analysieren

Mit dem Data Canvas von BigQuery Studio, einem Feature von Gemini in BigQuery, können Sie Daten mithilfe natürlicher Sprach-Prompts und einer grafischen Benutzeroberfläche für Analyse-Workflows Daten transformieren, abfragen und visualisieren.

Für Analyse-Workflows verwendet BigQuery Data Canvas einen gerichteten azyklischen Graphen (Directed Acyclic Graph, DAG), der eine grafische Ansicht des Workflows bietet. Im BigQuery-Data-Canvas können Sie zentralisiert Abfrageergebnisse iterieren und mit mehreren Abfragezweigen arbeiten.

Der Daten-Canvas von BigQuery soll Analyseaufgaben beschleunigen und Datenexperten wie Datenanalysten, Dateningenieure und andere dabei unterstützen, Daten in Erkenntnisse umzuwandeln. Sie benötigen keine technischen Kenntnisse zu bestimmten Tools, sondern nur grundlegende Kenntnisse zum Lesen und Schreiben von SQL. Der Daten-Canvas in BigQuery funktioniert mit Dataplex-Metadaten zur Identifizierung entsprechender Tabellen auf Basis natürlicher Sprache.

Das BigQuery-Daten-Canvas ist nicht für die direkte Verwendung durch Geschäftsnutzer gedacht.

BigQuery-Daten-Canvas verwendet Gemini in BigQuery, um Ihre Daten zu suchen, SQL zu erstellen, Diagramme zu generieren und Datenzusammenfassungen auszugeben.

Weitere Informationen dazu, wie und wann Gemini for Google Cloud Ihre Daten verwendet

Leistungsspektrum

Mit BigQuery-Daten-Canvas haben Sie folgende Möglichkeiten:

  • Verwenden Sie Suchanfragen in natürlicher Sprache oder die Syntax für die Keyword-Suche mit Dataplex-Metadaten, um Assets wie Tabellen, Ansichten oder materialisierte Ansichten zu finden.

  • Verwenden Sie natürliche Sprache für grundlegende SQL-Abfragen wie die folgenden:

    • Abfragen mit FROM-Klauseln, mathematischen Funktionen, Arrays und Strukturen
    • JOIN-Vorgänge für zwei Tabellen.
  • Sie können Daten mithilfe der folgenden Grafiktypen visualisieren:

    • Balkendiagramm
    • Heatmap
    • Liniendiagramm
    • Kreisdiagramm
    • Streudiagramm
  • Sie können benutzerdefinierte Visualisierungen erstellen, indem Sie Ihre Anforderungen in natürlicher Sprache beschreiben.

  • Automatische Datenerkenntnisse

Beschränkungen

  • Befehle in natürlicher Sprache funktionieren möglicherweise nicht gut mit folgenden Elementen:

    • BigQuery ML
    • Apache Spark
    • Objekttabellen
    • BigLake
    • INFORMATION_SCHEMA Ansichten
    • JSON
    • Verschachtelte und wiederkehrende Felder
    • Komplexe Funktionen und Datentypen wie DATETIME und TIMEZONE
  • Datenvisualisierungen funktionieren nicht mit Geokartendiagrammen.

Best Practices für Prompts

Mit den richtigen Prompt-Techniken können Sie komplexe SQL-Abfragen generieren. Mit den folgenden Vorschlägen können Sie im BigQuery-Data Canvas Ihre Prompts in natürlicher Sprache optimieren, um die Genauigkeit Ihrer Abfragen zu erhöhen:

  • Schreiben Sie klar und verständlich. Formulieren Sie Ihre Anfrage klar und vermeiden Sie Unklarheiten.

  • Stellen Sie direkte Fragen. Die genauesten Antworten erhalten Sie, wenn Sie jeweils nur eine Frage stellen und Ihre Prompts prägnant formulieren. Trennen Sie Ihre Prompts bei Bedarf in verschiedene Knoten im BigQuery-Daten-Canvas.

  • Geben Sie klare und eindeutige Anweisungen. Heben Sie wichtige Begriffe in Ihren Prompts hervor.

  • Geben Sie die Operatorrangfolge an. Geben Sie die Anleitung klar und geordnet an. Aufgaben in kleine, fokussierte Schritte unterteilen

  • Optimieren und iterieren. Probieren Sie verschiedene Formulierungen und Ansätze aus, um herauszufinden, was die besten Ergebnisse erzielt.

Weitere Informationen finden Sie unter Best Practices für Prompts für BigQuery-Datenpläne.

Hinweise

  1. Achten Sie darauf, dass Gemini in BigQuery für Ihr Google Cloud-Projekt aktiviert ist. Dieser Schritt wird in der Regel von einem Administrator ausgeführt.
  2. Sie benötigen die erforderliche IAM-Berechtigungen (Identity and Access Management), um den BigQuery-Daten-Canvas zu verwenden.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung von BigQuery-Daten-Canvas benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Weitere Informationen zu IAM-Rollen und Berechtigungen in BigQuery finden Sie unter Einführung in IAM.

BigQuery-Daten-Canvas verwenden

Sie können BigQuery-Datenpläne in der Google Cloud Console, in einer Abfrage oder in einer Tabelle verwenden.

  1. Rufen Sie die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im Abfrageeditor neben SQL-Abfrage auf Neu erstellen und dann auf Datenplakat.

    Symbol „Daten-Canvas erstellen“

  3. Geben Sie im Feld Natürliche Sprache einen Prompt in natürlicher Sprache ein.

    Wenn Sie beispielsweise Find me tables related to trees eingeben, gibt das BigQuery-Daten-Canvas eine Liste möglicher Tabellen zurück, einschließlich öffentlicher Datasets wie bigquery-public-data.usfs_fia.plot_tree oder bigquery-public-data.new_york_trees.tree_species.

  4. Wählen Sie eine Tabelle aus.

    Dem BigQuery-Daten-Canvas wird ein Tabellenknoten für die ausgewählte Tabelle hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.

Beispiel-Workflows ausprobieren

In diesem Abschnitt werden verschiedene Möglichkeiten zur Verwendung des BigQuery-Datencanvas in Analyseworkflows veranschaulicht.

Beispiel für einen Workflow: Daten suchen, abfragen und visualisieren

In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu finden, eine Abfrage zu generieren und die Abfrage zu bearbeiten. Anschließend erstellen Sie ein Diagramm.

Prompt 1: Daten finden

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie im Abfrageeditor neben SQL-Abfrage auf Neu erstellen und dann auf Datenplakat.

    Symbol „Daten-Canvas erstellen“

  3. Geben Sie im Feld Natürliche Sprache den folgenden Natural Language Prompt ein:

    Chicago taxi trips
    

    Der BigQuery-Daten-Canvas generiert eine Liste potenzieller Tabellen anhand von Dataplex-Metadaten. Sie können mehrere Tabellen auswählen.

  4. Wählen Sie die Tabelle bigquery-public-data.chicago_taxi_trips.taxi_trips aus und klicken Sie dann auf Zum Canvas hinzufügen.

    Dem BigQuery-Daten-Canvas wird ein Tabellenknoten für taxi_trips hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.

Prompt 2: SQL-Abfrage in der ausgewählten Tabelle generieren

Um eine SQL-Abfrage für den bigquery-public-data.chicago_taxi_trips.taxi_trips zu erstellen, gehen Sie so vor:

  1. Klicken Sie im Daten-Canvas auf Abfrage.

  2. Geben Sie im Prompt-Feld Natürliche Sprache Folgendes ein:

    Get me the 100 longest trips
    

    Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Prompt 3: Abfrage bearbeiten

Sie können die generierte Abfrage manuell bearbeiten oder die Eingabeaufforderung in natürlicher Sprache ändern und die Abfrage neu generieren. In diesem Beispiel bearbeiten Sie die Abfrage mit einem Prompt in natürlicher Sprache, um nur Fahrten auszuwählen, bei denen der Kunde bar bezahlt hat.

  1. Geben Sie im Prompt-Feld Natürliche Sprache Folgendes ein:

    Get me the 100 longest trips where the payment type is cash
    

    Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Im vorherigen Beispiel ist PROJECT_ID die ID Ihres Google Cloud-Projekts.

  2. Klicken Sie auf Ausführen, um die Ergebnisse der Abfrage aufzurufen.

Diagramme erstellen

  1. Klicken Sie im Daten-Canvas auf Visualisieren.
  2. Klicken Sie auf Balkendiagramm erstellen.

    Der BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das die Fahrten mit den meisten gefahrenen Kilometer nach Fahrt-ID anzeigt. Neben einem Diagramm werden in BigQuery Data Canvas einige der wichtigsten Details der Daten zusammengefasst, die der Visualisierung zugrunde liegen.

  3. Optional: Führen Sie eine oder mehrere der folgenden Aktionen aus:

    • Klicken Sie zum Ändern des Diagramms auf Bearbeiten und bearbeiten Sie dann das Diagramm im Bereich Visualisierung bearbeiten.
    • Wenn Sie das Daten-Canvas freigeben möchten, klicken Sie auf Freigeben und dann auf Link freigeben, um den BigQuery-Daten-Canvas-Link zu kopieren.
    • Wählen Sie zum Bereinigen des Daten-Canvas Weitere Aktionen und dann Canvas löschen aus. Dadurch wird ein leeres Canvas erstellt.

Beispiel für einen Workflow: Tabellen zusammenführen

In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu finden und Tabellen zusammenzuführen. Anschließend exportieren Sie eine Abfrage als Notebook.

Prompt 1: Daten finden

  1. Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:

    Information about trees
    

    Das BigQuery-Daten-Canvas schlägt mehrere Tabellen mit Informationen zu Bäumen vor.

  2. Wählen Sie in diesem Beispiel die Tabelle bigquery-public-data.new_york_trees.tree_census_1995 aus und klicken Sie dann auf Zum Canvas hinzufügen.

    Die Tabelle wird auf dem Canvas angezeigt.

Prompt 2: Tabellen unter ihrer Adresse zusammenführen

  1. Klicken Sie im Daten-Canvas auf Join (Zusammenführen).

    BigQuery-Daten-Canvas schlägt Tabellen vor, die zusammengeführt werden könnten.

  2. Wenn Sie ein neues Prompt-Feld für natürliche Sprache öffnen möchten, klicken Sie auf Nach Tabellen suchen.

  3. Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:

    Information about trees
    
  4. Wählen Sie die Tabelle bigquery-public-data.new_york_trees.tree_census_2005 aus und klicken Sie dann auf Zum Canvas hinzufügen.

    Die Tabelle wird auf dem Canvas angezeigt.

  5. Klicken Sie im Daten-Canvas auf Join (Zusammenführen).

  6. Klicken Sie im Bereich Auf diesem Canvas das Kästchen Tabellenzelle an und klicken Sie dann auf OK.

  7. Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:

    Join on address
    

    BigQuery-Daten-Canvas schlägt eine SQL-Abfrage vor, um diese beiden Tabellen anhand ihrer Adresse zusammenzuführen.

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Klicken Sie auf Ausführen, um die Abfrage auszuführen und die Ergebnisse anzusehen.

Abfrage als Notebook exportieren

Mit BigQuery-Daten-Canvas können Sie Ihre Abfragen als Notebook exportieren.

  1. Klicken Sie im Daten-Canvas auf Als Notebook exportieren.
  2. Geben Sie im Bereich Notebook speichern den Namen des Notebooks und die Region ein, in der Sie es speichern möchten.
  3. Klicken Sie auf Speichern. Das Notebook wird erstellt.
  4. Optional: Klicken Sie auf Öffnen, um das erstellte Notizbuch aufzurufen.

Beispiel für einen Workflow: Diagramm mithilfe eines Prompts bearbeiten

In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu suchen, abzufragen und zu filtern und dann die Details der Visualisierung zu bearbeiten.

Prompt 1: Daten finden

  1. Wenn Sie Daten zu US-Namen finden möchten, geben Sie Folgendes ein:

    Find data about USA names
    

    Mit dem BigQuery-Daten-Canvas wird eine Liste von Tabellen generiert.

  2. Wählen Sie in diesem Beispiel die Tabelle bigquery-public-data.usa_names.usa_1910_current aus und klicken Sie dann auf Zum Canvas hinzufügen.

Prompt 2: Daten abfragen

  1. Klicken Sie im Daten-Canvas auf Abfrage und geben Sie dann den folgenden Prompt ein:

    Summarize this data
    

    Das BigQuery-Daten-Canvas generiert eine Abfrage, die etwa so aussieht:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Klicken Sie auf Ausführen. Die Abfrageergebnisse werden angezeigt.

Prompt 3: Daten filtern

  1. Klicken Sie im Daten-Canvas auf Diese Ergebnisse abfragen.
  2. Geben Sie im Prompt-Feld SQL den folgenden Prompt ein, um die Daten zu filtern:

    Get me the top 10 most popular names in 1980
    

    Das BigQuery-Daten-Canvas generiert eine Abfrage, die etwa so aussieht:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Wenn Sie die Abfrage ausführen, erhalten Sie eine Tabelle mit den zehn häufigsten Namen von Kindern, die 1980 geboren wurden.

Diagramme erstellen und bearbeiten

  1. Klicken Sie im Daten-Canvas auf Visualisieren.

    Im BigQuery-Daten-Canvas werden verschiedene Visualisierungsoptionen vorgeschlagen (Balkendiagramm, Kreisdiagramm, Liniendiagramm, benutzerdefinierte Visualisierung usw.).

  2. Klicken Sie in diesem Beispiel auf Balkendiagramm erstellen.

    Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

    Balkendiagramm mit den Top-10-Namen.

Neben einem Diagramm enthält der BigQuery-Daten-Canvas einige der wichtigsten Details zu den Daten, die der Visualisierung zugrunde liegen. Um das Diagramm anzupassen, klicken Sie auf Visualisierungsdetails und bearbeiten das Diagramm in der Seitenleiste.

Prompt 4: Visualisierungsdetails bearbeiten

  1. Geben Sie im Prompt-Feld Visualisierung Folgendes ein:

    Create a bar chart sorted high to low, with a gradient
    

    Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

    Balkendiagramm mit den Top-10-Namen, sortiert.

  2. Optional: Wenn Sie weitere Änderungen vornehmen möchten, klicken Sie auf Bearbeiten.

    Der Bereich Visualisierung bearbeiten wird angezeigt. Sie können Details wie den Diagrammtitel, den Namen der X-Achse und den Namen der Y-Achse bearbeiten. Wenn Sie auf den Tab JSON-Editor klicken, können Sie außerdem basierend auf den JSON-Werten direkt Änderungen am Diagramm vornehmen.

Alle Daten-Canvasse ansehen

So rufen Sie eine Liste aller Datenkanäle in Ihrem Projekt auf:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie im Bereich Explorer neben Datenpräsentationen auf Aktionen anzeigen und führen Sie einen der folgenden Schritte aus:

  • Wenn Sie die Liste im aktuellen Tab öffnen möchten, klicken Sie auf Alle anzeigen.
  • Wenn Sie die Liste in einem neuen Tab öffnen möchten, klicken Sie auf Alle anzeigen in > Neuer Tab.
  • Wenn Sie die Liste in einem geteilten Tab öffnen möchten, klicken Sie auf Alle anzeigen in > Tab aufteilen.

Metadaten für Daten-Canvas ansehen

So rufen Sie die Metadaten des Datencanvas auf:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, für den Sie Metadaten aufrufen möchten.

  3. Im Bereich Zusammenfassung finden Sie Informationen zum Datencanvas, z. B. die verwendete Region und das Datum der letzten Änderung.

Mit Daten-Canvas-Versionen arbeiten

Sie können Versionen eines Datencanvas aufrufen, vergleichen und wiederherstellen.

Daten-Canvas-Versionen ansehen und vergleichen

So rufen Sie verschiedene Versionen eines Datencanvas auf und vergleichen sie mit der aktuellen Version:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, für den Sie die Aktivitäten aufrufen möchten.

  3. Klicken Sie auf den Tab Aktivität, um eine Liste der Data Canvas-Versionen in absteigender Reihenfolge nach Datum aufzurufen.

  4. Klicken Sie neben einer Data Canvas-Version auf Aktionen ansehen und dann auf Vergleichen. Der Vergleichsbereich wird geöffnet und die ausgewählte Data Canvas-Version wird mit der aktuellen Data Canvas-Version verglichen.

  5. Optional: Wenn Sie die Versionen inline und nicht in separaten Bereichen vergleichen möchten, klicken Sie auf Vergleichen und dann auf Inline.

Daten-Canvas-Version wiederherstellen

Verwenden Sie eine der folgenden Optionen, um eine Datencanvas-Version wiederherzustellen. Wenn Sie über den Vergleichsbereich wiederherstellen, können Sie die vorherige Version des Datencanvas mit der aktuellen Version vergleichen, bevor Sie entscheiden, ob Sie sie wiederherstellen möchten.

Aktivitätsbereich

  1. Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, von dem Sie eine vorherige Version wiederherstellen möchten.
  2. Wählen Sie den Bereich Aktivität aus.
  3. Klicken Sie neben der Version des Datencanvas, die Sie wiederherstellen möchten, auf Aktionen ansehen und dann auf Wiederherstellen.
  4. Klicken Sie auf Bestätigen, um die Aktion zu bestätigen.

Vergleichsbereich

  1. Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, von dem Sie eine vorherige Version wiederherstellen möchten.
  2. Wählen Sie den Bereich Aktivität aus.
  3. Klicken Sie neben einer Data Canvas-Version auf Aktionen ansehen und dann auf Vergleichen. Der Vergleichsbereich wird geöffnet und die ausgewählte Data Canvas-Version wird mit der neuesten Data Canvas-Version verglichen.
  4. Wenn Sie nach dem Vergleich die vorherige Data Canvas-Version wiederherstellen möchten, klicken Sie auf Wiederherstellen.
  5. Klicken Sie auf Bestätigen, um die Aktion zu bestätigen.

Preise

Weitere Informationen zu den Preisen für diese Funktion finden Sie unter Preisübersicht für Gemini in BigQuery.

Kontingente und Limits

Informationen zu Kontingenten und Limits für diese Funktion finden Sie unter Kontingente für Gemini in BigQuery.

Feedback geben

Um dazu beitragen, die Vorschläge im BigQuery-Data Canvas zu verbessern, senden Sie Ihr Feedback an Google. So geben Sie Feedback:

  1. Klicken Sie in der Symbolleiste der Google Cloud Console auf Feedback senden.

  2. Optional: Wenn Sie die DAG-JSON-Informationen kopieren möchten, um Ihrem Feedback zusätzlichen Kontext zu verleihen, klicken Sie auf Kopieren.

  3. Klicken Sie auf das Formular, um es auszufüllen und Feedback zu geben.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud Trusted Tester-Programm.

Wenn Sie direkt Feedback zu dieser Funktion geben möchten, können Sie sich auch an datacanvas-feedback@google.com wenden.

Nächste Schritte