Mit Data Canvas analysieren

Wenn Sie Feedback geben oder Support für BigQuery Data Canvas anfordern möchten, senden Sie eine E-Mail an datacanvas-feedback@google.com.

Mit dem BigQuery-Daten-Canvas können Sie Daten über natürliche Sprache ermitteln, transformieren, abfragen und visualisieren. Der BigQuery-Data-Canvas bietet eine grafische Oberfläche für Ihre Analysen, über die Sie mit Datenquellen, Abfragen und Visualisierungen in einem gerichteten azyklischen Graphen (Directed Acyclic Graph, DAG) arbeiten können. Sie erhalten so einen grafische Ansicht des Analyse-Workflows, die Ihrem geistigen Modell zugeordnet ist. Im BigQuery-Data-Canvas können Sie zentralisiert Abfrageergebnisse iterieren und mit mehreren Abfragezweigen arbeiten.

Der Daten-Canvas von BigQuery soll Ihnen dabei helfen, Daten in Einblicke zu verwandeln. Sie können mit Daten arbeiten, ohne technische Kenntnisse über bestimmte Tools oder Produkte zu benötigen. BigQuery-Daten-Canvas arbeitet mit Dataplex-Metadaten, um geeignete Tabellen basierend auf natürlicher Sprache zu identifizieren.

BigQuery-Daten-Canvas verwendet Gemini, um Ihre Daten zu suchen, SQL zu erstellen, Diagramme zu generieren und Datenzusammenfassungen auszugeben.

Leistungsspektrum

BigQuery-Daten-Canvas unterstützt die folgenden Funktionen:

  • Tabellen-Assets mithilfe der Syntax für die Keyword-Suche mit Dataplex-Metadaten wie Tabellen, Ansichten oder materialisierten Ansichten finden.

  • Natürliche Sprache für einfache SQL-Abfragen nutzen, zum Beispiel:

    • Abfragen mit SELECT FROM, mathematischen Funktionen, Arrays und Structs
    • JOIN-Anweisungen zwischen zwei Tabellen
  • Gängige Visualisierungen, einschließlich der folgenden Diagrammtypen:

    • Balkendiagramm
    • Heatmap
    • Liniendiagramm
    • Kreisdiagramm
    • Streudiagramm
  • Benutzerdefinierte Visualisierungen, in denen Sie mit natürlicher Sprache beschreiben können, was Sie möchten.

  • Automatisierte Dateneinblicke.

Für BigQuery-Daten-Canvas gelten die folgenden Einschränkungen:

  • Befehle in natürlicher Sprache können bei der Arbeit mit folgenden Elementen Probleme haben:

    • BigQuery ML
    • Apache Spark
    • Objekttabellen
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • Verschachtelte und wiederkehrende Felder
    • Komplexe Funktionen und Datentypen wie DATETIME und TIMEZONE
  • Datenvisualisierungen funktionieren nicht mit Geokartendiagrammen.

Hinweise

Damit von BigQuery-Features aus auf Gemini zugegriffen werden kann, muss ein Administrator Gemini in BigQuery aktivieren. Weitere Informationen finden Sie unter Gemini in BigQuery einrichten.

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung von BigQuery-Daten-Canvas benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Mit dem BigQuery-Daten-Canvas arbeiten

Mit dem BigQuery-Daten-Canvas können Sie Daten mithilfe eines direkten, auf natürlicher Sprache basierenden Ansatzes ermitteln, transformieren, abfragen und visualisieren. Die folgenden Beispiele zeigen einige Möglichkeiten, wie Sie mit dem BigQuery-Daten-Canvas interagieren können, darunter ein Beispielworkflow von der Datenerkennung bis zur Visualisierung.

So beginnen Sie mit der Arbeit mit dem BigQuery-Daten-Canvas:

  1. Öffnen Sie die Google Cloud Console.

    BigQuery aufrufen

  2. Klicken Sie im Navigationsmenü auf BigQuery Studio.

  3. Klicken Sie auf Daten-Canvas erstellen. Sie können das BigQuery-Daten-Canvas auch direkt über eine Tabelle oder eine Abfrage starten.

  4. Geben Sie Ihren ersten Prompt in natürlicher Sprache in das Textfeld ein.

Beispiele

Die folgenden Beispiele veranschaulichen einen typischen BigQuery-Daten-Canvas-Workflow.

Beispiel 1: Mit einer einzelnen Tabelle arbeiten

Prompt 1: Daten finden

Chicago taxi trips

Potenzielles Ergebnis:

Der BigQuery-Daten-Canvas generiert eine Liste potenzieller Tabellen anhand von Dataplex-Metadaten. Sie können mehrere Tabellen auswählen. Die einzelnen Tabellen bieten die Optionen Zum Canvas hinzufügen, Abfrage und Details. In diesem Beispiel wählen wir die Tabelle bigquery-public-data.chicago_taxi_trips.taxi_trips aus und klicken auf Zu Canvas hinzufügen.

Im BigQuery-Daten-Canvas wird eine Tabellenzelle für taxi_trips hinzugefügt. Sie können die Tabs in der Tabellenzelle durchsuchen, um Schemainformationen, Tabellendetails und eine Vorschau der Daten einzusehen.

Klicken Sie auf Abfrage, um diese Tabelle mit natürlicher Sprache abzufragen.

Prompt 2: SQL-Abfrage mit der ausgewählten Tabelle erstellen

Get me the 100 longest trips

Potenzielles Ergebnis:

Mit dem BigQuery-Daten-Canvas wird eine SQL-Abfrage generiert, die etwa so aussieht:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Um die Abfrage zu bearbeiten, können Sie entweder die SQL-Abfrage manuell anpassen oder die Eingabeaufforderung in natürlicher Sprache ändern und die Abfrage neu generieren. In diesem Beispiel ändern wir die Aufforderung in natürlicher Sprache so, dass nur Fahrten ausgewählt werden, bei denen der Kunde bar bezahlt hat.

Prompt 3: Abfrage durch Ändern der Prompts bearbeiten

Get me the 100 longest trips where the payment type is cash

Potenzielles Ergebnis

Mit dem BigQuery-Daten-Canvas wird eine SQL-Abfrage generiert, die etwa so aussieht:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Klicken Sie auf Ausführen, um die Ergebnisse der Abfrage aufzurufen.

Prompt 4: Diagramm erstellen

  1. Klicken Sie auf Visualisieren.
  2. Klicken Sie auf Balkendiagramm erstellen.

Potenzielles Ergebnis

Der BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das die Fahrten mit den meisten gefahrenen Kilometer nach Fahrt-ID anzeigt.

Neben der Bereitstellung eines Diagramms fasst BigQuery-Daten-Canvas einige der wichtigsten Details der Daten zusammen, die der Visualisierung zugrunde liegen. Um das Diagramm anzupassen, klicken Sie auf Visualisierungsdetails und bearbeiten das Diagramm in der Seitenleiste.

Wenn Sie ein BigQuery-Daten-Canvas freigeben möchten, klicken Sie auf Freigeben und dann auf Link freigeben, um den BigQuery-Daten-Canvas-Link zu kopieren.

Klicken Sie zum Bereinigen eines BigQuery-Daten-Canvas auf Canvas löschen. So bleibt ein leerer Canvas.

Beispiel 2: Mit mehreren Tabellen arbeiten

Prompt 1:

Information about trees

Potenzielles Ergebnis:

Im BigQuery-Daten-Canvas werden mehrere Tabellen mit Informationen zu Bäumen vorgeschlagen. In diesem Beispiel arbeiten wir mit zwei Tabellen: bigquery-public-data.new_york_trees.tree_census_1995 und bigquery-public-data.new_york_trees.tree_census_2015.

Nachdem Sie beide Tabellen ausgewählt haben, werden sie auf dem Canvas angezeigt.

In diesem Beispiel klicken Sie in der Tabelle bigquery-public-data.new_york_trees.tree_census_1995 auf Zusammenführen, um die beiden Tabellen zusammenzuführen. BigQuery-Daten-Canvas schlägt Tabellen vor, die zusammengeführt werden könnten. Wählen Sie die Datei bigquery-public-data.new_york_trees.tree_census_2015. Ein neuer Bereich mit Verbindungen zu den einzelnen Tabellen wird angezeigt.

Aufforderung 2:

Join these tables on their address

Potenzielles Ergebnis

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

BigQuery-Daten-Canvas schlägt eine SQL-Abfrage vor, um diese beiden Tabellen anhand ihrer Adresse zusammenzuführen. Klicken Sie auf Ausführen, um die Abfrage auszuführen und die Ergebnisse anzusehen.

Mit BigQuery-Daten-Canvas können Sie Ihre Abfragen als Notebook exportieren. So exportieren Sie sie als ein Notebook:

  1. Klicken Sie auf den Tab Als Notebook exportieren.
  2. Geben Sie im Bereich „Notebook speichern“ den Namen und die Region für das zu speichernde Notebook ein.
  3. Klicken Sie auf Speichern. Das Notebook wurde erstellt.
  4. Klicken Sie auf In BQ Studio öffnen, um das erstellte Notebook aufzurufen.

Beispiel 3

Prompt 1

Find data about USA names

Potenzielles Ergebnis

Mit dem BigQuery-Daten-Canvas wird eine Liste von Tabellen generiert. In diesem Beispiel wählen wir die Tabelle bigquery-public-data.usa_names.usa_1910_current aus.

Klicken Sie auf Abfrage, um die Daten abzufragen. Geben Sie einen Prompt zum Abfragen der Daten ein.

Potenzielles Ergebnis

Der BigQuery-Daten-Canvas generiert die folgende Abfrage:

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

Der BigQuery-Daten-Canvas generiert die Ergebnisse der Abfrage. Wir stellen eine zusätzliche Abfrage, um diese Daten zu filtern. Klicken Sie auf Diese Ergebnisse abfragen.

Prompt 2

Get me the top 10 most popular names in 1980

Potenzielles Ergebnis

Der BigQuery-Daten-Canvas generiert die folgende Abfrage:

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

Nach der Abfrage erhalten wir eine Tabelle mit den zehn häufigsten Namen für im Jahr 1980 geborene Kinder.

In diesem Beispiel visualisieren wir die Ergebnisse. Klicken Sie auf Visualisieren. Im BigQuery-Daten-Canvas werden verschiedene Visualisierungsoptionen vorgeschlagen (Balkendiagramm, Kreisdiagramm, Liniendiagramm, benutzerdefinierte Visualisierung usw.). Klicken Sie auf Balkendiagramm erstellen.

Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

Balkendiagramm mit den Top-10-Namen.

Neben der Bereitstellung eines Diagramms fasst BigQuery-Daten-Canvas einige der wichtigsten Details der Daten zusammen, die der Visualisierung zugrunde liegen. Um das Diagramm anzupassen, klicken Sie auf Visualisierungsdetails und bearbeiten das Diagramm in der Seitenleiste.

Prompt 3

Create a bar chart sorted high to low, with a gradient

Potenzielles Ergebnis

Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:

Balkendiagramm mit den Top-10-Namen, sortiert.

Klicken Sie auf Visualisierungsdetails, um weitere Änderungen vorzunehmen. Die Seitenleiste mit den Visualisierungsdetails wird angezeigt. Sie können den Diagrammtitel, den Namen der X-Achse, den Namen der Y-Achse und mehr bearbeiten. Wenn Sie auf den Tab JSON klicken, können Sie außerdem basierend auf den JSON-Werten direkt Änderungen am Diagramm vornehmen.

Preise

Die Abrechnung erfolgt nach dem computing- oder speicherbasierten Preismodell, wenn Sie mit BigQuery-Daten-Canvas arbeiten. Für die Verwendung von Gemini mit BigQuery-Data-Canvas während der Vorschau fallen keine zusätzlichen Gebühren an.

Feedback geben

Um dazu beitragen, die Vorschläge im BigQuery-Data Canvas zu verbessern, senden Sie Ihr Feedback an Google. So geben Sie Feedback:

  1. Klicken Sie in der Google Cloud Console in der Symbolleiste auf Feedback geben.

  2. Optional: Klicken Sie auf Kopieren, um die DAG-JSON-Informationen zu kopieren und weiteren Kontext für Ihr Feedback bereitzustellen.

  3. Klicken Sie auf das Formular und füllen Sie es aus, um Feedback zu geben.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud Trusted Tester-Programm.

Sie können auch eine E-Mail an datacanvas-feedback@google.com senden, um direktes Feedback zu dieser Funktion zu geben.

Nächste Schritte