Daten mit Gemini vorbereiten
In diesem Dokument wird beschrieben, wie Sie SQL-Codevorschläge für die Datenvorbereitung in BigQuery generieren und verwalten.
Weitere Informationen finden Sie unter Einführung in die Datenvorbereitung in BigQuery.
Hinweise
Datenvorbereitungs-Editor in BigQuery öffnen
Sie können den Editor für die Datenvorbereitung in BigQuery öffnen, indem Sie eine neue Datenvorbereitung erstellen, eine aus einer vorhandenen Tabelle erstellen oder eine vorhandene Datenvorbereitung öffnen. Weitere Informationen dazu, was beim Erstellen einer Datenvorbereitung passiert, finden Sie unter Einstiegspunkte für die Datenvorbereitung.
Auf der Seite BigQuery Studio können Sie den Editor für die Datenvorbereitung auf folgende Arten aufrufen:
Neu erstellen
So erstellen Sie eine neue Datenvorbereitung in BigQuery:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Klicken Sie auf Neu erstellen und dann auf Datenvorbereitung. Der Editor für die Datenvorbereitung wird in einem neuen Tab ohne Titel angezeigt.
- Geben Sie in der Suchleiste des Editors den Namen der Tabelle oder Suchbegriffe ein und wählen Sie eine Tabelle aus. Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge von Gemini zur Datenvorbereitung.
Im Bereich Explorer wird eine Datenvorbereitungsressource angezeigt, über die Sie in Zukunft auf diese Vorbereitung zugreifen können. - Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus, indem Sie auf Vollbild Vollbild klicken.
Neu aus Tabelle erstellen
So erstellen Sie eine neue Datenvorbereitung aus einer vorhandenen Tabelle:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Bewegen Sie den Mauszeiger im Bereich Explorer auf eine Tabelle.
- Klicken Sie auf das Dreipunkt-Menü mehr_vert > Abfrage > Datenvorbereitung. Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge von Gemini zur Datenvorbereitung.
Im Bereich Explorer wird eine Datenvorbereitungsressource angezeigt, über die Sie in Zukunft auf diese Vorbereitung zugreifen können. - Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus, indem Sie auf Vollbild Vollbild klicken.
Vorhandenes öffnen
So öffnen Sie den Editor für eine vorhandene Datenvorbereitung:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts und dann auf Datenvorbereitung.
- Wählen Sie die vorhandene Datenvorbereitung aus. Die Grafikansicht der Datenvorbereitungspipeline wird angezeigt.
- Wählen Sie einen der Knoten im Diagramm aus. Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge zur Datenvorbereitung von Gemini.
- Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus. Klicken Sie dazu auf Vollbild Vollbild.
Schritte zur Datenvorbereitung erstellen
Sie bereiten die Daten in mehreren Schritten vor. Sie können sich eine Vorschau der von Gemini vorgeschlagenen Schritte ansehen oder sie anwenden. Sie können die Vorschläge auch optimieren oder eigene Schritte ausführen. Weitere Informationen zu den unterstützten Schritten zur Datenvorbereitung finden Sie unter Unterstützte Schritte.
Vorschläge von Gemini ansehen, bearbeiten und anwenden
Wenn Sie in den vorherigen Schritten den Editor für die Datenvorbereitung für Ihre Tabelle öffnen, prüft Gemini die Daten und das Schema der geladenen Tabelle und generiert Vorschläge.
Klicken Sie in der Datenansicht auf einen Spaltennamen oder eine bestimmte Zelle. Gemini generiert Filter- und Transformationsvorschläge, die speziell auf diese Spalte oder Zelle zugeschnitten sind.
So wenden Sie einen Vorschlag von Gemini als Schritt zur Datenvorbereitung an:
- Rufen Sie in der Datenansicht die Liste Schritte auf und sehen Sie sich die Vorschläge an.
- Optional: Klicken Sie auf Vorschau, um eine Vorschau des Ergebnisses der Vorschlagskarte zu sehen.
Optional: Wenn Sie die Vorschlagskarte in natürlicher Sprache ändern möchten, klicken Sie auf Bearbeiten.
Weitere Informationen zum Ändern von Vorschlägen finden Sie unter Vorschläge mit einem Beispiel verbessern und Schritte in natürlicher Sprache oder SQL-Ausdrücken hinzufügen.
Klicken Sie auf Übernehmen.
Zwischen den Schritten wechseln
Wenn Sie in der Datenansicht auf Angewandte Schritte klicken und die Liste der Schritte aufrufen, haben Sie folgende Möglichkeiten:
- Sie können einen Schritt in der Liste bearbeiten oder entfernen, indem Sie auf das Dreipunkt-Menü Menü klicken und die gewünschte Änderung vornehmen.
- Wählen Sie einen beliebigen Schritt in der Liste aus, um sich das Datenbeispiel und das Schema zu diesem bestimmten Schritt anzusehen.
- Wählen Sie einen Schritt in der Liste aus, um nach dem ausgewählten Schritt neue Schritte einzufügen.
Vorschläge mit einem Beispiel verbessern
Wenn Sie die Vorschläge von Gemini optimieren möchten, geben Sie ein Beispiel dafür an, wie die Daten in der Zelle aussehen sollen:
Bearbeiten Sie in der Datenansicht die Werte von ein bis drei Zellen, um zu veranschaulichen, wie die Werte in dieser Spalte aussehen sollten. Geben Sie beispielsweise ein Datum in der gewünschten Formatierung ein. Gemini generiert anhand Ihrer Änderungen neue Vorschläge.
Klicken Sie auf Bearbeiten, um eine Vorschlagskarte zu ändern.
Klicken Sie auf Übernehmen.
Schritte mit natürlicher Sprache oder SQL-Ausdrücken hinzufügen
Wenn keine Vorschläge Ihren Anforderungen entsprechen, können Sie eigene hinzufügen. Klicken Sie dazu auf Schritt hinzufügen, wählen Sie einen Schritttyp aus und geben Sie einen Prompt in natürlicher Sprache ein, der Ihre Absicht beschreibt.
Transformation hinzufügen
- Klicken Sie in der Datenansicht auf Schritt hinzufügen und wählen Sie die Option Transformation aus.
- Geben Sie im Feld Beschreibung einen Prompt ein, z. B.
Convert the state column to a uppercase
. Klicken Sie auf Senden Senden.
Gemini generiert einen SQL-Ausdruck und eine neue Beschreibung basierend auf Ihrem Prompt.
Wählen Sie in der Liste Zielspalte einen Spaltennamen aus oder geben Sie einen ein.
Optional: Wenn Sie den SQL-Ausdruck aktualisieren möchten, ändern Sie den Prompt und klicken Sie auf Senden Senden oder geben Sie manuell einen SQL-Ausdruck ein.
Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
Klicken Sie auf Übernehmen.
Zeilen filtern
So fügen Sie einen Filter hinzu, mit dem Zeilen entfernt werden:
- Klicken Sie in der Datenansicht auf Schritt hinzufügen > Filter.
- Geben Sie im Feld Beschreibung einen Prompt ein, z. B.
Column ID should not be NULL
. - Klicken Sie auf Erstellen. Gemini generiert einen SQL-Ausdruck und eine neue Beschreibung basierend auf Ihrem Prompt.
- Optional: Wenn Sie den SQL-Ausdruck aktualisieren möchten, ändern Sie den Prompt und klicken Sie auf Senden Senden oder geben Sie den SQL-Ausdruck manuell ein.
- Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
- Klicken Sie auf Übernehmen.
Format des Filterausdrucks
Mit SQL-Ausdrücken für Filter werden Zeilen beibehalten, die der angegebenen Bedingung entsprechen. Dies entspricht einer SELECT … WHERE SQL_EXPRESSION
-Anweisung.
Wenn Sie beispielsweise Einträge behalten möchten, bei denen der Wert in Spalte year
größer oder gleich 2000
ist, lautet die Bedingung year >= 2000
.
Ausdrücke müssen der BigQuery-SQL-Syntax für die WHERE
-Klausel entsprechen.
Fehlertabelle konfigurieren und Validierungsregel hinzufügen
Sie können einen Filter hinzufügen, der eine Validierungsregel erstellt, die Fehler an eine Fehlertabelle sendet oder die Ausführung der Datenvorbereitung fehlschlägt.
Fehlertabelle konfigurieren
So konfigurieren Sie die Fehlertabelle:
- Klicken Sie in der Datenansicht auf das Dreipunkt-Menü > Fehlertabelle.
- Klicken Sie auf Fehlertabelle aktivieren.
- Speicherort der Tabelle definieren
- Optional: Legen Sie eine maximale Dauer für das Beibehalten von Fehlern fest.
- Klicken Sie auf Speichern.
Validierungsregel hinzufügen
So fügen Sie eine Validierungsregel hinzu:
- Klicken Sie in der Datenansicht auf Schritt hinzufügen > Filter.
- Geben Sie eine Beschreibung für den Schritt ein.
- Geben Sie einen SQL-Ausdruck in Form einer
WHERE
-Klausel ein. - Optional: Wenn der SQL-Ausdruck als Validierungsregel verwendet werden soll, klicken Sie das Kästchen Zeilen mit fehlgeschlagener Validierung werden an die Fehlertabelle gesendet an. Sie können einen Filter auch in der Symbolleiste für die Datenvorbereitung in eine Validierung umwandeln. Klicken Sie dazu auf das Dreipunkt-Menü > Fehlertabelle.
- Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
- Klicken Sie auf Übernehmen.
Spalte löschen
So löschen Sie eine Spalte aus einer Datenvorbereitung:
- Klicken Sie in der Schemaansicht neben der zu löschenden Spalte auf das Dreipunkt-Menü Menü.
- Klicken Sie auf Löschen. Für die gelöschte Spalte wird ein neuer angewendeter Schritt hinzugefügt.
Zusammenführungsvorgang mit Gemini hinzufügen
So fügen Sie bei der Datenvorbereitung einen Zusammenführungsvorgang zwischen zwei Quellen hinzu:
- Klicken Sie in der Datenansicht für einen Knoten in der Datenvorbereitung in der Liste Schritte auf Schritt hinzufügen > Zusammenführen.
- Klicken Sie im Dialogfeld Join hinzufügen auf Durchsuchen und wählen Sie dann die andere Tabelle aus, die am Join-Vorgang beteiligt ist (die rechte Seite des Joins).
- Optional: Wählen Sie den gewünschten Join-Vorgang aus, z. B. Inner Join.
Prüfen Sie die von Gemini generierten Informationen zum Join-Schlüssel in den folgenden Feldern:
- Join-Beschreibung: Die Beschreibung des SQL-Ausdrucks für den Join-Vorgang in natürlicher Sprache. Wenn Sie diese Beschreibung bearbeiten und auf Senden bzw. Senden klicken, schlägt Gemini neue SQL-Join-Bedingungen vor.
Join-Bedingungen: Die SQL-Ausdrücke in der
ON
-Klausel für den Join-Vorgang. Mit den QualifikationenL
undR
können Sie jeweils auf die linke und rechte Quelltabelle verweisen. Wenn Sie beispielsweise die Spaltecustomer_id
aus der linken Tabelle mit der Spaltecustomer_id
aus der rechten Tabelle zusammenführen möchten, geben SieL.customerId = R.customerId
ein. Bei diesen Qualifizierern wird nicht zwischen Groß- und Kleinschreibung unterschieden.
Optional: Wenn Sie die Vorschläge von Gemini verfeinern möchten, bearbeiten Sie das Feld Join description (Beitrittsbeschreibung) und klicken Sie dann auf Send (Senden) Send.
Optional: Klicken Sie auf Vorschau, um eine Vorschau der Einstellungen für den Zusammenführungsvorgang Ihrer Datenvorbereitung aufzurufen.
Klicken Sie auf Übernehmen.
Der Schritt für den Zusammenführungsvorgang wird erstellt. Die ausgewählte Quelltabelle (rechte Seite der Verbindung) und der Zusammenführungsvorgang werden in der Liste der angewendeten Schritte und in den Knoten in der Grafikansicht der Datenvorbereitung angezeigt.
Zieltabelle hinzufügen oder ändern
So fügen Sie eine Zieltabelle für die Ausgabe Ihrer Datenvorbereitung hinzu oder ändern sie:
- Klicken Sie in der Datenansicht auf Hinzufügen > Ziel.
- Wählen Sie das Projekt aus, in dem die Zieltabelle gespeichert ist.
- Wählen Sie einen der Datensätze aus oder laden Sie einen neuen Datensatz.
- Geben Sie eine Zieltabelle ein. Wenn die Tabelle nicht vorhanden ist, wird bei der ersten Ausführung der Datenvorbereitung eine neue Tabelle erstellt. Weitere Informationen finden Sie unter Schreibmodus.
- Wählen Sie Ihr Dataset als Zieldatensatz aus.
- Klicken Sie auf Speichern.
Datenvorbereitung ausführen
Nachdem Sie die Schritte zur Datenvorbereitung hinzugefügt, das Ziel konfiguriert und alle Validierungsfehler behoben haben, können Sie Testläufe mit einer Stichprobe der Daten ausführen oder die Schritte bereitstellen und Datenvorbereitungsläufe planen. Weitere Informationen finden Sie unter Datenvorbereitungen planen.
Beispiele für die Datenvorbereitung aktualisieren
Die Daten in der Stichprobe werden nicht automatisch aktualisiert. Wenn sich die Daten in den Quelltabellen für die Datenvorbereitung geändert haben, die Änderungen aber nicht im Datenbeispiel der Vorbereitung berücksichtigt werden, klicken Sie auf das Dreipunkt-Menü > Beispiel aktualisieren.
Nächste Schritte
- Weitere Informationen zum Planen der Datenvorbereitung
- Weitere Informationen zum Verwalten der Datenvorbereitung
- Kontingente und Limits für Gemini in BigQuery
- Preise für Gemini in BigQuery