Daten mit Gemini vorbereiten
In diesem Dokument wird beschrieben, wie Sie SQL-Codevorschläge für die Datenvorbereitung in BigQuery generieren und verwalten.
Weitere Informationen finden Sie unter Einführung in die Datenvorbereitung in BigQuery.
Hinweise
Datenvorbereitungs-Editor in BigQuery öffnen
Sie können den Editor für die Datenvorbereitung in BigQuery öffnen, indem Sie eine neue Datenvorbereitung erstellen, eine aus einer vorhandenen Tabelle erstellen oder eine vorhandene Datenvorbereitung öffnen. Weitere Informationen dazu, was beim Erstellen einer Datenvorbereitung passiert, finden Sie unter Einstiegspunkte für die Datenvorbereitung.
Auf der Seite BigQuery Studio können Sie den Editor für die Datenvorbereitung auf folgende Arten aufrufen:
Neu erstellen
So erstellen Sie eine neue Datenvorbereitung in BigQuery:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Klicken Sie auf Neu erstellen und dann auf Datenvorbereitung. Der Editor für die Datenvorbereitung wird in einem neuen Tab ohne Titel angezeigt.
- Geben Sie in der Suchleiste des Editors den Namen der Tabelle oder Suchbegriffe ein und wählen Sie eine Tabelle aus. Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge von Gemini zur Datenvorbereitung.
Im Bereich Explorer wird eine Datenvorbereitung angezeigt, auf die Sie später zugreifen können. - Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus, indem Sie auf Vollbild Vollbild klicken.
Neu aus Tabelle erstellen
So erstellen Sie eine neue Datenvorbereitung aus einer vorhandenen Tabelle:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Bewegen Sie den Mauszeiger im Bereich Explorer auf eine Tabelle.
- Klicken Sie auf das Dreipunkt-Menü more_vert Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge von Gemini zur Datenvorbereitung.
Im Bereich Explorer wird eine Datenvorbereitung angezeigt, auf die Sie später zugreifen können. - Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus, indem Sie auf Vollbild Vollbild klicken.
Vorhandenes öffnen
So öffnen Sie den Editor für eine vorhandene Datenvorbereitung:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.
BigQuery aufrufen - Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts und dann auf Datenvorbereitung.
- Wählen Sie die vorhandene Datenvorbereitung aus. Die Grafikansicht der Datenvorbereitungspipeline wird angezeigt.
- Wählen Sie einen der Knoten im Diagramm aus. Der Editor für die Datenvorbereitung für die Tabelle wird geöffnet. Auf dem Tab Daten sehen Sie eine Vorschau Ihrer Daten und erste Vorschläge zur Datenvorbereitung von Gemini.
- Optional: Wenn Sie die Ansicht vereinfachen möchten, aktivieren Sie den Vollbildmodus, indem Sie auf Vollbild Vollbild klicken.
Schritte zur Datenvorbereitung erstellen
Sie bereiten die Daten in mehreren Schritten vor. Sie können sich eine Vorschau der von Gemini vorgeschlagenen Schritte ansehen oder sie anwenden. Sie können die Vorschläge auch optimieren oder eigene Schritte ausführen. Weitere Informationen zu den unterstützten Schritten zur Datenvorbereitung finden Sie unter Unterstützte Schritte.
Vorschläge von Gemini ansehen und anwenden
Wenn Sie in den vorherigen Schritten den Editor für die Datenvorbereitung für Ihre Tabelle öffnen, prüft Gemini die Daten und das Schema der geladenen Tabelle und generiert Vorschläge.
Klicken Sie in der Datenansicht auf einen Spaltennamen oder eine bestimmte Zelle. Gemini generiert Filter- und Transformationsvorschläge, die speziell auf diese Spalte oder Zelle zugeschnitten sind.
So wenden Sie einen Vorschlag von Gemini als Schritt zur Datenvorbereitung an:
- Rufen Sie in der Datenansicht die Liste Schritte auf und sehen Sie sich die Vorschläge an.
- Optional: Wenn Sie die Beschreibung oder den SQL-Ausdruck auf einer Vorschlagskarte bearbeiten möchten, klicken Sie auf Vorschau.
- Klicken Sie auf Anwenden.
- Optional: Wenn Sie bessere Vorschläge von Gemini erhalten möchten, geben Sie Beispiele und wiederholen Sie diese Schritte.
Zwischen den Schritten wechseln
Wenn Sie in der Datenansicht auf Angewandte Schritte klicken und die Liste der Schritte aufrufen, haben Sie folgende Möglichkeiten:
- Wenn Sie einen Schritt bearbeiten oder entfernen möchten, klicken Sie auf das more_vert Menü und nehmen Sie die gewünschten Änderungen vor.
- Wählen Sie einen beliebigen Schritt in der Liste aus, um sich das Datenbeispiel und das Schema zu diesem bestimmten Schritt anzusehen.
- Wählen Sie einen Schritt in der Liste aus, um nach dem ausgewählten Schritt neue Schritte einzufügen.
Vorschläge mit einem Beispiel verbessern
Wenn Sie die Vorschläge von Gemini optimieren möchten, geben Sie ein Beispiel dafür an, wie die Daten in der Zelle aussehen sollen:
Bearbeiten Sie in der Datenansicht die Werte von ein bis drei Zellen, um zu veranschaulichen, wie die Werte in dieser Spalte aussehen sollten. Geben Sie beispielsweise ein Datum in der gewünschten Formatierung ein. Gemini generiert basierend auf Ihren Änderungen neue Vorschläge.
Klicken Sie auf Vorschau, um eine Vorschlagskarte zu ändern.
Klicken Sie auf Anwenden.
Schritte manuell hinzufügen
Wenn keine der Vorschläge Ihren Anforderungen entspricht, können Sie eigene hinzufügen. Klicken Sie dazu auf Schritt hinzufügen, wählen Sie einen Schritttyp aus und geben Sie eine Beschreibung und einen SQL-Ausdruck ein.
Transformation hinzufügen
- Wählen Sie in der Datenansicht eine Spalte aus und klicken Sie auf Schritt hinzufügen > Transformation.
- Geben Sie eine Beschreibung für den Schritt ein.
- Geben Sie einen SQL-Ausdruck ein.
- Wählen Sie im Feld Zielspalte eine Spalte aus oder erstellen Sie eine neue.
- Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
- Klicken Sie auf Anwenden.
Zeilen filtern
So fügen Sie einen Filter hinzu, mit dem Zeilen entfernt werden:
- Klicken Sie in der Datenansicht auf Schritt hinzufügen > Filter.
- Geben Sie eine Beschreibung für den Schritt ein.
- Geben Sie einen SQL-Ausdruck ein.
- Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
- Klicken Sie auf Anwenden.
Format des Filterausdrucks
Bei SQL-Ausdrücken für Filter werden Zeilen beibehalten, die der angegebenen Bedingung entsprechen. Dies entspricht einer SELECT … WHERE SQL_EXPRESSION
-Anweisung.
Wenn Sie beispielsweise Einträge behalten möchten, bei denen der Wert in Spalte year
größer oder gleich 2000
ist, lautet die Bedingung year >= 2000
.
Ausdrücke müssen der BigQuery-SQL-Syntax für die WHERE
-Klausel entsprechen.
Fehlertabelle konfigurieren und Validierungsregel hinzufügen
Sie können einen Filter hinzufügen, der eine Validierungsregel erstellt, die Fehler an eine Fehlertabelle sendet oder die Ausführung der Datenvorbereitung fehlschlägt.
Fehlertabelle konfigurieren
So konfigurieren Sie die Fehlertabelle:
- Klicken Sie in der Datenansicht auf das Dreipunkt-Menü > Fehlertabelle.
- Klicken Sie auf Fehlertabelle aktivieren.
- Speicherort der Tabelle definieren
- Optional: Legen Sie eine maximale Dauer für das Beibehalten von Fehlern fest.
- Klicken Sie auf Speichern.
Validierungsregel hinzufügen
So fügen Sie eine Validierungsregel hinzu:
- Klicken Sie in der Datenansicht auf Schritt hinzufügen > Filter.
- Geben Sie eine Beschreibung für den Schritt ein.
- Geben Sie einen SQL-Ausdruck in Form einer
WHERE
-Klausel ein. - Optional: Wenn der SQL-Ausdruck als Validierungsregel verwendet werden soll, klicken Sie das Kästchen Zeilen mit fehlgeschlagener Validierung werden an die Fehlertabelle gesendet an. Sie können einen Filter auch in der Symbolleiste für die Datenvorbereitung in eine Validierung umwandeln. Klicken Sie dazu auf das Dreipunkt-Menü > Fehlertabelle.
- Optional: Klicken Sie auf Vorschau und überprüfen Sie den Schritt.
- Klicken Sie auf Anwenden.
Spalte löschen
So löschen Sie eine Spalte aus der Datenvorbereitung:
- Klicken Sie in der Schemaansicht neben der zu löschenden Spalte auf das more_vert Menü.
- Klicken Sie auf Löschen. Für die gelöschte Spalte wird ein neuer angewendeter Schritt hinzugefügt.
Join-Vorgang hinzufügen
So fügen Sie bei der Datenvorbereitung einen Zusammenführungsvorgang zwischen zwei Quellen hinzu:
- Klicken Sie in der Datenansicht für einen Knoten in der Datenvorbereitung in der Liste Schritte auf Schritt hinzufügen > Zusammenführen.
- Wählen Sie im Dialogfeld Join konfigurieren die andere Tabelle aus, die am Join-Vorgang beteiligt ist (die rechte Seite des Joins).
- Optional: Wählen Sie die Join-Schlüssel für jede Tabelle aus. Join-Schlüssel müssen denselben Datentyp haben.
- Optional: Wählen Sie den Join-Vorgang aus, z. B. Inner Join.
Optional: Wenn Sie die rechte Tabelle vor der Angabe eines Join-Schlüssels vorbereiten möchten, z. B. wenn sich die Datentypen der beiden Spalten im Join unterscheiden, gehen Sie so vor:
- Sie speichern einen Join, ohne einen Join-Schlüssel auszuwählen.
- Rufen Sie die Grafikansicht auf und wählen Sie die Quelltabelle auf der rechten Seite aus.
- Bereiten Sie die Tabelle auf der rechten Seite vor, z. B. indem Sie den Datentyp einer Spalte transformieren.
- Bearbeiten Sie die im vorherigen Schritt gespeicherte Verbindung, indem Sie einen Schlüssel festlegen.
Klicken Sie auf Erstellen.
Alle Tabellenzeilen werden beibehalten, auch wenn in einer der Tabellen kein entsprechender Wert vorhanden ist.
Nachdem Sie den Schritt gespeichert haben, werden die ausgewählte Quelltabelle (rechte Seite des Joins) und der Join-Vorgang in der Liste der angewendeten Schritte und in den Knoten in der Diagrammansicht der Datenvorbereitung berücksichtigt.
Zieltabelle hinzufügen oder ändern
So fügen Sie eine Zieltabelle für die Ausgabe Ihrer Datenvorbereitung hinzu oder ändern sie:
- Klicken Sie in der Datenansicht auf Hinzufügen > Ziel.
- Wählen Sie das Projekt aus, in dem die Zieltabelle gespeichert ist.
- Wählen Sie einen der Datensätze aus oder laden Sie einen neuen Datensatz.
- Geben Sie eine Zieltabelle ein. Wenn die Tabelle nicht vorhanden ist, wird bei der ersten Ausführung der Datenvorbereitung eine neue Tabelle erstellt. Weitere Informationen finden Sie unter Schreibmodus.
- Wählen Sie Ihr Dataset als Zieldatensatz aus.
- Klicken Sie auf Speichern.
Datenvorbereitung ausführen
Um die Schritte zur Datenvorbereitung auszuführen und die vorbereiteten Daten in die Zieltabelle zu laden, planen Sie einen einmaligen oder wiederkehrenden Lauf zur Datenvorbereitung:
- Speichern Sie alle ausstehenden Änderungen in der Datenvorbereitung.
- Klicken Sie in der Symbolleiste für die Datenvorbereitung auf Planen.
- Geben Sie einen Namen für den Zeitplan ein.
- Geben Sie den Namen des Dienstkontos ein, das mit der Ausführung verknüpft ist.
- Legen Sie eine Häufigkeit fest.
- Klicken Sie auf Zeitplan erstellen.
Weitere Informationen finden Sie unter Datenvorbereitungen planen.
Beispiele für die Datenvorbereitung aktualisieren
Die Daten in der Stichprobe werden nicht automatisch aktualisiert. Wenn sich die Daten in den Quelltabellen für die Datenvorbereitung geändert haben, die Änderungen aber nicht im Datenbeispiel der Vorbereitung berücksichtigt werden, klicken Sie auf das Dreipunkt-Menü > Beispiel aktualisieren.
Nächste Schritte
- Weitere Informationen zum Verwalten der Datenvorbereitung
- Kontingente und Limits für Gemini in BigQuery
- Preise für Gemini in BigQuery