Datenvorbereitung verwalten

In diesem Dokument wird beschrieben, wie Sie Datenvorbereitungen in BigQuery verwalten, einschließlich der Bereitstellung und Planung von Datenvorbereitungen. Datenvorbereitungen sind BigQuery-Ressourcen, die auf Dataform basieren.

Hinweise

Erforderliche Rollen

Damit das Dataform-Dienstkonto die erforderlichen Berechtigungen zum Vorbereiten von Daten in BigQuery hat, lesen Sie den Hilfeartikel Erforderliche Rollen für Dataform-Dienstkonten.

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Vorbereiten von Daten in BigQuery benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Vorhandene Datenvorbereitungen ansehen

So rufen Sie eine Liste der vorhandenen Datenvorbereitungen auf:

  1. Rufen Sie auf der Seite BigQuery Studio den Bereich Explorer auf.
  2. Erweitern Sie Ihr Projekt.
  3. Maximieren Sie die Liste Datenvorbereitung.

Datenvorbereitungen planen

Sie können Zeitpläne im Editor für die Datenvorbereitung erstellen und auf der BigQuery-Seite Orchestrierung verwalten.

Zeitplan erstellen

Wenn Sie einen Zeitplan erstellen möchten, mit dem die Schritte zur Datenvorbereitung ausgeführt und die vorbereiteten Daten in die Zieltabelle geladen werden, planen Sie einen einmaligen oder wiederkehrenden Lauf zur Datenvorbereitung:

  1. Klicken Sie in der Symbolleiste für die Datenvorbereitung auf Zeitplan.
  2. Geben Sie einen Namen für den Zeitplan ein.
  3. Geben Sie den Namen des Dienstkontos ein, das mit der Ausführung verknüpft ist.
  4. Legen Sie eine Häufigkeit fest.
  5. Klicken Sie auf Zeitplan erstellen.

Terminübersichten ansehen

So rufen Sie alle Zeitpläne für die Datenvorbereitung in Ihrem Projekt auf:

  1. Rufen Sie in der Google Cloud Console die Seite Orchestrierung auf.

    Zu „Orchestrierung“

  2. Optional: Klicken Sie auf den Namen des Zeitplans, um Details zu einem ausgewählten Zeitplan und seinen bisherigen Ausführungen aufzurufen.

Zeitplan löschen

So löschen Sie einen Zeitplan für eine ausgewählte Datenvorbereitung endgültig:

  1. Rufen Sie in der Google Cloud Console die Seite Orchestrierung auf.

    Zu „Orchestrierung“

  2. Klicken Sie in der Zeile mit dem Zeitplan auf  Aktionen > Löschen.

Datenvorbereitung durch inkrementelle Datenverarbeitung optimieren

So konfigurieren Sie, wie die vorbereiteten Daten in eine Zieltabelle geschrieben werden:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    BigQuery aufrufen

  2. Wählen Sie im Bereich Aktivität die Datenvorbereitung aus.

  3. Wählen Sie in der Symbolleiste der Datenvorbereitung Dreipunkt-Menü > Schreibmodus aus.

  4. Wählen Sie eine der Optionen aus. Weitere Informationen finden Sie unter Schreibmodus.

  5. Klicken Sie auf Speichern.

Vorschläge zur Verbesserung der Vorschläge

Sie können zur Verbesserung von Gemini-Vorschlägen beitragen, indem Sie die Prompt-Daten, die Sie für Funktionen in der Vorabversion einreichen, mit Google teilen. So geben Sie Ihre Prompt-Daten frei:

  1. Öffnen Sie den Editor für die Datenvorbereitung in BigQuery.
  2. Klicken Sie in der Symbolleiste für die Datenvorbereitung auf Einstellungen Dreipunkt-Menü.
  3. Wählen Sie Daten weitergeben, um Gemini in BigQuery zu verbessern aus.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud Trusted Tester-Programm.

Versionen der Datenvorbereitung

Bei der BigQuery-Datenvorbereitung ist es nicht möglich, Versionen der Datenvorbereitung aufzurufen, zu vergleichen oder wiederherzustellen.

So rufen Sie eine Liste der Versionen der Datenvorbereitung in chronologischer Reihenfolge auf:

  1. Rufen Sie auf der Seite BigQuery Studio den Bereich Explorer auf.
  2. Wählen Sie die Datenvorbereitung aus. Versionen werden im Bereich Explorer auf dem Tab Aktivität aufgeführt.

Datenvorbereitung herunterladen

So laden Sie eine Datenvorbereitung in einer YAML-Datei herunter:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    BigQuery aufrufen

  2. Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenvorbereitung. Klicken Sie auf den Namen der Datenvorbereitung, die Sie herunterladen möchten.

  3. Klicken Sie auf Herunterladen. Die Datenvorbereitung wird im YAML-Dateiformat gespeichert, z. B. NAME data preparation.dp.yaml.

Datenvorbereitung hochladen

So laden Sie eine Datenvorbereitung aus einer YAML-Datei hoch:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    BigQuery aufrufen

  2. Maximieren Sie im Bereich Explorer Ihr Projekt.

  3. Gehen Sie zum Ordner Datenvorbereitungen und klicken Sie auf das more_vert > In die Datenvorbereitung hochladen.

  4. Wählen Sie im Dialogfeld Datenvorbereitung hochladen eine Datei zum Hochladen aus oder geben Sie die URL der Datenvorbereitung ein.

  5. Geben Sie einen Namen für die Datenvorbereitung ein.

  6. Wählen Sie einen Speicherort für die Datenvorbereitung aus, an dem Ressourcen verwaltet und gespeichert werden.

  7. Klicken Sie auf Hochladen.

Nächste Schritte