Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

Quickstart

In dieser Schnellstartanleitung werden folgende Verfahren erläutert:

  1. Erstellen Sie eine Cloud Data Fusion-Instanz.
  2. Beispielpipeline bereitstellen, die in Ihrer Cloud Data Fusion-Instanz bereitgestellt wird Die Pipeline führt Folgendes aus:
    1. Eine JSON-Datei mit NYT-Bestseller-Daten aus Cloud Storage lesen
    2. Transformationen an der Datei ausführen, um die Daten zu analysieren und zu bereinigen
    3. Die bestbewerteten Bücher, die in der letzten Woche hinzugefügt wurden und weniger als 25 $ kosten, in BigQuery laden

Hinweis

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Aktivieren Sie die Cloud Data Fusion API.

    Aktivieren Sie die API

Erstellen Sie eine Cloud Data Fusion-Instanz.

Erstellen Sie eine Cloud Data Fusion-Instanz.

Bei Verwendung von Cloud Data Fusion verwenden Sie sowohl die Cloud Console als auch die separate UI von Cloud Data Fusion.

  • In der Cloud Console können Sie ein Cloud Console-Projekt erstellen, Cloud Data Fusion-Instanzen erstellen und löschen sowie Cloud Data Fusion-Instanzdetails aufrufen.

  • In der Benutzeroberfläche von Cloud Data Fusion können Sie die verschiedenen Seiten wie Pipeline Studio oder Wrangler nutzen, um die Funktionen von Cloud Data Fusion zu nutzen.

So rufen Sie die Benutzeroberfläche von Cloud Data Fusion auf:

  1. Öffnen Sie in der Cloud Console die Seite Instanzen.

    Zur Seite "Instanzen"

  2. Klicken Sie in der Spalte Aktionen der Instanz auf den Link Instanz aufrufen.
  3. Verwenden Sie in der Web-UI von Cloud Data Fusion über den linken Navigationsbereich die gewünschte Seite.

Beispielpipeline bereitstellen

Beispielpipelines sind über den Cloud Data Fusion Hub verfügbar, mit dem Sie wiederverwendbare Pipelines, Plug-ins und Lösungen für Cloud Data Fusion teilen können.

  1. Klicken Sie in der Web-UI von Cloud Data Fusion auf HUB.
  2. Klicken Sie im linken Bereich auf Pipelines.
  3. Klicken Sie auf die Pipeline Cloud Data Fusion-Quickstart.
  4. Klicken Sie auf Erstellen.
  5. Klicken Sie im Cloud Data Fusion-Quickstart-Konfigurationsbereich auf Fertigstellen.
  6. Klicken Sie auf Pipeline anpassen. Eine visuelle Darstellung Ihrer Pipeline wird in Pipeline Studio angezeigt. Dies ist eine grafische Benutzeroberfläche zur Entwicklung von Pipelines zur Datenintegration. Auf der linken Seite sind die Pipeline-Plug-ins aufgelistet und Ihre Pipeline wird im Hauptbereich angezeigt. Sie können Ihre Pipeline untersuchen, indem Sie den Mauszeiger auf die einzelnen Knoten der Pipeline bewegen und auf die Schaltfläche Eigenschaften klicken. Über das Menü „Eigenschaften“ für jeden Knoten können Sie die mit dem Knoten verknüpften Objekte und Vorgänge aufrufen.
  7. Klicken Sie im Menü oben rechts auf Deploy (Bereitstellen). Dadurch wird die Pipeline an Cloud Data Fusion gesendet. Im nächsten Abschnitt dieser Kurzanleitung führen Sie die Pipeline aus.
Stellen Sie die Pipeline bereit.

Pipeline anzeigen

Die bereitgestellte Pipeline wird in der Ansicht der Pipelinedetails angezeigt. Hier können Sie Folgendes tun:

  • Struktur und Konfiguration der Pipeline anzeigen
  • Pipeline manuell ausführen oder einen Zeitplan bzw. Trigger einrichten
  • Zusammenfassung des Ausführungsverlaufs der Pipeline anzeigen, einschließlich Ausführungszeiten, Logs und Messwerte
Kopieren Sie das Dienstkonto.

Pipeline ausführen

Klicken Sie in der Ansicht „Pipelinedetails“ auf Ausführen, um die Pipeline auszuführen.

Ergebnisse aufrufen

Nach einigen Minuten ist die Pipeline abgeschlossen. Der Pipelinestatus ändert sich in Erfolgreich und die Anzahl der von jedem Knoten verarbeiteten Datensätze wird angezeigt.

Pipelineausführung abgeschlossen.
  1. Rufen Sie die BigQuery-UI auf.
  2. Klicken Sie im Dataset DataFusionQuickstart in Ihrem Projekt auf die Tabelle top_rated_inexpensive und führen Sie eine einfache Abfrage aus, z. B. SELECT * FROM `my-project.GCPQuickStart.top_rated_inexpensive` LIMIT 10. Ersetzen Sie „my-project“ durch Ihre project-id, um ein Beispiel der Ergebnisse aufzurufen.
ERGEBNISSE ANSEHEN

Clean-up

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Kurzanleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Löschen Sie das BigQuery-Dataset, in das die Pipeline in diesem Schnellstart geschrieben hat.
  2. Löschen Sie die Cloud Data Fusion-Instanz.

  3. (Optional) Löschen Sie das Projekt.

    1. Wechseln Sie in der Cloud Console zur Seite Ressourcen verwalten.

      Zur Seite „Ressourcen verwalten“

    2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
    3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Nächste Schritte