Aus einer Pub/Sub-Streamingquelle lesen

Cloud Data Fusion unterstützt Pub/Sub-Quellen in Streamingdaten-Pipelines.

Hinweise

Rollen und Berechtigungen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Pub/Sub-Bearbeiter (roles/pubsub.editor) für das Dienstkonto zuzuweisen, mit dem auf das Pub/Sub-Abo zugegriffen wird, um die Berechtigungen zu erhalten, die Sie zum Lesen aus einer Pub/Sub-Streamingquelle benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Lesen aus einer Pub/Sub-Streamingquelle erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um aus einer Pub/Sub-Streamingquelle zu lesen:

  • pubsub.snapshots.create
  • pubsub.snapshots.delete
  • pubsub.snapshots.seek
  • pubsub.subscriptions.consume
  • pubsub.topics.attachSubscription

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Sie weisen die Rolle dem Dienstkonto zu, das Sie in den Plug-in-Eigenschaften für den Zugriff auf Pub/Sub angegeben haben. Wenn keines angegeben ist, weisen Sie die Rolle dem Dataproc-Dienstkonto zu.

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Pub/Sub-Quelle zu Ihrer Streaming-Datenpipeline hinzufügen

  1. Rufen Sie Ihre Instanz auf:

    1. Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.

    2. Wenn Sie die Instanz in Cloud Data Fusion Studio öffnen möchten, klicken Sie auf Instanzen und dann auf Instanz anzeigen.

      Zur Seite „VM-Instanzen“

  2. Klicken Sie in der Cloud Data Fusion-Web-UI auf Studio.

  3. Wählen Sie Datenpipeline – Echtzeit aus.

  4. Wählen Sie im Menü Quelle die Option Pub/Sub aus. In der Pipeline wird ein Pub/Sub-Streamingquellenknoten angezeigt.

  5. Klicken Sie auf dem Pub/Sub-Knoten auf Eigenschaften, um die Quelle zu konfigurieren. Weitere Informationen finden Sie unter Pub/Sub-Streamingquelle.

Unterstützung für eine einzelne Pub/Sub-Quelle ohne Windower-Plug-ins

Cloud Data Fusion-Version 6.9.1 unterstützt Echtzeitpipelines mit einer einzelnen Pub/Sub-Streamingquelle und ohne Windower-Plug-ins.

  • Die Pub/Sub-Streamingquelle bietet integrierte Unterstützung und Daten werden mindestens einmal verarbeitet. Die Aktivierung von Spark-Checkpointing ist nicht erforderlich.
  • Die Pub/Sub-Streamingquelle erstellt zu Beginn jedes Batches einen Pub/Sub-Snapshot und entfernt ihn am Ende jedes Batches.
  • Das Erstellen von Pub/Sub-Snapshots ist mit Kosten verbunden. Weitere Informationen finden Sie unter Pub/Sub-Preise.
  • Sie können die Erstellung von Snapshots in Cloud-Audit-Logs überwachen.

Pipeline mit einer Pub/Sub-Streamingquelle aktualisieren

Cloud Data Fusion unterstützt direkte Anwendungsupgrades für Streamingpipelines mit einer Pub/Sub-Streamingquelle, die in Version 6.9.1 oder höher erstellt wurde.

Cloud Data Fusion unterstützt keine Upgrades für Datenpipelines mit einer Pub/Sub-Streamingquelle in Version 6.9.0 oder früher. Aktualisieren Sie stattdessen diese Pipelines auf Version 6.9.1:

  1. Stellen Sie die Veröffentlichung der Daten im Thema ein, wenn das Instanz-Upgrade geplant ist.
  2. Warten Sie, bis die Pipeline die veröffentlichten Daten verarbeitet hat.
  3. Wenn die Daten vollständig verarbeitet wurden, stoppen Sie die Pipeline.
  4. Führen Sie ein Upgrade der Instanz durch.
  5. Duplizieren Sie die vorhandene Pipeline und aktualisieren Sie sie auf die neuesten Plug-ins.
  6. Stellen Sie die Pipeline bereit.
  7. Führen Sie die neue Pipeline aus, um Daten zu lesen.

    In der neuen Version wird automatisch Snapshotting anstelle von Spark-Checkpointing verwendet.

  8. Löschen Sie die alte Pipeline.

Nächste Schritte