Was ist Pub/Sub?

Pub/Sub ermöglicht die asynchrone Kommunikation von Diensten mit einer Latenz von 100 Millisekunden.

Pub/Sub wird für Streaminganalysen und Pipelines zur Datenintegration verwendet, um Daten aufzunehmen und zu verteilen. Diese Methode ist ebenso effektiv wie eine messgingorientierte Middleware für die Dienstintegration oder als Warteschlange zum Parallelisieren von Aufgaben.

Mit Pub/Sub können Sie Systeme für Ereignisersteller und -nutzer erstellen, die als Publisher und Abonnenten bezeichnet werden. Publisher kommunizieren asynchron mit Abonnenten durch Broadcast-Ereignisse und nicht durch synchrone Remote-Prozeduraufrufe (RPCs).

Publisher senden Ereignisse an den Pub/Sub-Dienst, unabhängig davon, wie oder wann diese Ereignisse verarbeitet werden sollen. Pub/Sub sendet dann Ereignisse an alle Dienste, die darauf reagieren. In Systemen, die über RPCs kommunizieren, müssen Publisher warten, bis Abonnenten die Daten empfangen. Die asynchrone Integration in Pub/Sub erhöht jedoch die Flexibilität und Robustheit des Gesamtsystems.

Erste Schritte mit Pub/Sub finden Sie in der Kurzanleitung zur Verwendung der Google Cloud Console. Eine umfassendere Einführung finden Sie unter Pub/Sub-Messaging-System erstellen.

Gängige Anwendungsfälle

  • Nutzerinteraktion und Serverereignisse aufnehmen. Wenn Sie Nutzerinteraktionsereignisse aus Endnutzeranwendungen oder Serverereignisse aus Ihrem System verwenden möchten, können Sie sie an Pub/Sub weiterleiten. Sie können dann ein Streamverarbeitungstool wie Dataflow verwenden, das die Ereignisse für Datenbanken bereitstellt. Beispiele für solche Datenbanken sind BigQuery, Cloud Bigtable und Cloud Storage. Mit Pub/Sub können Sie Ereignisse von vielen Clients gleichzeitig erfassen.

  • Ereignisverteilung in Echtzeit. Die Rohdaten oder verarbeiteten Ereignisse können von mehreren Teams innerhalb Ihres Teams und Ihrer Organisation zur Echtzeitverarbeitung zur Verfügung gestellt werden. Pub/Sub unterstützt einen ereignisbezogenen Bus- und ereignisgesteuerten Anwendungsdesign. Pub/Sub bietet die Möglichkeit, viele Google-Systeme zu integrieren, die Ereignisse in Pub/Sub exportieren.

  • Daten zwischen Datenbanken replizieren. Pub/Sub wird häufig verwendet, um Änderungsereignisse aus Datenbanken zu verteilen. Diese Ereignisse können verwendet werden, um eine Ansicht des Datenbankstatus und des Statusverlaufs in BigQuery und anderen Datenspeichersystemen zu erstellen.

  • Parallele Verarbeitung und Workflows Mit Pub/Sub-Nachrichten können Sie viele Aufgaben effizient auf mehrere Worker verteilen, um eine Verbindung zu Cloud Functions herzustellen. Beispiele für solche Aufgaben sind das Komprimieren von Textdateien, das Senden von E-Mail-Benachrichtigungen, das Bewerten von KI-Modellen und das Neuformatieren von Bildern.

  • Ereignisbus für Unternehmen Sie können einen unternehmensweiten Bus für die Datenfreigabe in Echtzeit erstellen, um Geschäftsereignisse, Datenbankaktualisierungen und Analyseereignisse in der gesamten Organisation zu verteilen.

  • Datenstreaming von Anwendungen, Diensten oder IoT-Geräten: Eine SaaS-Anwendung kann beispielsweise einen Echtzeitfeed von Ereignissen veröffentlichen. Alternativ kann ein Wohnsensor Daten über eine Dataflow-Pipeline an Pub/Sub streamen und in anderen Google Cloud-Produkten verwenden.

  • Verteilte Cache-Speicher aktualisieren. Eine Anwendung kann beispielsweise Entwertungsereignisse veröffentlichen, um die IDs von geänderten Objekten zu aktualisieren.

  • Load-Balancing für Zuverlässigkeit. Beispielsweise können Instanzen eines Dienstes in Compute Engine in mehreren Zonen bereitgestellt werden, aber ein gemeinsames Thema abonnieren. Wenn der Dienst in einer beliebigen Zone ausfällt, können die anderen die Last automatisch abrufen.

Arten von Pub/Sub-Diensten

Pub/Sub besteht aus zwei Diensten:

  • Pub/Sub-Dienst Dieser Messaging-Dienst ist die Standardeinstellung für die meisten Nutzer und Anwendungen. Es bietet die höchste Zuverlässigkeit und größte Auswahl an Integrationen sowie eine automatische Kapazitätsverwaltung. Pub/Sub garantiert die synchrone Replikation aller Daten in mindestens zwei Zonen und Best-Effort-Replikation in eine dritte zusätzliche Zone.

  • Pub/Sub Lite-Dienst Ein separater, aber ähnlicher Messaging-Dienst, der zu geringeren Kosten entwickelt wird. Sie bietet eine geringere Zuverlässigkeit im Vergleich zu Pub/Sub. Damit lassen sich zonale oder regionale Themen speichern. Zonale Lite-Themen werden nur in einer Zone gespeichert. Mit regionalen Lite-Themen werden Daten asynchron in eine zweite Zone repliziert. Außerdem müssen Sie für Pub/Sub Lite die Speicher- und Durchsatzkapazität vorab bereitstellen und verwalten. Ziehen Sie Pub/Sub Lite nur für Anwendungen in Betracht, bei denen eine niedrige Kosten eine gewisse operative Arbeit und eine geringere Zuverlässigkeit rechtfertigt.

Weitere Informationen zu den Unterschieden zwischen Pub/Sub und Pub/Sub Lite finden Sie unter Pub/Sub oder Pub/Sub Lite auswählen.

Pub/Sub mit anderen Messaging-Technologien vergleichen

Pub/Sub kombiniert die horizontale Skalierbarkeit von Apache Kafka und Pulsar mit Funktionen, die in traditioneller Messaging-Middleware wie Apache ActiveMQ und RabbitMQ zu finden sind. Beispiele für solche Funktionen sind ungenutzte Warteschlangen und Filter.

Ein weiteres Feature, das Pub/Sub von Messaging-Middleware nutzt, ist pro Nachrichtenparallelität, nicht Partitionsbasiertes Messaging. Pub/Sub gibt die einzelnen Nachrichten an Abonnentenclients zurück und verfolgt dann, ob eine bestimmte Nachricht erfolgreich verarbeitet wurde.

Im Gegensatz dazu verwenden andere horizontal skalierbare Nachrichtensysteme Partitionen für die horizontale Skalierung. Dadurch werden Abonnenten gezwungen, Nachrichten in jeder Partition der Reihe nach zu verarbeiten. Die Anzahl der gleichzeitigen Clients wird auf die Anzahl der Partitionen begrenzt. Die Verarbeitung pro Nachricht maximiert die Parallelität der Abonnentenanwendungen und sorgt für die Unabhängigkeit von Verlagen und Abonnenten.

Dienst-zu-Dienst- und Dienst-zu-Client-Kommunikation vergleichen

Pub/Sub ist für die Dienst-zu-Dienst-Kommunikation gedacht und nicht für die Kommunikation mit Endnutzer- oder IoT-Clients. Andere Muster werden von anderen Produkten besser unterstützt:

Sie können eine Kombination dieser Dienste verwenden, um folgende Muster zu erstellen: Client -> Dienste -> Datenbank. Weitere Informationen finden Sie beispielsweise in der Anleitung Pub/Sub-Nachrichten über WebSockets streamen.

Integrationen

Pub/Sub bietet viele Integrationen in andere Google Cloud-Produkte, um ein Nachrichtensystem mit komplettem Funktionsumfang zu erstellen:

  • Streamverarbeitung und Datenintegration Unterstützt von Dataflow, einschließlich Dataflow-Vorlagen und SQL, mit denen Daten verarbeitet und in BigQuery und Data Lakes in Cloud Storage eingebunden werden können Dataflow-Vorlagen zum Verschieben von Daten von Pub/Sub zu Cloud Storage, BigQuery und anderen Produkten sind in der Pub/Sub- und Dataflow-UI in der Google Cloud Console verfügbar. Die Integration in Apache Spark ist auch verfügbar, insbesondere, wenn die Verwaltung mit Dataproc erfolgt. Zum Aufstellen von Integrations- und Verarbeitungspipelines, die auf Spark + Dataproc ausgeführt werden, können Sie Data Fusion verwenden.
  • Monitoring, Benachrichtigungen und Logging. Wird von Monitoring- und Logging-Produkten unterstützt.
  • Authentifizierung und IAM. Pub/Sub basiert auf einer Standard-OAuth-Authentifizierung, die von anderen Google Cloud-Produkten verwendet wird, und unterstützt eine detaillierte IAM-Unterstützung. Dadurch wird die Zugriffssteuerung für einzelne Ressourcen aktiviert.
  • APIs: Pub/Sub verwendet standardmäßige BeyondCorp- und REST Service API-Technologien zusammen mit Clientbibliotheken für mehrere Sprachen.
  • Trigger, Benachrichtigungen und Webhooks: Pub/Sub bietet Push-basierte Nachrichtenzustellung als HTTP-POST-Anfragen an Webhooks. Sie können die Workflowautomatisierung mit Cloud Functions oder anderen serverlosen Produkten implementieren.
  • Orchestrierung. Pub/Sub kann deklarativ in serverlose mehrere Workflows eingebunden werden. Die Big Data-Orchestrierung und die analytische Orchestrierung erfolgen häufig mit Cloud Composer, das Pub/Sub-Trigger unterstützt.

Wichtige Konzepte

  • Thema: Eine benannte Ressource, an die Nachrichten von Publishern gesendet werden.
  • Abo: Eine benannte Ressource, die für den Nachrichtenstream aus einem einzelnen bestimmten Thema steht und an die abonnierende Anwendung gesendet werden soll. Weitere Informationen zu Abos und zur Semantik der Nachrichtenzustellung finden Sie im Abonnentenleitfaden.
  • Nachricht: Die Kombination aus Daten und (optionalen) Attributen, die ein Publisher an ein Thema sendet und die letztendlich an die Abonnenten gesendet wird.
  • Nachrichtenattribut: Ein Schlüssel/Wert-Paar, das ein Publisher für eine Nachricht definieren kann. Beispielsweise könnten der Schlüssel iana.org/language_tag und der Wert en zu Nachrichten hinzugefügt werden, um sie für einen englischsprachigen Abonnenten als lesbar zu markieren.
  • Publisher Eine Anwendung, die Nachrichten an ein oder mehrere Themen erstellt und sendet.
  • Abonnent:in Eine Anwendung mit einem Abo für ein oder mehrere Themen, um Nachrichten von diesem zu erhalten.
  • Bedingungen Ein Signal, das von einem Abonnenten an Pub/Sub gesendet wird, nachdem es eine Nachricht erhalten hat. Bestätigte Nachrichten werden aus der Warteschlange für Abo-Nachrichten entfernt.
  • Drücken und ziehen. Die beiden Methoden zur Nachrichtenzustellung Ein Abonnent empfängt Nachrichten entweder per Pub/Sub, indem er sie an den vom Abonnenten ausgewählten Endpunkt sendet, oder durch den Abonnenten, der sie vom Dienst abruft.

Publisher-Abonnenten-Beziehungen können 1:n-Beziehungen (Fan-Out), n:1-Beziehungen (Fan-in) und n:n-Beziehungen sein, wie im folgenden Diagramm dargestellt:

Publisher-Abonnenten-Beziehungen

Das folgende Diagramm zeigt, wie eine Nachricht von einem Publisher an einen Abonnenten übergeben wird. Bei der Push-Übermittlung ist die Bestätigung implizit in der Antwort auf die Push-Anfrage enthalten, während für die Pull-Übermittlung ein separater RPC erforderlich ist.

Nachrichtenlebenszyklus

Weitere Informationen