¿Qué es Pub/Sub?

Pub/Sub es un servicio de mensajería asíncrona y escalable que separa los servicios que producen mensajes de aquellos que procesan esos mensajes.

Pub/Sub permite que los servicios se comuniquen de forma asíncrona, con latencias de alrededor de 100 milisegundos.

Pub/Sub se usa para las canalizaciones de integración de datos y análisis de transmisiones a fin de cargar y distribuir datos. Es igual de efectivo que el middleware orientado a la mensajería para la integración de servicios o como una cola con el fin de paralelizar las tareas.

Pub/Sub te permite crear sistemas de productores y consumidores de eventos, llamados publicadores y suscriptores. Los publicadores se comunican con los suscriptores de forma asíncrona mediante la transmisión de eventos, en lugar de llamadas de procedimiento remoto (RPC) síncronas.

Los publicadores envían eventos al servicio de Pub/Sub, sin importar cómo o cuándo se procesarán estos eventos. Luego, Pub/Sub entrega eventos a todos los servicios que reaccionan a ellos. En los sistemas que se comunican a través de RPC, los publicadores deben esperar a que los suscriptores reciban los datos. Sin embargo, la integración asíncrona en Pub/Sub aumenta la flexibilidad y solidez del sistema general.

Para comenzar a usar Pub/Sub, consulta la guía de inicio rápido sobre el uso de la consola de Google Cloud . Para obtener una introducción más completa, consulta Compila un sistema de mensajería de Pub/Sub.

Casos de uso habituales

  • Transferir la interacción del usuario y los eventos del servidor Para usar eventos de interacción del usuario desde apps de usuario final o eventos de servidor desde tu sistema, puedes reenviarlos a Pub/Sub. Luego, puedes usar una herramienta de procesamiento de flujos, como Dataflow, que entrega los eventos a las bases de datos. Algunos ejemplos de estas bases de datos son BigQuery, Bigtable y Cloud Storage. Pub/Sub te permite recopilar eventos de muchos clientes de forma simultánea.
  • Distribución de eventos en tiempo real. Los eventos sin procesar o procesados pueden estar disponibles para varias aplicaciones en tu equipo y organización para su procesamiento en tiempo real. Pub/Sub admite un “bus de eventos empresarial” y patrones de diseño de aplicaciones basados en eventos. Pub/Sub te permite integrar muchos sistemas que exportan eventos a Pub/Sub.
  • Replicar datos entre bases de datos: Por lo general, Pub/Sub se usa para distribuir eventos de cambios desde bases de datos. Estos eventos se pueden usar para crear una vista del estado de la base de datos y el historial de estados en BigQuery y otros sistemas de almacenamiento de datos.
  • Procesamiento y flujos de trabajo paralelos: Puedes distribuir de manera eficiente muchas tareas entre varios trabajadores mediante el uso de mensajes de Pub/Sub para comunicarte con ellos. Algunos ejemplos de estas tareas son comprimir archivos de texto, enviar notificaciones por correo electrónico, evaluar modelos de IA y cambiar el formato de las imágenes.
  • Bus de eventos empresariales: Puedes crear un bus para compartir datos en tiempo real en toda la empresa, que distribuya eventos empresariales, actualizaciones de bases de datos y eventos estadísticos en toda tu organización.
  • Transmisión de datos desde aplicaciones, servicios o dispositivos de la IoT. Por ejemplo, una aplicación de SaaS puede publicar un feed de eventos en tiempo real. También, un sensor residencial puede transmitir datos a Pub/Sub para usarlos en otros productos de Google Cloud a través de una canalización de procesamiento de datos.
  • Actualización de cachés distribuidas. Por ejemplo, una aplicación puede publicar eventos de invalidación para actualizar los IDs de los objetos que cambiaron.
  • Balanceo de cargas para la confiabilidad: Por ejemplo, las instancias de un servicio se pueden implementar en Compute Engine en varias zonas, pero se suscriben a un tema común. Cuando el servicio falla en cualquier zona, las demás pueden detectar la carga de forma automática.

Compara Pub/Sub con otras tecnologías de mensajería

Pub/Sub combina la escalabilidad horizontal de Apache Kafka y Pulsar con funciones que se encuentran en el middleware de mensajería, como Apache ActiveMQ y RabbitMQ. Algunos ejemplos de estas funciones son las colas de mensajes no entregados y los filtros.

Otra característica que Pub/Sub adopta en el middleware de mensajería es el paralelismo por mensaje, en lugar de la mensajería basada en particiones. Pub/Sub “asigna tiempo” a mensajes individuales a clientes suscriptores y, luego, realiza un seguimiento de si un mensaje determinado se procesó de forma correcta.

Por el contrario, otros sistemas de mensajería escalables de forma horizontal usan particiones para el escalamiento horizontal. Esto obliga a los suscriptores a procesar mensajes en cada partición en orden y limita la cantidad de clientes simultáneos a la cantidad de particiones. El procesamiento por mensaje maximiza el paralelismo de las aplicaciones de suscriptores y ayuda a garantizar la independencia del publicador y del suscriptor.

Compara la comunicación de servicio a servicio y de servicio a cliente

Pub/Sub está diseñado para la comunicación de servicio a servicio en lugar de la comunicación con los usuarios finales o los clientes de IoT. Otros patrones son más compatibles con otros productos:

Puedes usar una combinación de estos servicios para compilar patrones de cliente -> servicios -> base de datos. Por ejemplo, consulta el instructivo Transmite mensajes de Pub/Sub a través de WebSockets.

Integraciones

Pub/Sub tiene muchas integraciones con otros productos de Google Cloud para crear un sistema de mensajería con todas las funciones:

  • Procesamiento de transmisiones y de integración de datos. Compatible con Dataflow, incluidas las plantillas y SQL de Dataflow, que permiten el procesamiento y la integración de datos en BigQuery y data lakes en Cloud Storage. Las plantillas de Dataflow para mover datos de Pub/Sub a Cloud Storage, BigQuery y otros productos están disponibles en las IU de Pub/Sub y Dataflow en la consola deGoogle Cloud . La integración con Apache Spark, en especial cuando se administra con Dataproc, también está disponible. La composición visual de las canalizaciones de integración y procesamiento que se ejecutan en Spark + Dataproc se puede lograr con Data Fusion.
  • Supervisión, alertas y registros Son compatibles con los productos de Supervisión y Registro.
  • Autenticación y IAM. Pub/Sub se basa en una autenticación de OAuth estándar que usan otros productos de Google Cloud y admite IAM detallada, lo que permite el control de acceso para los recursos individuales.
  • APIs. Pub/Sub usa tecnologías estándar de API de servicios de gRPC y REST junto con bibliotecas cliente para varios lenguajes.
  • Activadores, notificaciones y webhooks Pub/Sub ofrece entrega de mensajes basada en envíos como solicitudes POST HTTP a webhooks. Puedes implementar la automatización de flujos de trabajo con Cloud Functions o cualquier otro producto sin servidores.
  • Organización. Pub/Sub se puede integrar en los flujos de trabajo sin servidores de varios pasos de forma declarativa. La organización analítica y de macrodatos a menudo se realiza con Cloud Composer, que admite activadores de Pub/Sub. También puedes integrar Pub/Sub con la integración de aplicaciones (versión preliminar), que es una solución de plataforma de integración como servicio (iPaaS). Application Integration proporciona un activador de Pub/Sub para activar o iniciar integraciones.
  • Conectores de Integration.(Versión preliminar) Estos conectores te permiten conectarte a varias fuentes de datos. Con los conectores, los servicios de Google Cloud y las aplicaciones empresariales de terceros están expuestos a tus integraciones a través de una interfaz estándar y transparente. En el caso de Pub/Sub, puedes crear una conexión de Pub/Sub para usarla en tus integraciones.

Próximos pasos