O que é o Pub/Sub e o Pub/Sub Lite?

description: Entenda como o Pub/Sub e o Pub/Sub Lite funcionam e os diferentes termos associados a eles

O Pub/Sub é um serviço de mensagens assíncrono e escalonável que separa os serviços que produzem mensagens dos serviços que as processam.

O Pub/Sub permite que os serviços se comuniquem de maneira assíncrona, com latências de 100 milissegundos.

O Pub/Sub é usado na análise de streaming e em pipelines de integração para processar e distribuir dados. É igualmente eficaz como um middleware voltado para mensagens para integração de serviços ou como uma fila para carregar tarefas em paralelo.

Com o Pub/Sub, é possível criar sistemas de produtores e consumidores de eventos, chamados de editores e assinantes. Os editores se comunicam com os assinantes de forma assíncrona transmitindo eventos, em vez de realizar chamadas de procedimento remoto (RPCs) síncronas.

Os editores enviam eventos ao serviço Pub/Sub, sem considerar como ou quando esses eventos serão processados. Em seguida, o Pub/Sub envia eventos para todos os serviços que reagem a eles. Nos sistemas que se comunicam por RPCs, os editores precisam esperar os assinantes receberem os dados. No entanto, a integração assíncrona no Pub/Sub aumenta a flexibilidade e a robustez do sistema geral.

Para começar a usar o Pub/Sub, confira o Guia de início rápido sobre o uso do console do Google Cloud. Para ver uma introdução mais completa, consulte Como criar um sistema de mensagens do Pub/Sub.

Casos de uso comuns

  • Interação do usuário para ingestão e eventos do servidor. Para usar eventos de interação do usuário de apps do usuário final ou eventos de servidor do seu sistema, encaminhe-os para o Pub/Sub. Em seguida, é possível usar uma ferramenta de processamento de stream, como o Dataflow, que envia os eventos aos bancos de dados. Exemplos desses bancos de dados são BigQuery, Bigtable e Cloud Storage. Com o Pub/Sub, é possível coletar eventos de vários clientes simultaneamente.

  • Distribuição de eventos em tempo real. Eventos, brutos ou processados, podem ser disponibilizados a vários aplicativos em sua equipe e organização para processamento em tempo real. Pub/Sub dá suporte a um "barramento de eventos da empresa" e padrões de design de aplicativos orientados a eventos. O Pub/Sub permite a integração com muitos sistemas do Google que exportam eventos para o Pub/Sub.

  • Replicação de dados entre bancos de dados. O Pub/Sub é comumente usado para distribuir eventos de alteração de bancos de dados. Esses eventos podem ser usados para criar uma visualização do estado do banco de dados e do histórico de estados no BigQuery e em outros sistemas de armazenamento de dados.

  • Processamento e fluxos de trabalho paralelos. É possível distribuir com eficiência muitas tarefas entre vários workers usando mensagens do Pub/Sub para se conectar ao Cloud Functions. Exemplos dessas tarefas incluem compactação de arquivos de texto, envio de notificações por e-mail, avaliação de modelos de IA e reformatação de imagens.

  • Barramento de eventos empresariais. É possível criar um barramento de compartilhamento de dados em tempo real para toda a empresa, distribuindo eventos de negócios, atualizações de banco de dados e eventos de análise em toda a organização.

  • Streaming de dados de aplicativos, serviços ou dispositivos IoT. Por exemplo, um aplicativo de SaaS pode publicar um feed de eventos em tempo real. Ou um sensor residencial pode transmitir dados ao Pub/Sub para uso em outros produtos do Google Cloud por meio de um pipeline do Dataflow.

  • Atualizar caches distribuídos. Por exemplo, um aplicativo pode publicar eventos de invalidação para atualizar os IDs de objetos que foram modificados.

  • Balanceamento de carga para aumentar a confiabilidade. Por exemplo, as instâncias de um serviço podem ser implantadas no Compute Engine em várias zonas, mas se inscreverem em um tópico comum. Quando o serviço falha em qualquer zona, os outros podem retomar a carga automaticamente.

Tipos de serviços do Pub/Sub

O Pub/Sub consiste em dois serviços:

  • Serviço Pub/Sub. Esse serviço de mensagens é a escolha padrão para a maioria dos usuários e aplicativos. Ele oferece a maior confiabilidade e o maior conjunto de integrações, além do gerenciamento automático de capacidade. O Pub/Sub garante a replicação síncrona de todos os dados em pelo menos duas zonas e a replicação de melhor esforço para uma terceira zona adicional.

  • Serviço Pub/Sub Lite. Um serviço de mensagens separado, mas semelhante, criado por um custo menor. Ele oferece menor confiabilidade em comparação com o Pub/Sub. Ele oferece armazenamento de tópicos zonal ou regional. Os tópicos do Lite zonal são armazenados em apenas uma zona. Os tópicos regionais do Lite replicam dados de forma assíncrona em uma segunda zona. Além disso, o Pub/Sub Lite exige que você pré-provisione e gerencie o armazenamento e a capacidade de processamento. Considere usar o Pub/Sub Lite apenas para aplicativos em que um custo baixo justifica mais algum trabalho operacional e menor confiabilidade.

Para mais detalhes sobre as diferenças entre o Pub/Sub e o Pub/Sub Lite, consulte Como escolher o Pub/Sub ou o Pub/Sub Lite.

Comparação entre o Pub/Sub e outras tecnologias de mensagens

O Pub/Sub combina a escalonabilidade horizontal do Apache Kafka e do Pulsar (links em inglês) com recursos encontrados no middleware de mensagens tradicional, como Apache ActiveMQ e RabbitMQ. Exemplos desses recursos são filas de mensagens inativas e filtragem.

Outro recurso que o Pub/Sub adota do middleware de mensagens é o paralelismo por mensagem, em vez de mensagens baseadas em partição. O Pub/Sub "aloca" mensagens individuais para clientes assinantes e controla se uma determinada mensagem foi processada com êxito.

Em comparação, outros sistemas de mensagens usam partições na escalonabilidade horizontal. Isso obriga os assinantes a processar mensagens em cada partição na ordem e limita o número de clientes simultâneos à quantidade de partições. O processamento por mensagem maximiza o paralelismo dos aplicativos do assinante e ajuda a garantir a independência de editor/assinante.

Comparar a comunicação entre serviços e serviço a cliente

O Pub/Sub é voltado para a comunicação entre serviços, e não para a comunicação com clientes de IoT ou usuários finais. Outros produtos oferecem um suporte melhor aos demais padrões:

É possível combinar esses serviços para criar padrões "cliente -> serviços -> banco de dados". Por exemplo, consulte o tutorial Como fazer streaming de mensagens do Pub/Sub para WebSockets.

Integrações

O Pub/Sub oferece muitas integrações com outros produtos do Google Cloud para você criar um sistema de mensagens completo:

  • Processamento de stream e integração de dados. Compatível com o Dataflow, incluindo modelos e SQL do Dataflow, que permitem o processamento e a integração de dados no BigQuery e data lakes no Cloud Storage. Os modelos do Dataflow para mover dados do Pub/Sub para o Cloud Storage, BigQuery e outros produtos estão disponíveis nas IUs do Pub/Sub e do Dataflow no console do Google Cloud. A integração com o Apache Spark, principalmente quando gerenciada com o Dataproc, também está disponível. A composição visual dos pipelines de integração e processamento em execução no Spark + Dataproc pode ser realizada com o Data Fusion.
  • Monitoramento, alertas e geração de registros. Com suporte dos produtos Monitoring e Logging.
  • Autenticação e IAM. O Pub/Sub depende de uma autenticação OAuth padrão usada por outros produtos do Google Cloud e oferece suporte ao IAM granular, permitindo o controle de acesso de recursos individuais.
  • APIs. O Pub/Sub usa tecnologias de API de serviço REST e gRPC padrão com bibliotecas de cliente para várias linguagens.
  • Acionadores, notificações e webhooks. O Pub/Sub oferece entrega baseada em push de mensagens como solicitações HTTP POST para webhooks. Implemente a automação do fluxo de trabalho usando o Cloud Functions ou outros produtos sem servidor.
  • Orquestração. O Pub/Sub pode ser integrado de maneira declarativa a fluxos de trabalho sem servidor de várias etapas. Big Data e orquestração analítica geralmente realizadas com o Cloud Composer, que é compatível com os acionadores do Pub/Sub. Também é possível integrar o Pub/Sub com a Integração de aplicativos (Prévia), que é uma solução de integração de plataforma como serviço (iPaaS). A integração de aplicativos fornece um acionador do Pub/Sub para acionar ou iniciar integrações.
  • Conectores de integração. (Prévia) Com estes connectors, é possível se conectar a várias fontes de dados. Com os conectores, os serviços do Google Cloud e aplicativos comerciais de terceiros são expostos às suas integrações por meio de uma interface padrão e transparente. Para o Pub/Sub, você pode criar uma conexão Pub/Sub para uso nas suas integrações.

Principais conceitos

  • Tópico. Um recurso nomeado para o qual os editores enviam mensagens.
  • Assinatura. Um recurso nomeado que representa o fluxo de mensagens de um tópico específico, a ser entregue ao aplicativo assinante. Para ver mais detalhes sobre assinaturas e a semântica da entrega de mensagens, consulte o Guia do assinante.
  • Mensagem. A combinação de dados e atributos (opcionais) que um editor envia a um tópico e é entregue aos assinantes.
  • Atributo da mensagem. Um par de chave-valor que um editor pode definir para uma mensagem. Por exemplo, a chave iana.org/language_tag e o valor en podem ser adicionados às mensagens para marcá-las como legíveis por um assinante que fala inglês.
  • Editor: Um aplicativo que cria e envia mensagens para um ou vários tópicos.
  • Assinante. Um aplicativo com uma assinatura em um ou vários tópicos para receber mensagens dele.
  • Confirmação (ou "ack"). Um sinal enviado por um assinante ao Pub/Sub depois de receber uma mensagem com sucesso. As mensagens confirmadas são removidas da fila de mensagens de assinatura.
  • Empurrar e extrair. Os dois métodos de entrega de mensagens. Um assinante recebe mensagens pelo Pub/Sub enviando-as para o endpoint escolhido pelo assinante ou pelo assinante que as extrai do serviço.

A relação entre editor e assinante pode ser de um para muitos (fan-out), de muitos para um (fan-in) e de muitos para muitos. É o que mostra o diagrama a seguir:

Relacionamentos entre editor e assinante

O diagrama a seguir mostra como uma mensagem é transmitida de um editor a um assinante. Para entrega por push, a confirmação está implícita na resposta à solicitação de push, enquanto para entrega por pull ela requer uma RPC separada.

Ciclo de vida das mensagens

Próximas etapas