O que é o Pub/Sub e o Pub/Sub Lite?

Nesta página, você vai entender o Pub/Sub, por que as empresas usam o Pub/Sub e as vantagens do Pub/Sub em comparação com tecnologias semelhantes. Além disso, aprenda sobre os principais conceitos do Pub/Sub, incluindo os termos "tópico", "editor" e "assinante".

O Pub/Sub é um serviço de mensagens assíncrono e escalonável que separa e serviços que produzem mensagens a partir dos serviços que processam essas mensagens.

Com o Pub/Sub, os serviços se comunicam de maneira assíncrona, com latência de aproximadamente 100 milissegundos.

O Pub/Sub é usado na análise de streaming e em pipelines de integração para processar e distribuir dados. É igualmente eficaz middleware orientado a mensagens para integração de serviços ou como uma fila para carregar tarefas em paralelo.

Com o Pub/Sub, é possível criar sistemas de produtores e consumidores de eventos, chamados de editores e assinantes. Os editores se comunicam com os assinantes de forma assíncrona transmitindo eventos, em vez de realizar chamadas de procedimento remoto (RPCs) síncronas.

Os editores enviam eventos ao serviço Pub/Sub, sem considerar como ou quando esses eventos serão processados. Em seguida, o Pub/Sub entrega eventos a todos os serviços que reagem a eles. Nos sistemas que se comunicam por RPCs, os publicadores precisam esperar que os assinantes recebam os dados. No entanto, a integração assíncrona no Pub/Sub aumenta a flexibilidade e a robustez do sistema como um todo.

Para começar a usar o Pub/Sub, confira a Guia de início rápido sobre como usar o console do Google Cloud. Para ver uma introdução mais completa, consulte Como criar um sistema de mensagens do Pub/Sub.

Casos de uso comuns

  • Ingestão de eventos do servidor e interação do usuário. Para usar eventos de interação do usuário provenientes de apps do usuário final ou eventos do servidor do seu sistema, encaminhe-os para o Pub/Sub. Em seguida, use uma ferramenta de processamento de stream, como o Dataflow, que envia os eventos para bancos de dados. Exemplos desses bancos de dados são BigQuery, Bigtable e Cloud Storage. O Pub/Sub permite coletar eventos de muitos clientes simultaneamente.

  • Distribuição de eventos em tempo real. Eventos, brutos ou processados, podem ser para vários aplicativos na sua equipe e organização com tempo de processamento. O Pub/Sub é compatível com um "Barramento de eventos empresarial" e padrões de design de aplicativos orientados a eventos. O Pub/Sub permite a integração com muitos sistemas do Google que exportam eventos para ele.

  • Replicação de dados entre bancos de dados. O Pub/Sub é muito usado para distribuir eventos de alteração de bancos de dados. Esses eventos podem ser usados para criar uma visualização do estado do banco de dados e do histórico de estados no BigQuery e em outros sistemas de armazenamento de dados.

  • Processamento e fluxos de trabalho paralelos. É possível distribuir muitas tarefas entre vários workers usando mensagens do Pub/Sub para se conectar aos Cloud Run functions. Exemplos dessas tarefas são compactar arquivos de texto, enviar notificações por e-mail, avaliar modelos de IA e reformatar imagens.

  • Barramento de eventos empresariais. Crie um barramento de compartilhamento de dados em tempo real para toda a empresa. Com ele, você distribui eventos empresariais e de análise e atualizações de bancos de dados por toda a organização.

  • Streaming de dados de aplicativos, serviços ou dispositivos de IoT. Por exemplo, um aplicativo SaaS pode publicar um feed de eventos em tempo real. Ou um sensor residencial pode transmitir dados para o Pub/Sub para uso em outros produtos do Google Cloud por um pipeline do Dataflow.

  • Atualizar caches distribuídos. Por exemplo, um aplicativo pode publicar de invalidação para atualizar os IDs de objetos que foram alterados.

  • Balanceamento de carga para aumentar a confiabilidade. Por exemplo, instâncias de um serviço podem ser implantados no Compute Engine em várias zonas, mas assinam um tópico comum. Quando o serviço falha em qualquer zona, os outros podem continuar com a carga automaticamente.

Tipos de serviços do Pub/Sub

O Pub/Sub consiste em dois serviços:

  • Serviço Pub/Sub. Esse serviço de mensagens é o padrão para a maioria dos usuários e aplicativos. Oferece a mais alta confiabilidade e o maior conjunto de integrações, além do gerenciamento automático de capacidade. O Pub/Sub garante a replicação síncrona de todos os dados até pelo menos duas zonas e replicação de melhor esforço para uma terceira zona adicional.

  • Serviço Pub/Sub Lite. Uma mensagem separada, mas semelhante serviço criado por um custo menor. Ele oferece uma confiabilidade menor em comparação com o Pub/Sub. Ele oferece armazenamento de tópicos zonal ou regional. Os tópicos zonais do Lite são armazenados em apenas zona. Os tópicos regionais do Lite replicam dados em um segundo zona de forma assíncrona. Além disso, o Pub/Sub Lite exige que você pré-provisione e gerencie a capacidade de processamento e armazenamento. Considere o Pub/Sub Lite apenas para aplicativos em que alcançar um custo baixo justifica algum trabalho operacional adicional e diminui a confiabilidade.

Para mais detalhes sobre as diferenças entre o Pub/Sub e o Pub/Sub Lite, consulte Como escolher o Pub/Sub ou o Pub/Sub Lite.

Comparação entre o Pub/Sub e outras tecnologias de mensagens

O Pub/Sub combina a escalonabilidade horizontal Apache Kafka e Pulsar com recursos encontrados no middleware de mensagens tradicional, como Apache ActiveMQ e o RabbitMQ. Exemplos desse tipo de recurso são filas de mensagens inativas e filtragem.

Outro recurso do middleware de mensagens que o Pub/Sub adotou paralelismo por mensagem, em vez de mensagens baseadas em partição. "leases" do Pub/Sub mensagens individuais para clientes assinantes e, em seguida, rastreia se uma determinada mensagem é processada com sucesso.

Em comparação, outros sistemas de mensagens usam partições na escalonabilidade horizontal. Isso obriga os assinantes a processar mensagens em cada partição na ordem e limita o número de clientes simultâneos à quantidade de partições. Processamento por mensagem maximiza o paralelismo dos aplicativos do assinante e ajuda a garantir independência de editor/assinante.

Compare a comunicação serviço a serviço e de serviço ao cliente

O Pub/Sub é voltado para a comunicação entre serviços, e não para a comunicação com clientes de IoT ou usuários finais. Outros produtos oferecem um suporte melhor aos demais padrões:

É possível combinar esses serviços para criar padrões "cliente -> serviços -> banco de dados". Por exemplo, consulte o tutorial Como fazer streaming de mensagens do Pub/Sub para WebSockets.

Integrações

O Pub/Sub oferece muitas integrações com outros produtos do Google Cloud para você criar um sistema de mensagens completo:

  • Processamento de stream e integração de dados. Compatível com o Dataflow, incluindo os modelos e o SQL do Dataflow, que permitem o processamento e a integração de dados no BigQuery e data lakes no Cloud Storage. Os modelos do Dataflow para mover dados do Pub/Sub para o Cloud Storage, BigQuery e outros produtos estão disponíveis nas IUs do Pub/Sub e do Dataflow no console do Google Cloud. A integração com o Apache Spark, principalmente quando gerenciada com o Dataproc, também está disponível. Com o Data Fusion, você visualiza os pipelines de integração e processamento executados no Spark e Dataproc.
  • Monitoramento, alertas e geração de registros. Com suporte do Monitoring e do Logging.
  • Autenticação e IAM. O Pub/Sub depende de um padrão OAuth usada por outros produtos do Google Cloud e oferece suporte a IAM granular, e ativar o controle de acesso para recursos individuais.
  • APIs. O Pub/Sub usa as APIs de serviço gRPC e REST padrão do Google e bibliotecas de cliente em várias linguagens.
  • Gatilhos, notificações e webhooks. O Pub/Sub oferece modelos de entrega de mensagens como solicitações POST HTTP para webhooks. É possível implementar a automação do fluxo de trabalho usando o Cloud Functions. ou outros produtos sem servidor.
  • Orquestração. O Pub/Sub pode ser integrado de maneira declarativa a fluxos de trabalho sem servidor de várias etapas. A orquestração analítica e de big data geralmente são feitas com o Cloud Composer, que é compatível com os gatilhos do Pub/Sub. Também é possível integrar o Pub/Sub com a Integração de aplicativos (pré-lançamento), que é uma solução de integração de plataforma como serviço (iPaaS). Aplicação A integração oferece Gatilho do Pub/Sub para acionar ou iniciar integrações.
  • Conectores de integração (pré-lançamento). Esses conectores permitem que você se conecte a várias fontes de dados. Com os conectores, os serviços do Google Cloud e os aplicativos comerciais de terceiros são expostos às suas integrações por uma interface padrão transparente. No Pub/Sub, você pode criar uma conexão do Pub/Sub para usar nas integrações.

Principais conceitos

  • Tópico. Um recurso nomeado para o qual os editores enviam mensagens.
  • Assinatura. Um recurso nomeado que representa o fluxo de mensagens de um tópico único e específico, para ser entregue ao aplicativo assinante. Para ver mais detalhes sobre assinaturas e a semântica da entrega de mensagens, consulte o Guia do assinante.
  • Mensagem. A combinação de dados e atributos (opcionais) que um editor envia a um tópico e que é entregue aos assinantes.
  • Atributo da mensagem. Um par de chave-valor que um editor pode definir para uma mensagem. Por exemplo, a chave iana.org/language_tag e o valor en podem ser adicionados às mensagens para marcá-las como legíveis por um assinante que fala inglês.
  • Editor. Um aplicativo que cria e envia mensagens para um ou vários tópicos.
  • Assinante. Um aplicativo com assinatura de um ou vários tópicos para receber mensagens dele.
  • Confirmação (ou "ack"). Um sinal enviado por um assinante ao Pub/Sub depois recebeu uma mensagem. As mensagens confirmadas são removidas da fila de mensagens de inscrição.
  • Push e pull. Os dois métodos de entrega de mensagens. Um assinante recebe as mensagens enviando-as pelo Pub/Sub ao assinante o endpoint escolhido ou pelo assinante que os extrai do serviço.

A relação entre editor e assinante pode ser de um para muitos (fan-out), de muitos para um (fan-in) e de muitos para muitos. É o que mostra o diagrama a seguir:

Relacionamentos entre editor e assinante

O diagrama a seguir mostra como uma mensagem é transmitida de um editor a um assinante. Na entrega por push, o acuse de recebimento é implícito na resposta à solicitação de push, enquanto a entrega por pull requer uma RPC separada.

Ciclo de vida das mensagens

Próximas etapas