Cuotas y límites de Pub/Sub

Google Cloud usa cuotas para restringir cuánto puedes usar de un recurso compartido en particular de Google Cloud. Cada cuota representa un recurso contable específico, como las llamadas a la API a un servicio en particular, la cantidad de bytes enviados a un servicio específico o la cantidad de conexiones de transmisión que tu proyecto usa en simultáneo.

Muchos servicios también tienen límites que no están relacionados con el sistema de cuotas. Estas son restricciones fijas, como los tamaños máximos de mensajes o la cantidad de recursos de Pub/Sub que puedes crear en un proyecto, y que no se pueden aumentar ni disminuir.

Ve y administra cuotas

En un proyecto determinado, puedes usar el panel de cuotas de IAM y administración para ver los límites y el uso actuales de la cuota. También puedes usar este panel para hacer lo siguiente:

  • Reducir los límites de tu cuota
  • Iniciar un proceso para solicitar límites de cuota más altos

Para obtener más información sobre la supervisión y las alertas del uso de la cuota, consulta Monitoring.

Atribución del uso de la cuota

Para la capacidad de procesamiento de suscriptores de envío, se cobra el uso de cuotas al proyecto que contiene la suscripción de envío. Este es el proyecto que aparece en el nombre de la suscripción.

Para todas las demás cuotas, el uso se cobra al proyecto asociado con las credenciales especificadas en la solicitud. El uso de la cuota no se cobra al proyecto que contiene el recurso solicitado.

Por ejemplo, si una cuenta de servicio en el proyecto A envía una solicitud de publicación para realizar una publicación en un tema del proyecto B, la cuota se cobra al proyecto A. En algunos casos, es posible que desees que el uso de la cuota se cobre en otro proyecto. Puedes usar el parámetro del sistema X-Goog-User-Project para cambiar el proyecto para la atribución de cuota. Para obtener más información sobre X-Goog-User-Project, consulta Parámetros del sistema.

Puedes usar gcloud CLI para configurar el proyecto de atribución de cuota para una solicitud específica. Gcloud CLI envía el encabezado de la solicitud X-Goog-User-Project.

Debes tener la función roles/serviceusage.serviceUsageConsumer o una personalizada con el permiso serviceusage.services.use en el proyecto que usarás para la atribución de cuota.

En el siguiente ejemplo, se muestra cómo obtener una lista de suscripciones en el proyecto RESOURCE_PROJECT mientras se cobra la cuota de operaciones de administrador en el proyecto QUOTA_PROJECT. Ejecuta el siguiente comando en la terminal de Google Cloud CLI:

gcloud pubsub subscriptions list --project=
RESOURCE_PROJECT --billing-project=
QUOTA_PROJECT

Reemplaza QUOTA_PROJECT por el ID del proyecto de Google Cloud en el que quieres cobrar la cuota.

Ten en cuenta que, en Pub/Sub, el proyecto facturado siempre es el que contiene el recurso. Solo puedes cambiar el proyecto para la atribución de cuota.

Cuotas de Pub/Sub

Las cuotas que se muestran en la siguiente tabla se pueden ver y editar por proyecto en el panel de cuotas de API y servicios.

Las cuotas regionales se dividen en los siguientes 3 tipos:

  • Regiones grandes: europe-west1, europe-west4, us-central1, us-east1, us-east4, us-west1 y us-west2
  • Regiones medianas: asia-east1, asia-northeast1, asia-southeast1, europe-west2, europe-west3
  • Regiones pequeñas: el resto de las regiones

Las cuotas de entrega “exactamente una vez” son específicas de una región. Verifica los detalles de cada región en la siguiente tabla.

Cuota Límite de cuota predeterminado Descripción
Capacidad de procesamiento del publicador por región
  • 240,000,000 KB por minuto (4 GB/s) en regiones grandes
  • 48,000,000 KB por minuto (800 MB/s) en regiones medianas
  • 12,000,000 KB por minuto (200 MB/s) en regiones pequeñas

pubsub.googleapis.com/regionalpublisher

El uso de la cuota depende del tamaño de los PubsubMessage publicados:

Ten en cuenta que se pueden incluir varios mensajes en una sola solicitud de publicación, y no hay un cargo de cuota adicional por mensaje.

Capacidad de procesamiento del suscriptor de operaciones de extracción por región
  • 240,000,000 KB por minuto (4 GB/s) en regiones grandes
  • 48,000,000 KB por minuto (800 MB/s) en regiones medianas
  • 24,000,000 KB por minuto (400 MB/s) en regiones pequeñas

pubsub.googleapis.com/regionalsubscriber

El uso de la cuota depende del tamaño de los PubsubMessage publicados:

Capacidad de procesamiento de la confirmación de recepción por región
  • 240,000,000 KB por minuto (4 GB/s) en regiones grandes
  • 48,000,000 KB por minuto (800 MB/s) en regiones medianas
  • 24,000,000 KB por minuto (400 MB/s) en regiones pequeñas

pubsub.googleapis.com/regionalacknowledger

El uso de la cuota se basa en el tamaño de las solicitudes Acknowledge y ModifyAckDeadline:

Capacidad de procesamiento de envío y exportación de suscriptores por región
  • 26,400,000 KB por minuto (440 MB/s) en regiones grandes
  • 8,400,000 KB por minuto (140 MB/s) en regiones medianas
  • 2,400,000 KB por minuto (40 MB/s) en regiones pequeñas

pubsub.googleapis.com/regionalpushsubscriber

Para las solicitudes de entrega de envío realizadas al extremo de envío, el uso de la cuota depende del tamaño de los PubsubMessage enviados.

Capacidad de procesamiento del suscriptor de StreamingPull por región
  • 240,000,000 KB por minuto (4 GB/s) en regiones grandes
  • 48,000,000 KB por minuto (800 MB/s) en regiones medianas
  • 24,000,000 KB por minuto (400 MB/s) en regiones pequeñas

pubsub.googleapis.com/regionalstreamingpullsubscriber

El uso de la cuota depende del tamaño de los PubsubMessage transmitidos al suscriptor:

Ten en cuenta que las bibliotecas cliente usan operaciones StreamingPull siempre que sea posible.

Cantidad de conexiones de StreamingPull abiertas por región
  • 72,000 conexiones abiertas a la vez en regiones grandes
  • 48,000 conexiones abiertas a la vez en regiones medianas
  • 24,000 conexiones abiertas a la vez en regiones pequeñas

pubsub.googleapis.com/regionalstreamingpullconnections

Cantidad de conexiones de StreamingPull abiertas en un momento determinado. Consulta StreamingPull.

Operaciones del administrador 6,000 por minuto (100 ops/s)

pubsub.googleapis.com/administrator

Se cobra cada operación de administrador, como GetTopicRequest, como una unidad en esta cuota.

Get*, List*, Create*, Delete*, Update*, ModifyPushConfig, SetIamPolicy, GetIamPolicy, TestIamPermissions, ValidateSchema, ValidateMessage, CommitSchema, RollbackSchema, DeleteSchemaRevision, ListSchemaRevisions y DetachSubscription son operaciones de administrador.

Cantidad de mensajes consumidos desde suscripciones con entrega exactamente una vez habilitada por región
  • 1,000,000 mensajes por minuto en us-central1
  • 700,000 mensajes por minuto en us-east1
  • 300,000 mensajes por minuto en us-west1
  • 180,000 mensajes por minuto en otras regiones

pubsub.googleapis.com/exactlyoncedeliveredmessagecount

El uso de la cuota se basa en la cantidad de PubsubMessage que consume el suscriptor:

Cantidad de mensajes confirmados o cuya fecha límite se extiende cuando se usan suscripciones con la entrega exacta una vez habilitada por región
  • 10,000,000 mensajes por minuto en us-central1
  • 7,000,000 de mensajes por minuto en us-east1
  • 3,000,000 mensajes por minuto en us-west1
  • 1,800,000 mensajes por minuto en otras regiones

pubsub.googleapis.com/exactlyonceackcount

El uso de la cuota se basa en la cantidad de IDs de confirmación de recepción en las solicitudes Acknowledge y ModifyAckDeadline:

Unidades de cuota de capacidad de procesamiento

Se mide el uso de cuotas de capacidad de procesamiento en unidades de 1 KB. 1 KB equivale a 1,000 bytes. Por ejemplo, en una PublishRequest con 105 mensajes de 50 bytes cada uno, el tamaño de los datos del usuario es 105 * 50 bytes = 5250 bytes, por lo que el uso de la cuota es max(1kB, ceil(5250 bytes/1000)) = 6kB.

Límites de recursos

Recurso Límites
Proyecto 10,000 temas
10,000 suscripciones adjuntas o desconectadas
5,000 instantáneas
10,000 esquemas
Tema 10,000 suscripciones adjuntas
5,000 instantáneas adjuntas
Si se configura la retención de mensajes de temas, los mensajes publicados en un tema se pueden conservar en el almacenamiento persistente por hasta 31 días desde el momento de la publicación.
Suscripción De forma predeterminada, retiene los mensajes no confirmados en el almacenamiento persistente durante 7 días desde el momento de la publicación. No hay límite para la cantidad de mensajes retenidos.
Si los suscriptores no usan una suscripción, esta vencerá. El período de vencimiento predeterminado es de 31 días.
Esquema Tamaño del esquema (el campo definition): 50 KB
Revisiones por esquema: 20
Solicitud de publicación 10 MB (tamaño total)
1,000 mensajes
Mensaje Tamaño del mensaje (el campo data): 10 MB
Atributos por mensaje: 100
Tamaño de la clave del atributo: 256 bytes
Tamaño del valor del atributo: 1,024 bytes
Transmisiones de StreamingPull 10 MB/s por transmisión abierta
Respuesta de extracción unaria Cantidad máxima de mensajes en la respuesta de extracción: 1,000
Tamaño máximo de la respuesta de extracción: 10 MB
Mensajes de Pull/StreamingPull El servicio podría imponer límites en la cantidad total de mensajes de StreamingPull pendientes por conexión. Si alcanzas esos límites, aumenta la tasa a la que se reconocen los mensajes y la cantidad de conexiones que usas.
Confirmar y modificar solicitudes ModifyAckPlazo 512 KB (tamaño total)
Cómo ordenar claves Si los mensajes tienen claves de orden, la capacidad de procesamiento máxima del publicador es de 1 MBps por cada clave de ordenamiento.

Usa una cuenta de servicio para cuotas más altas

Si usas la herramienta de gcloud de Google Cloud CLI con una cuenta de usuario normal (es decir, una cuenta que no es de servicio), las operaciones de Pub/Sub están limitadas a una tasa adecuada para operaciones manuales. Las tasas que superan este límite generan el error RESOURCE_EXHAUSTED. La solución es asegurarte de estar usando las credenciales de una cuenta de servicio. Si deseas usar credenciales de gcloud CLI en la automatización, activa una cuenta de servicio para tus operaciones de Pub/Sub.

Usa extremos de ubicación para enrutar solicitudes

Si tienes cuota adicional en regiones específicas, puedes enrutar las solicitudes a esas regiones con extremos locales de Pub/Sub. Cuando publicas mensajes en un extremo global, el servicio de Pub/Sub puede enrutar el tráfico a una región que no tiene una cuota suficiente.

Cuotas que no coinciden

Puede ocurrir que las cuotas no coincidan cuando los mensajes publicados o recibidos son de menos de 1,000 bytes. Por ejemplo:

  • Si publicas 10 mensajes de 500 bytes en solicitudes diferentes, el uso de cuota de tu publicador será de 10,000 bytes. Esto se debe a que los mensajes de menos de 1,000 bytes se redondean de forma automática al siguiente incremento de 1,000 bytes.

  • Si recibes esos 10 mensajes en una sola respuesta de extracción, tu uso de cuota de suscriptor podría ser de solo 5 KB, ya que se combina el tamaño real de cada mensaje para determinar la cuota general.

  • Lo opuesto también se cumple. El uso de la cuota de suscriptores podría superar el de la cuota de publicadores si publicas varios mensajes en una sola solicitud de publicación o recibes los mensajes en solicitudes de extracción diferentes.