常见的误区和限制

使用 Cloud Tasks 时,您可能会遇到以下问题和限制:

执行顺序

除计划在将来运行的任务外,任务队列没有明确的执行顺序。无法保证或尽力尝试按照特定顺序执行任务。具体来说:除非队列完全清空,否则无法保证先执行旧任务。很多用户都遇到新任务的执行时间比旧任务早的情况,而且没有定式,随时都会改变。

重复执行

Cloud Tasks 力求实现严格的“执行一次”语义。但是,在面临保证执行和重复执行只取其一的情况下,服务宁愿重复执行也要保证执行。 因此,系统无法保证完全杜绝重复执行。开发者应采取措施确保重复执行不是灾难性事件。在生产中,超过 99.999% 的任务仅执行一次。

资源限制

立即处理队列时最常见的积压问题就是耗尽目标实例上的资源。如果用户企图在仅可每秒处理 10 个请求的前端实例上每秒执行 100 个任务,就会产生积压。这通常有两种表现形式,其中任何一种一般都可以通过增加处理请求的实例数来解决。

退避时间错误和强制执行速率

过载的服务器会返回 HTTP 响应代码 503 形式的退避时间错误。Cloud Tasks 将减慢执行速度直至错误停止,以此应对这些错误。您可以通过查看 Cloud Console 中的“强制速率”字段来了解这一点。

转到 Cloud Tasks 页面

延时峰值和最大并发数

过载的服务器还会出现延迟时间大幅增加的响应。 在这种情况下,请求保持打开状态的时间会更长。由于队列以任务的最大并发数运行,这可能导致队列无法按照预期速率执行任务。如果该值设置得太低,造成了人为的速率限制,那么为受影响的队列增加 max_concurrent_tasks 会有所帮助。但增加 max_concurrent_tasks 不太可能减轻任何潜在的资源压力。