Cloud Run 配额和限制

本页面介绍使用 Cloud Run 时需遵循的用量配额和限制。

Cloud Run 资源的数量是有限的。Cloud Run 的配额包含 API 速率限制,这些限制会影响 Cloud Run Admin API 的调用速率。

以下各项不存在直接限制:

  • 您可以部署的容器映像大小
  • 一项 Cloud Run 服务可以处理的并发请求数。

Cloud Run 的资源限制

如需超出可增加的限额,请申请增加配额。如需超出无法增加的每项目限额,请在其他 Google Cloud 项目或区域中创建新资源。

资源 范围 说明 限制 是否可以增加?
服务 每个项目和区域 服务数上限 1000
作业 每个项目和区域 作业数上限 1000
作业执行 每个项目和区域 正在运行的作业执行数上限 1000
修订版本 每项服务 每项服务的修订版本数上限。达到上限后,系统将按照历史顺序自动删除未在使用中的修订版本 1000
修订版本 每个项目和区域 处理流量的修订版本数上限 4000
修订版本标记 每个项目和区域 修订版本标记数量上限。当修订版本标记的数量达到此限制时,系统将按历史顺序自动删除没有流量百分比的标记。 2000
作业执行 每个作业 已完成的作业执行次数的保留限制。当作业的已完成执行次数达到此限制时,系统将按历史顺序自动删除执行次数 1000
作业执行任务1 每次执行作业 并行运行的任务数上限 取决于所选区域以及 CPU内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
作业执行任务 每次执行作业 任务超时值上限 24 小时
作业执行任务 每次执行作业 单个作业中的任务数上限 10000
作业执行任务 每次执行作业 作业中的任务重试次数上限 10
容器实例1 每个修订版本 容器实例数上限 取决于所选区域以及 CPU 和内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
容器实例1 每个项目和区域 所有正在运行的作业执行的容器实例数上限 取决于所选区域以及 CPU内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
容器实例2 每个修订版本和区域 使用直接 VPC 出站流量的容器实例数上限 100-200,具体取决于所选的区域配置。
容器实例 每个容器实例 启动超时(以分钟为单位) 4
内存 每个容器实例 内存大小上限(以 GiB 为单位) 32
CPU 每个容器实例 vCPU 数量上限 8
CPU 每个项目和区域 在 1 分钟内,所有实例分配的总 CPU 上限(以毫微 vCPU 为单位)。 取决于所选区域。此限制在高容量区域可能较高,在最近打开的区域可能较低。
内存 每个项目和区域 在 1 分钟内,所有实例分配的总内存上限(以字节为单位)。 取决于所选区域。此限制在高容量区域可能较高,在最近打开的区域可能较低。
GPU 实例3 按项目和区域 带有 GPU 的容器实例数上限 03
磁盘 每个容器实例 可写内存中文件系统大小上限(受实例内存限制,以 GiB 为单位) 32
环境变量 每个变量 变量长度上限(以 Kb 为单位) 32
网域映射 每个顶级网域和每周 SSL 证书数量上限 50
网域映射 每个顶级网域和每周 重复的 SSL 证书数量上限 5
访问令牌 每个容器实例每秒 生成的唯一访问令牌数量上限 50
身份令牌 每个容器实例每秒 生成的唯一身份令牌数量上限 50
已打开的文件数 每个容器实例 可以同时打开的文件数上限。对应于
/proc/sys/fs/file-max
25000

1此区域配额用于以下几种情况:

  1. 它控制可以为修订版本的实例数上限特性选择的最大值。在给定区域中授予该配额后,该区域中的所有修订版本都可以达到授予的上限。

  2. 它控制作业的最大并行性。在指定区域中授予该配额后,该区域中的所有作业都可以达到授予的上限。

  3. 它控制在一个区域中运行作业执行的容器实例总数。

2此区域配额用于以下几种情况:

  1. 它控制可以为使用直接 VPC 出站流量的修订版本的实例数上限属性选择的最大值。在给定区域中授予该配额后,该区域中的所有修订版本都可以达到授予的上限。

  2. 它控制使用直接 VPC 出站流量的作业的最大并行性。在指定区域中授予该配额后,该区域中的所有作业都可以达到授予的上限。

3 如需访问 GPU,您必须为 Total Nvidia L4 GPU allocation, per project per region 申请增加配额

Cloud Run 的网络限制

Cloud Run 的请求限制

说明 限制 备注
每个实例的并发请求数上限 1000
每个 HTTP/2 客户端连接的并发流数量上限 100
每个请求的超时前的最长时间 60 分钟
HTTP/1 请求大小上限 如果使用 HTTP/1 服务器,则为 32 MiB。如果使用 HTTP/2 服务器,则无限制。
HTTP/1 响应大小上限 如果未使用 Transfer-Encoding: chunked 或流式传输机制,则为 32 MiB
每个实例每秒的出站连接数 700
每个实例每秒的出站 DNS 解析次数 1000
每个实例每秒发送到 HTTP/1 容器端口的入站请求数 800 不适用于 HTTP/2 容器端口。

Cloud Run 的带宽限制

以下带宽限制适用于 Cloud Run 实例:

说明 限制 备注
每个实例通过直接 VPC 的出站流量的位数上限 1 Gbps 通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。
每个实例的位数上限,不包括通过直接 VPC 的出站流量 600 Mbps 基于入站流量位数和出站流量位数的总和,不包括通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。
每个实例的数据包总速率上限,不包括通过直接 VPC 的出站流量 每秒 64,000 个数据包 基于入站流量数据包数和出站流量数据包数的总和,不包括通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。

如果达到这两个限制中的任何一个,则 Cloud Run 实例的带宽将受限。

Cloud Run Admin API 速率限制

以下速率限制适用于 Cloud Run Admin API,但不适用于传送至您部署的 Cloud Run 服务的请求。

配额 说明 限制 能否增加? 范围
Cloud Run Admin API 读取请求数 每个区域每 60 秒的 API 读取次数。这不是向您的 Cloud Run 服务发出的读取请求数,后者不受限制。 每 60 秒 3,000 次 每个项目和区域
Cloud Run Admin API 写入请求数 每个区域每 60 秒的 API 写入次数。这不是向您的 Cloud Run 服务发出的写入请求数,后者不受限制。 每 60 秒 180 次 每个项目和区域
作业运行 每个区域每 60 秒可执行的作业次数上限。 每 60 秒 180 次 每个项目和区域

如何增加配额

如需申请更高的配额值,请按以下步骤操作:

  1. 进入配额和系统限制页面:

  2. 配额列中,找到要增加的配额。使用过滤条件搜索框来搜索配额。

  3. 选中配额左侧的复选框。

  4. 点击 修改。此时将显示配额更改表单。

  5. 配额更改表单中,在新限制字段中输入项目所需增加的配额。

  6. 填写表单中的任何其他字段,然后点击完成

  7. 点击提交请求

虽然上述过程适用于大多数配额提升请求,但可能会遇到以下异常之一:

  • 如果存在用量上限,则必须先移除用量上限,然后才能增加配额。系统会向您显示披露信息和协议。该披露信息指出用量上限将被删除,并且限额将立即更新为默认限额。然后,Google Cloud 将正常处理您的配额增加申请。

  • 有时,Google Cloud 控制台会将您重定向至单独表单,以申请增加限额。提交表单后,Google Cloud 会通过电子邮件确认您的申请。

  • 有些配额无法使用 Google Cloud 控制台进行更新。如果您发现无法在控制台中更改配额,请通过 Cloud Customer Care 申请增加配额。结算团队不会处理配额调整。

Google 建议您为各类资源创建不同的配额增加请求。例如,您应该将每个项目的网络配额增加量与非网络 Compute Engine 配额增加量分开。如果组合不同类别的请求,并且批准需要更多评估时间,则增加请求可能会延迟该批次。

如果您的配额增加请求需要批准,Google Cloud 会发送电子邮件确认收到您的请求。如果需要进一步的帮助,您可以回复该电子邮件。审核您的请求后,Cloud Customer Care 会向您发送电子邮件,告知您配额增加是被批准还是被拒绝。该电子邮件会提供配额增加的生效日期(如果适用)。

如需详细了解配额增加流程的工作原理,请参阅配额增加申请简介