配额和限制

本文档列出了适用于媒体 CDN 的quotasquotas

配额用于限制您的 Google Cloud 项目可使用的共享 Google Cloud 资源(包括硬件、软件和网络组件)的数量。因此,有以下功能的系统具有配额:

  • 监控 Google Cloud 产品和服务的使用情况或消耗情况。
  • 出于某些原因限制这些资源的消耗量,包括确保公平性和减少使用量高峰。
  • 维护可自动强制执行规定限制的配置。
  • 提供请求或更改配额的方法。

在大多数情况下,当超过配额时,系统会立即阻止对相关 Google 资源的访问,并且您尝试执行的任务将失败。在大多数情况下,配额适用于每个 Google Cloud 项目,并由使用该 Google Cloud 项目的所有应用和 IP 地址共享。

媒体 CDN 资源也存在限制。这些限制与配额系统无关。除非另有说明,否则无法更改限制。

限制

以下限制适用于媒体 CDN。

配置

错误 限制 Notes
EdgeCacheService 的数量上限 每个项目 20 个 如需提高此限制,请与您的 Google Cloud 销售团队联系。
EdgeCacheOrigin 的数量上限 每个项目 30 个 如需提高此限制,请与您的 Google Cloud 销售团队联系。
EdgeCacheKeyset 的数量上限 每个项目 10 个 如需提高此限制,请与您的 Google Cloud 销售团队联系。
EdgeCacheServiceRouteRules 数量上限 2000

每个 EdgeCacheService 最多可以定义 10 个 PathMatchers,每个 PathMatcher 最多可以定义 200 个 RouteRules

此限制无法提高。

每项服务的 SSL 证书数量上限 5 此限制无法提高。另请参阅 SSL 证书的每个项目配额
每个 EdgeCacheKeyset 的公钥数量上限 3 此限制无法提高。一个密钥集中的多个密钥旨在启用密钥轮替:随着时间的推移,您应该移除较旧的和未使用的密钥。
每个 EdgeCacheKeyset 的验证共享密钥数量上限 3 此限制无法提高。一个密钥集中的多个密钥旨在启用密钥轮替:随着时间的推移,您应该移除较旧的和未使用的密钥。

HTTP 标头、请求和响应

错误 限制 Notes
请求标头大小上限 大约 11 KiB 此限制无法提高。

请求网址和请求标头的总大小不能超过 15 KiB。

对于 HTTP/1.1 连接,请求将被拒绝并返回 HTTP 431 响应。

HTTP/2 连接会在不写入响应代码的情况下关闭。

如果启用了日志记录,系统会使用 statusDetailsheaders_too_long 来记录这些请求。

请求正文大小上限 16 KiB 正文超过此限制的请求会被拒绝,并返回 HTTP 413 Content Too Large 状态代码。
响应标头大小上限 约 128 KiB 此限制无法提高。

如果源响应的标头超过此限制,则会导致向客户端发送 HTTP 502。如果启用了日志记录,则通过 statusDetailsbackend_response_headers_too_long 来记录这些事件。

可缓存对象大小上限 100 GiB 此限制无法提高。

这是媒体 CDN 可以在源站缓存的对象大小上限。较大的对象被视为不可缓存。

不可缓存响应大小上限 500 MiB 此限制无法提高。

这是当某个对象不可缓存时,媒体 CDN 代理的响应正文中的最大字节数。 无法缓存的响应在达到上限后会被截断。

标头的小写转换 始终,对于媒体 CDN 对于请求和响应标头的字母大小写,媒体 CDN 遵循 HTTP/2 惯例。

无论使用何种协议,所有标头都将转换为小写。

例如,Host 会变为 hostKeep-Alive 会变为 keep-alive

标头值的情况不变。

API 请求速率限制

如果您需要提高 API 请求的速率限制,则可以查看当前使用情况并请求提高限制。

错误 限制
失效操作 每分钟 10 次/EdgeCacheService
networkservices 命名空间以外的所有调用 每个项目每分钟 1200 次调用
只读:GetEdgeCache*ListEdgeCache* 每个项目每分钟 100 次
读/写:networkservices 命名空间中未标记为只读的所有内容 每个项目每分钟 100 次

客户端超时

超时 时长上限 响应代码 说明
Maximum request duration 5 分钟 HTTP 408 (Request Timeout) 单个请求-响应的最大时长。
Header timeout 10 秒 HTTP 408 (Request Timeout) 客户端必须发送全部请求标头的时间。

源超时

  • connectTimeoutmaxAttemptsTimeout 限制媒体 CDN 需要多长时间才能找到可用响应。

    这两个超时都包含源站返回标头以及确定是使用故障切换还是重定向所需的时间。connectTimeout 会单独应用于每次源站尝试,而 maxAttemptsTimeout 包括在所有源站尝试(包括故障切换和重定向)中建立连接所需的时间。跟踪重定向会计为额外尝试连接到源站,并计入为所配置源站设置的 maxAttempts

    当媒体 CDN 遇到非重定向响应(例如来自重定向或故障切换源站)时,系统将应用 readTimeoutresponseTimeout 值。重定向的来源使用为遇到重定向的 EdgeCacheOrigin 配置的 connectTimeoutreadTimeoutresponseTimeout 值。

  • responseTimeoutreadTimeout 用于控制流式传输响应所需的时间。在媒体 CDN 确定将使用上游响应后,connectTimeoutmaxAttemptsTimeout 都无关紧要。此时,readTimeoutresponseTimeout 生效。

无论每个 EdgeCacheOrigin 设置的 maxAttempts 如何,媒体 CDN 最多会在所有源站尝试四次。媒体 CDN 使用主 EdgeCacheOrigin 中的 maxAttemptsTimeout 值。每次尝试超时值(connectTimeoutreadTimeoutresponseTimeout)针对每次尝试的 EdgeCacheOrigin 进行配置。

下表介绍了超时字段:

字段 默认 说明
connectTimeout 5 秒

媒体 CDN 从启动请求到源站,直到媒体 CDN 确定响应是否可用为止的最长时间。实际上,connectTimeout 涵盖了从创建请求开始,然后执行 DNS 查找,最后执行 TLS 握手和 TCP/QUIC 连接建立的时间,包括获取包含 HTTP 状态代码的响应标头。

超时值必须介于 1 秒到 15 秒之间。

maxAttemptsTimeout 15 秒

尝试连接到来源(包括故障切换来源)的最大总次数,达到此上限后,系统会向客户端返回错误。如果达到超时限制,系统会先返回 HTTP 504,然后再返回响应。

超时值必须介于 1 秒到 30 秒之间。

此设置定义了所有来源连接尝试(包括故障切换来源)的总时长,以限制客户端必须等待内容开始流式传输的总时长。仅使用第一个 maxAttemptsTimeout 值,其中第一个值由为指定路线配置的出发地定义。

readTimeout 15 秒

单个 HTTP 响应的读取之间等待的最大时长。readTimeoutresponseTimeout 的限制。所有 HTTP 响应读取都必须在 responseTimeout 设置的截止期限之前完成。超时值必须介于 1 秒到 30 秒之间。如果在响应完成之前达到此超时时间,响应将会被截断并记录。

responseTimeout 30 秒

完成回答所允许的最大时长。

超时值必须介于 1 秒到 120 秒之间。

该时长从收到第一个正文字节开始计算。如果在响应完成之前达到此超时时间,响应将会被截断并记录。

管理配额

出于各种原因,Media CDN 会对资源用量实施配额限制。例如,配额可避免出现意料之外的用量突增,从而为 Google Cloud 用户社区提供保护。配额还可帮助正在通过免费层级探索 Google Cloud 的用户避免中断试用。

所有项目在开始时都具有相同的配额,您可以通过申请更多配额来进行更改。根据您使用产品的情况,一些配额可能会自动增加。

权限

如需查看配额或申请增加配额,Identity and Access Management (IAM) 主账号需要具备以下某个角色:

任务 所需角色
检查项目的配额 以下之一:
修改配额,申请更多配额 以下之一:
  • Project Owner (roles/owner)
  • Project Editor (roles/editor)
  • Quota Administrator (roles/servicemanagement.quotaAdmin)
  • 具有 serviceusage.quotas.update 权限的自定义角色

查看您的配额

控制台

  1. 在 Google Cloud 控制台中,转到配额页面。

    转到“配额”

  2. 如需搜索要更新的配额,请使用过滤表。 如果您不知道配额的名称,请使用此页面上的链接。

gcloud

使用 Google Cloud CLI 运行以下命令来查看您的配额。请将 PROJECT_ID 替换为您自己的项目 ID。

      gcloud compute project-info describe --project PROJECT_ID

如需查看您在某一区域中已使用的配额,请运行以下命令:

    gcloud compute regions describe example-region
    

超出配额时引发的错误

如果在发出 gcloud 命令时超过了配额,gcloud 会显示一条 quota exceeded 错误消息,并返回退出代码 1

如果在发出 API 请求时超出了配额,Google Cloud 会返回以下 HTTP 状态代码:413 Request Entity Too Large

申请更多配额

如需增加或减少大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请更高的配额

控制台

  1. 在 Google Cloud 控制台中,转到配额页面。

    转到“配额”

  2. 配额页面上,选择您要更改的配额。
  3. 点击位于页面顶部的修改配额
  4. 名称部分,输入您的名称。
  5. 可选:在手机部分,输入手机号码。
  6. 提交您的申请。 配额申请需要 24 到 48 小时才能完成处理。

资源可用性

每个配额代表您可以创建的特定类型资源的数量上限(如果该资源可用)。请务必注意,配额保证资源可用性。即使您具有可用配额,如果新资源不可用,您也无法创建新资源。

例如,您的配额可能足以在 us-central1 区域中创建新的区域性外部 IP 地址。但是,如果该区域中没有可用的外部 IP 地址,则无法执行此操作。区域级资源可用性也会影响您能否创建新资源。

导致资源在整个区域不可用的情况非常罕见。但是,地区内的资源有时可能会耗尽,通常不会影响资源类型的服务等级协议 (SLA)。如需了解详情,请参阅资源的相关 SLA。