默认情况下,Cloud Run 会根据传入请求的数量缩减实例数。但是,如果您的服务要求缩短延迟时间,并且您希望限制冷启动次数,则您可以通过指定要保持备用状态并准备处理请求的容器实例数下限来更改此默认行为。 如需详细了解此优化,请参阅一般开发提示。
以这种方式保持运行的实例会按空闲费率产生结算费用。最小实例数将在空闲时保持运行状态,可随时处理请求,但如果没有处理请求,CPU 将会受到限制。
本页面介绍了如何使用“实例数下限”设置为您的服务启用空闲实例。
修订版本和最少的实例
只有在能够对修订版本进行寻址时,系统才会启动最少的实例。如果满足以下任一条件,则系统能够对修订版本进行寻址:
- 修订版本收到了一定比例的流量
- 系统向修订版本分配了修订版本标记
设置和更新最少的实例
任何配置更改都会导致新修订版本的创建。后续修订版本也将自动采用此配置设置,除非您进行了明确更新。
默认情况下,容器实例关闭了 min-instances
(设置为 0
)。您可以在创建新服务或部署新修订版本时使用 Cloud Console、gcloud 命令行或 YAML 文件更改此默认值:
控制台
如果您是要配置一个新服务来作为部署目标,请点击创建服务。如果您要配置现有服务,请点击该服务,然后点击修改和部署新的修订版本。
在“高级设置”下,点击容器。
在“实例数下限”字段中,指定要保持备用状态以准备接收请求的所需容器实例数量。
点击创建或部署。
命令行
您可以使用以下命令更新给定服务的 min-instance
:
gcloud beta run services update SERVICE --min-instances MIN-VALUE
替换
- 将 SERVICE 替换为您的服务名称。
- 将 MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定
default
即可清除所有实例下限设置。
您还可以在部署期间使用以下命令设置 min-instance
:
gcloud beta run deploy --image IMAGE_URL --min-instances MIN-VALUE
替换
- 将
IMAGE_URL
替换为对容器映像的引用(例如gcr.io/myproject/my-image:latest
)。 - 将 MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定
default
即可清除所有实例下限设置。
YAML
您可以使用 gcloud run services describe --format export
命令下载并查看现有服务配置,该命令会生成清理后的 YAML 格式的结果。然后,您可以使用 gcloud beta run services replace
命令修改下述字段并上传修改后的 YAML。请务必仅修改记录的字段。
要查看和下载配置,请运行以下命令:
gcloud run services describe SERVICE --format export > service.yaml
更新
autoscaling.knative.dev/minScale:
特性:spec: template: metadata: annotations: autoscaling.knative.dev/minScale: 'MIN-INSTANCE'
替换
- 将 MIN-INSTANCE 替换为要保持备用状态以准备接收请求的所需实例数量。
使用以下命令将服务替换为其新配置:
gcloud beta run services replace service.yaml