了解如何通过配置“实例数下限”设置来为服务启用空闲实例。
默认情况下,Knative serving 会根据传入请求的数量来扩缩实例数量。但是,如果您的服务要求缩短延迟时间,并且您希望限制冷启动次数,则可以通过指定要保持运行状态并准备处理请求的容器实例数下限来更改此默认行为。
以这种方式保持运行状态的实例会产生结算费用。
修订版本和最少的实例
只有在能够对修订版本进行寻址时,系统才会启动最少的实例。如果满足以下任一条件,则系统能够对修订版本进行寻址:
- 修订版本收到了一定比例的流量。
- 系统向修订版本分配了修订版本标记。
设置和更新最少的实例
任何配置更改都会导致新修订版本的创建。后续修订版本也将自动采用此配置设置,除非您进行了明确更新。
默认情况下,容器实例关闭了 min-instances
(设置为 0
)。您可以在部署新服务或更新现有服务和部署修订版本时使用 Google Cloud 控制台或 Google Cloud CLI 来更改此默认设置:
控制台
在 Google Cloud 控制台中前往 Knative serving:
如果您是要配置一个新服务来作为部署目标,请点击创建服务。如果您要配置现有服务,请点击该服务,然后点击修改和部署新的修订版本。
在“高级设置”下,点击容器。
在“实例数下限”字段中,指定要保持备用状态以准备接收请求的所需容器实例数量。
点击下一步以转到下一部分。
在配置此服务的触发方式部分,选择您想使用哪个连接来调用服务。
点击创建以将映像部署到 Knative serving,然后等待部署完成。
命令行
对于现有服务,请运行带有
--min-instances
参数的gcloud run services update
命令来设置容器实例数下限:gcloud run services update SERVICE --min-instances MIN-VALUE
您需要将其中的:
- 将 SERVICE 替换为您的服务名称。
- 将 MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定
default
即可清除所有实例下限设置。
对于新服务,请运行带有
--min-instances
参数的gcloud run deploy
命令来设置容器实例数下限:gcloud run deploy SERVICE --image=IMAGE_URL --min-instances MIN-VALUE
您需要将其中的:
- 将 SERVICE 替换为您的服务名称。
- 将 IMAGE_URL 替换为对容器映像的引用,例如
gcr.io/cloudrun/hello
。 - 将 MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定
default
即可清除所有实例下限设置。
YAML
您可以使用 gcloud run services describe
命令和 --format=export
标志将现有服务的配置下载到的 YAML 文件中。然后,您可以使用 gcloud run services replace
命令修改该 YAML 文件并部署这些更改。您必须确保仅修改指定的属性。
将服务配置下载到本地工作区上名为
service.yaml
的文件中:gcloud run services describe SERVICE --format export > service.yaml
将 SERVICE 替换为您的 Knative serving 服务的名称。
在本地文件中,更新
autoscaling.knative.dev/minScale:
属性:spec: template: metadata: annotations: autoscaling.knative.dev/minScale: 'MIN-INSTANCE'
您需要将其中的:
- 将 MIN-VALUEcode> 替换为保持备用状态以准备接收请求的容器实例数量。指定
default
即可清除所有实例下限设置。
- 将 MIN-VALUEcode> 替换为保持备用状态以准备接收请求的容器实例数量。指定
使用以下命令将服务替换为其新配置:
gcloud run services replace service.yaml