使用最少的实例

默认情况下,Cloud Run 会根据传入请求的数量缩减实例数。但是,如果您的服务要求缩短延迟时间,并且您希望限制冷启动次数,则您可以通过指定要保持备用状态并准备处理请求的容器实例数下限来更改此默认行为。 如需详细了解此优化,请参阅一般开发提示

以这种方式保持运行状态的实例会产生结算费用。 由于这些费用非常易于预测,因此 Google 建议您购买承诺使用折扣

最少的实例将在空闲时保持运行状态,可随时处理请求。请注意,如果您需要在请求之外使用 CPU,则可以将 CPU 配置为始终分配。您可以随时重启最少的实例。

本页面介绍了如何使用“实例数下限”设置为您的服务启用空闲实例。

修订版本和最少的实例

只有在能够对修订版本进行寻址时,系统才会启动最少的实例。如果满足以下任一条件,则系统能够对修订版本进行寻址:

  • 修订版本收到了一定比例的流量
  • 系统向修订版本分配了修订版本标记

设置和更新最少的实例

任何配置更改都会导致新修订版本的创建。后续修订版本也将自动采用此配置设置,除非您进行了明确更新。

默认情况下,容器实例关闭了 min-instances(设置为 0)。您可以在创建新服务部署新修订版本时使用 Cloud Console、gcloud 命令行或 YAML 文件更改此默认值:

控制台

  1. 转到 Cloud Run

  2. 如果您是要配置一个新服务来作为部署目标,请点击创建服务。如果您要配置现有服务,请点击该服务,然后点击修改和部署新的修订版本

  3. 如果您要配置新服务,请根据需要填写初始服务设置页面,然后点击下一步 > 高级设置,以访问服务配置页面。

  4. 点击容器标签页。

    图片

  5. 在“实例数下限”字段中,指定要保持备用状态以准备接收请求的所需容器实例数量。

  6. 点击创建部署

命令行

您可以使用以下命令更新给定服务的 min-instance

gcloud run services update SERVICE --min-instances MIN-VALUE

替换

  • SERVICE 替换为您的服务名称。
  • MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定 default 即可清除所有实例下限设置。

您还可以在部署期间使用以下命令设置 min-instance

gcloud run deploy --image IMAGE_URL --min-instances MIN-VALUE

替换

  • IMAGE_URL 替换为对容器映像的引用(例如 us-docker.pkg.dev/cloudrun/container/hello:latest)。
  • MIN-VALUE 替换为要保持备用状态以准备接收请求的所需容器实例数量。指定 default 即可清除所有实例下限设置。

YAML

您可以使用 gcloud run services describe --format export 命令下载并查看现有服务配置,该命令会生成清理后的 YAML 格式的结果。然后,您可以使用 gcloud run services replace 命令修改下述字段并上传修改后的 YAML。请务必仅修改记录的字段。

  1. 要查看和下载配置,请运行以下命令:

    gcloud run services describe SERVICE --format export > service.yaml
  2. 更新 autoscaling.knative.dev/minScale: 特性:

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/minScale: 'MIN-INSTANCE' 

    替换

    • MIN-INSTANCE 替换为要保持备用状态以准备接收请求的所需实例数量。
  3. 使用以下命令将服务替换为其新配置:

    gcloud run services replace service.yaml

查看实例数下限设置

如需查看服务的当前实例数下限设置,请执行以下操作:

控制台

  1. 转到 Cloud Run

  2. 点击您感兴趣的服务以打开“服务详细信息”页面。

  3. 点击修订版本标签页。

  4. 在右侧的详细信息面板中,“容器”标签页下列出了实例数下限设置。

命令行

  1. 使用以下命令:

    gcloud run services describe SERVICE
  2. 在返回的配置中找到实例数下限设置。