设置容器实例数量上限

了解如何设置可用于 Knative serving 服务的容器实例数量上限。通过在 Knative serving 中指定实例数量上限,您可以限制服务响应传入请求的扩缩范围。使用此设置可以控制您的费用或限制与备份服务(如数据库)的连接数。

如需详细了解 Knative serving 自动扩缩容器实例的方式,请参阅实例自动扩缩

设置和更新实例数量上限

任何配置更改都会导致新修订版本的创建。后续修订版本也将自动采用此配置设置,除非您进行了明确更新。

默认情况下,容器实例数量可以无限扩容。您可以在部署新服务或更新现有服务和部署修订版本时使用 Google Cloud 控制台或 Google Cloud CLI 设置实例数上限:

控制台

  1. 在 Google Cloud 控制台中前往 Knative serving:

    前往 Knative serving

  2. 如果您是要配置一个新服务来作为部署目标,请点击创建服务。如果您要配置现有服务,请点击该服务,然后点击修改和部署新的修订版本

  3. 在“高级设置”下,点击容器

  4. “实例数上限”字段中,指定所需的容器实例数上限。

  5. 点击下一步以转到下一部分。

  6. 配置此服务的触发方式部分,选择您想使用哪个连接来调用服务。

  7. 点击创建以将映像部署到 Knative serving,然后等待部署完成。

命令行

  • 对于现有服务,请运行带有 --max-instances 参数的 gcloud run services update 命令来设置容器实例数上限:

    gcloud run services update SERVICE --max-instances MAX-VALUE

    您需要进行如下替换:

    • SERVICE 替换为您的服务名称。
    • MAX-VALUE 替换为所需的容器实例数上限。指定 default 即可清除所有实例上限设置。
  • 对于新服务,请运行带有 --max-instances 参数的 gcloud run deploy 命令来设置容器实例数上限:

    gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE

    您需要进行如下替换:

    • SERVICE 替换为您的服务名称。
    • IMAGE_URL 替换为对容器映像的引用,例如 gcr.io/cloudrun/hello
    • MAX-VALUE 替换为所需的容器实例数上限。指定 default 即可清除所有实例上限设置。

YAML

您可以使用 gcloud run services describe 命令和 --format=export 标志将现有服务的配置下载到的 YAML 文件中。然后,您可以使用 gcloud run services replace 命令修改该 YAML 文件并部署这些更改。您必须确保仅修改指定的属性。

  1. 将服务配置下载到本地工作区上名为 service.yaml 的文件中:

    gcloud run services describe SERVICE --format export > service.yaml

    SERVICE 替换为您的 Knative serving 服务的名称。

  2. 在本地文件中,更新 autoscaling.knative.dev/maxScale: 属性:

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    您需要进行如下替换

    • MAX-INSTANCE 替换为所需的数量上限。
  3. 使用以下命令将服务的配置替换为新配置:

    gcloud run services replace service.yaml