扩缩容器资源请求和限制

Autopilot Standard

本页面介绍了如何使用 Pod 纵向自动扩缩在 Google Kubernetes Engine (GKE) 集群中分析和调整容器的 CPU 请求和内存请求。

您可以通过 Google Cloud 控制台手动扩缩容器资源，使用 VerticalPodAutoscaler 对象分析资源，或使用 Pod 纵向自动扩缩配置自动扩缩。

准备工作

在开始之前，请确保您已执行以下任务：

启用 Google Kubernetes Engine API。

启用 Google Kubernetes Engine API

如果您要使用 Google Cloud CLI 执行此任务，请安装并初始化 gcloud CLI。如果您之前安装了 gcloud CLI，请运行 gcloud components update 以获取最新版本。
注意：对于现有 gcloud CLI 安装，请务必设置 compute/region 和 compute/zone 属性。通过设置默认位置，您可以避免 gcloud CLI 中出现以下错误：One of [--zone, --region] must be supplied: Please specify location。

分析资源请求

Pod 纵向自动扩缩器会自动分析容器并提供建议的资源请求。您可以使用 Google Cloud 控制台、Cloud Monitoring 或 Google Cloud CLI 查看这些资源请求。

控制台

要在 Google Cloud 控制台中查看建议的资源请求，您必须部署已存在至少 24 小时的现有工作负载。某些建议可能不适用于某些工作负载或与某些工作负载不相关，例如过去 24 小时内创建的工作负载、独立 Pod 以及使用 Java 编写的应用。

进入 Google Cloud 控制台中的工作负载页面。

转到“工作负载”
在工作负载列表中，点击要扩缩的工作负载的名称。
点击 操作 > 扩缩 > 修改资源请求。

“分析资源利用率数据”部分显示 Pod 纵向自动扩缩器控制器分析的历史使用情况数据，用于在“调整资源请求和限制”部分中创建建议的资源请求。

Cloud Monitoring

如需在 Cloud Monitoring 中查看建议的资源请求，您必须已部署现有工作负载。

转到 Google Cloud 控制台中的 Metrics Explorer 页面。

前往 Metrics Explorer
点击配置。
展开选择指标菜单。
在资源菜单中，选择 Kubernetes 扩缩 (Kubernetes Scale)。
在指标类别 (Metric category) 菜单中，选择自动扩缩器。
在指标菜单中，选择 Recommended per replicate request bytes（每个复制请求建议的字节数）和 Recommended per replica request core（每个副本请求建议的核心）。
点击应用。

gcloud CLI

如需查看建议的资源请求，您必须创建 VerticalPodAutoscaler 对象和 Deployment。

对于 Standard 集群，请为集群启用 Pod 纵向自动扩缩。对于 Autopilot 集群，Pod 纵向自动扩缩默认处于启用状态。
```
gcloud container clusters update CLUSTER_NAME --enable-vertical-pod-autoscaling
```
将 CLUSTER_NAME 替换为您的集群名称。

将以下清单保存为 my-rec-deployment.yaml：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-rec-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-rec-deployment
  template:
    metadata:
      labels:
        app: my-rec-deployment
    spec:
      containers:
      - name: my-rec-container
        image: nginx

此清单描述了一个没有 CPU 或内存请求的 Deployment。containers.name 值为 my-rec-deployment 指定 Deployment 中的所有 Pod 都属于 VerticalPodAutoscaler。

将清单应用于集群：

kubectl create -f my-rec-deployment.yaml

将以下清单保存为 my-rec-vpa.yaml：
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-rec-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-rec-deployment
  updatePolicy:
    updateMode: "Off"
```
此清单描述了 VerticalPodAutoscaler。updateMode 值 Off 意味着，在 Pod 创建后，Pod 纵向自动扩缩器控制器会分析容器的 CPU 和内存需求，并在资源的 status 字段中记录这些建议。Pod 纵向自动扩缩器不会自动更新正在运行的容器的资源请求。
将清单应用于集群：
```
kubectl create -f my-rec-vpa.yaml
```

一段时间后，查看 VerticalPodAutoscaler：

kubectl get vpa my-rec-vpa --output yaml

输出内容类似如下：

...
  recommendation:
    containerRecommendations:
    - containerName: my-rec-container
      lowerBound:
        cpu: 25m
        memory: 262144k
      target:
        cpu: 25m
        memory: 262144k
      upperBound:
        cpu: 7931m
        memory: 8291500k
...

此输出显示针对 CPU 和内存请求的建议。

手动设置 Pod 资源请求

您可以使用 Google Cloud CLI 或 Google Cloud 控制台手动设置 Pod 资源请求。

控制台

转到 Google Cloud 控制台中的工作负载页面。

转到“工作负载”
在工作负载列表中，点击要扩缩的工作负载的名称。
点击 操作 > 扩缩 > 修改资源请求。
1. 调整资源请求和限制部分显示每个容器的当前 CPU 和内存请求以及建议的 CPU 和内存请求。
点击 Apply Latest Suggestions（应用最新建议）以查看为每个容器建议的请求。
点击保存更改。
点击确认。

gcloud

如需为 Pod 设置资源请求，请在 Deployment 清单中设置 requests.cpu 和 memory.cpu 值。在此示例中，您将使用建议的资源请求手动修改在分析资源请求中创建的 Deployment。

将以下示例清单保存为 my-adjusted-deployment.yaml：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-rec-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-rec-deployment
  template:
    metadata:
      labels:
        app: my-rec-deployment
    spec:
      containers:
      - name: my-rec-container
        image: nginx
        resources:
          requests:
            cpu: 25m
            memory: 256Mi

此清单描述了一个具有两个 Pod 的 Deployment。每个 Pod 各有一个请求 25 milliCPU 和 256 MiB 内存的容器。

将清单应用于集群：

kubectl apply -f my-adjusted-deployment.yaml

您还可以通过执行以下步骤来手动应用更改：

转到 Google Cloud 控制台中的工作负载页面。

转到“工作负载”
在工作负载列表中，点击要扩缩的工作负载的名称。
点击 操作 > 扩缩 > 修改资源请求。
配置容器请求。
点击获取等效 YAML (Get Equivalent YAML)。
点击下载工作负载，或将清单复制并粘贴到名为 resource-adjusted.yaml 的文件中。

将清单应用到您的集群：

kubectl create -f resource-adjusted.yaml

自动设置 Pod 资源请求

Pod 纵向自动扩缩会使用 VerticalPodAutoscaler 对象在 updateMode 为 Auto 时自动设置 Pod 上的资源请求。您可以使用 gcloud CLI 或 Google Cloud 控制台配置 VerticalPodAutoscaler。

控制台

如需自动设置资源请求，您必须拥有一个启用了 Pod 纵向自动扩缩功能的集群。Autopilot 集群默认启用 Pod 纵向自动扩缩功能。

启用 Pod 纵向自动扩缩

转到 Google Cloud 控制台中的 Google Kubernetes Engine 页面。

转到 Google Kubernetes Engine
在集群列表中，点击您要修改的集群的名称。
在自动化部分中，点击 Pod 纵向自动扩缩选项对应的修改。
选中启用 Pod 纵向自动扩缩复选框。
点击保存更改。

配置 Pod 纵向自动扩缩

转到 Google Cloud 控制台中的工作负载页面。

进入“工作负载”
在工作负载列表中，点击要为其配置 Pod 纵向自动扩缩的 Deployment 的名称。
点击 操作 > 自动扩缩 > Pod 纵向自动扩缩。
选择自动扩缩模式：
- 自动模式：Pod 纵向自动扩缩会在 Pod 的生命周期内更新 CPU 和内存请求。
- 初始模式：Pod 纵向自动扩缩仅会在创建 Pod 时分配资源请求，之后不再进行更改。
（可选）设置容器政策。通过此选项，您可以确保建议绝不会设置为高于或低于指定的资源请求。
1. 点击 添加政策。
2. 为修改容器模式选择自动。
3. 在受控资源中，选择要自动扩缩容器的资源。
4. 点击添加规则，为容器的资源请求设置一个或多个最小或最大范围：
  - 允许的内存下限：容器应始终具有的内存大小下限（以 MiB 为单位）。
  - 允许的 CPU 下限：容器应始终具有的 CPU 数量下限（以 mCPU 为单位）。
  - 允许的内存上限：容器应始终具有的内存大小上限（以 MiB 为单位）。
  - 允许的 CPU 数量上限：容器应始终具有的 CPU 数量上限（以 mCPU 为单位）。
点击完成。
点击保存。

gcloud

如需自动设置资源请求，您必须使用启用了 Pod 纵向自动扩缩功能的集群。Autopilot 集群默认启用了该功能。

对于 Standard 集群，请为集群启用 Pod 纵向自动扩缩：
```
gcloud container clusters update CLUSTER_NAME --enable-vertical-pod-autoscaling
```
将 CLUSTER_NAME 替换为您的集群名称。

将以下清单保存为 my-auto-deployment.yaml：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-auto-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-auto-deployment
  template:
    metadata:
      labels:
        app: my-auto-deployment
    spec:
      containers:
      - name: my-container
        image: registry.k8s.io/ubuntu-slim:0.1
        resources:
          requests:
            cpu: 100m
            memory: 50Mi
        command: ["/bin/sh"]
        args: ["-c", "while true; do timeout 0.5s yes >/dev/null; sleep 0.5s; done"]

此清单描述了一个具有两个 Pod 的 Deployment。每个 Pod 各有一个请求 100 milliCPU 和 50 MiB 内存的容器。

将清单应用于集群：

kubectl create -f my-auto-deployment.yaml

列出正在运行的 Pod：

kubectl get pods

输出会显示 my-deployment 中的 Pod 的名称：

NAME                            READY     STATUS             RESTARTS   AGE
my-auto-deployment-cbcdd49fb-d6bf9   1/1       Running            0          8s
my-auto-deployment-cbcdd49fb-th288   1/1       Running            0          8s

将以下清单保存为 my-vpa.yaml：
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-auto-deployment
  updatePolicy:
    updateMode: "Auto"
```
此清单描述了具有以下属性的 VerticalPodAutoscaler：
- targetRef.name：指定由名为 my-deployment 的 Deployment 控制的任何 Pod 均属于该 VerticalPodAutoscaler。
- updateMode: Auto：指定 Pod 纵向自动扩缩器控制器可以删除 Pod，调整 CPU 和内存请求，然后启动一个新 Pod。
您还可以使用 updateMode: "Initial" 配置 Pod 纵向自动扩缩，使其仅在创建 Pod 时分配资源请求。
将清单应用于集群：
```
kubectl create -f my-vpa.yaml
```

等待几分钟，然后再次查看正在运行的 Pod：

kubectl get pods

输出显示 Pod 名称已更改：

NAME                                 READY     STATUS             RESTARTS   AGE
my-auto-deployment-89dc45f48-5bzqp   1/1       Running            0          8s
my-auto-deployment-89dc45f48-scm66   1/1       Running            0          8s

如果 Pod 名称未更改，请再稍等片刻，然后再次查看正在运行的 Pod。

查看 Pod 纵向自动扩缩器的相关信息

要查看 Pod 纵向自动扩缩器的详细信息，请执行以下操作：

获取有关正在运行的其中一个 Pod 的详细信息：

kubectl get pod POD_NAME --output yaml

将 POD_NAME 替换为您在上一步中检索到的其中一个 Pod 的名称。

输出类似于以下内容：

apiVersion: v1
kind: Pod
metadata:
  annotations:
    vpaUpdates: 'Pod resources updated by my-vpa: container 0: cpu capped to node capacity, memory capped to node capacity, cpu request, memory request'
...
spec:
  containers:
  ...
    resources:
      requests:
        cpu: 510m
        memory: 262144k
    ...

此输出显示 Pod 纵向自动扩缩器控制器的内存请求为 262144k，CPU 请求为 510 milliCPU。

获取有关 VerticalPodAutoscaler 的详细信息：
```
kubectl get vpa my-vpa --output yaml
```
输出类似于以下内容：
```
...
  recommendation:
    containerRecommendations:
    - containerName: my-container
      lowerBound:
        cpu: 536m
        memory: 262144k
      target:
        cpu: 587m
        memory: 262144k
      upperBound:
        cpu: 27854m
        memory: "545693548"
```
此输出显示有关 CPU 和内存请求的建议，并包括以下属性：
- target：指定为了使容器以最佳方式运行，它应请求 587 milliCPU 和 262,144 千字节的内存。
- lowerBound 和 upperBound：Pod 纵向自动扩缩使用这些属性决定是否删除 Pod 并将其替换为新 Pod。如果 Pod 的请求小于下限或大于上限，则 Pod 纵向自动扩缩器会删除该 Pod 并将其替换为符合目标特性的 Pod。

停用特定容器

您可以使用 gcloud CLI 或 Google Cloud 控制台停用特定容器的 Pod 纵向自动扩缩功能。

控制台

如需停用特定容器的 Pod 纵向自动扩缩功能，您必须有一个启用了 Pod 纵向自动扩缩功能的集群。Autopilot 集群默认启用 Pod 纵向自动扩缩功能。

启用 Pod 纵向自动扩缩

转到 Google Cloud 控制台中的 Google Kubernetes Engine 页面。

转到 Google Kubernetes Engine
在集群列表中，点击您要修改的集群的名称。
在自动化部分中，点击 Pod 纵向自动扩缩选项对应的修改。
选中启用 Pod 纵向自动扩缩复选框。
点击保存更改。

配置 Pod 纵向自动扩缩

转到 Google Cloud 控制台中的工作负载页面。

进入“工作负载”
在工作负载列表中，点击要为其配置 Pod 纵向自动扩缩的 Deployment 的名称。
点击 操作 > 自动扩缩 > Pod 纵向自动扩缩。
选择自动扩缩模式：
- 自动模式：Pod 纵向自动扩缩会在 Pod 的生命周期内更新 CPU 和内存请求。
- 初始模式：Pod 纵向自动扩缩仅会在创建 Pod 时分配资源请求，之后不再进行更改。
点击 添加政策。
选择要停用的容器。
对于修改容器模式，请选择关闭。
点击完成。
点击保存。

gcloud

如需停用特定容器的 Pod 纵向自动扩缩，请执行以下步骤：

将以下清单保存为 my-opt-vpa.yaml：

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-opt-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-opt-deployment
  updatePolicy:
    updateMode: "Auto"
  resourcePolicy:
    containerPolicies:
    - containerName: my-opt-sidecar
      mode: "Off"

此清单描述了 VerticalPodAutoscaler。mode: "Off" 值会关闭针对容器 my-opt-sidecar 的建议。

将清单应用于集群：
```
kubectl apply -f my-opt-vpa.yaml
```

将以下清单保存为 my-opt-deployment.yaml：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-opt-deployment
spec:
  replicas: 1
  selector:
    matchLabels:
      app: my-opt-deployment
  template:
    metadata:
      labels:
        app: my-opt-deployment
    spec:
      containers:
      - name: my-opt-container
        image: nginx
      - name: my-opt-sidecar
        image: busybox
        command: ["sh","-c","while true; do echo Doing sidecar stuff!; sleep 60; done"]

将清单应用于集群：

kubectl apply -f my-opt-deployment.yaml

一段时间后，查看 Pod 纵向自动扩缩器：
```
kubectl get vpa my-opt-vpa --output yaml
```
以下输出显示推荐的 CPU 和内存请求：
```
...
  recommendation:
    containerRecommendations:
    - containerName: my-opt-container
...
```
在此输出中，只有一个容器的建议。未针对 my-opt-sidecar 提供建议。

Pod 纵向自动扩缩绝不会更新已停用的容器上的资源。如果您等待几分钟，该 Pod 会重新创建，但只有一个容器包含更新的资源请求。

扩缩容器资源请求和限制

准备工作

分析资源请求

控制台

Cloud Monitoring

gcloud CLI

手动设置 Pod 资源请求

控制台

gcloud

自动设置 Pod 资源请求

控制台

启用 Pod 纵向自动扩缩

配置 Pod 纵向自动扩缩

gcloud

查看 Pod 纵向自动扩缩器的相关信息

停用特定容器

控制台

启用 Pod 纵向自动扩缩

配置 Pod 纵向自动扩缩

gcloud

后续步骤