此页面由 Cloud Translation API 翻译。

使用预留地区级资源

Autopilot Standard

本页面介绍如何在特定 GKE 工作负载中使用预留的 Compute Engine 可用区级资源。这些容量预留可以很好地保证特定硬件可供您的工作负载使用。

确保您已熟悉 Compute Engine 预留的概念，例如用量类型、共享类型和预配类型。如需了解详情，请参阅 Compute Engine 可用区级资源的预留。

本页面适用于以下人员：

需要部署应尽快运行的工作负载的应用运维人员，这些工作负载通常使用 GPU 等专用硬件。
希望很好地保证工作负载能够在满足应用和组织要求的优化硬件上运行的平台管理员。

GKE 中的预留使用简介

借助 Compute Engine 容量预留，您可以在 Google Cloud 可用区中预配特定的硬件配置，无论是立即预配还是在未来的指定时间预配。然后，您可以在 GKE 中使用此预留容量。

根据您的 GKE 运行模式，您可以使用以下预留类型：

Autopilot 模式：仅限特定预留。
标准模式：特定预留或任何匹配的预留。

如需允许使用预留来创建资源，您必须指定预留亲和性，例如 any 或 specific。

GKE 中的预留用量选项

借助 GKE，您可以通过在工作负载清单中使用 Kubernetes nodeSelector 或通过创建使用预留的标准模式节点池，直接在各个工作负载中使用预留。本页介绍了直接在各个资源中选择预留的方法。

您还可以将 GKE 配置为在创建新节点的扩缩操作期间通过自定义计算类使用预留。借助自定义计算类，平台管理员可以定义节点配置的层次结构，供 GKE 在节点扩缩期间按优先级选择资源，以便工作负载在您选择的硬件上运行。

您可以在自定义计算类配置中指定预留，以便使用该自定义计算类的任何 GKE 工作负载都可以指示 GKE 使用为该计算类指定的预留。

如需了解详情，请参阅“自定义计算类简介”页面中的使用 Compute Engine 预留部分。

准备工作

在开始之前，请确保您已执行以下任务：

启用 Google Kubernetes Engine API。

启用 Google Kubernetes Engine API

如果您要使用 Google Cloud CLI 执行此任务，请安装并初始化 gcloud CLI。如果您之前安装了 gcloud CLI，请运行 gcloud components update 命令以获取最新版本。较早版本的 gcloud CLI 可能不支持运行本文档中的命令。
注意：对于现有 gcloud CLI 安装，请务必设置 compute/region 属性。如果您主要使用可用区级集群，请改为设置 compute/zone。通过设置默认位置，您可以避免 gcloud CLI 中出现如下错误：One of [--zone, --region] must be supplied: Please specify location。如果集群的位置与您设置的默认位置不同，您可能需要在某些命令中指定位置。

在 Autopilot 集群中使用容量预留

Autopilot 集群支持使用同一项目或共享项目中的 Compute Engine 容量预留中的资源。您必须将目标预留的用量类型属性设为特定，并且必须在清单中明确选择该预留。如果您未明确指定预留，Autopilot 集群将不会使用预留。如需详细了解预留使用类型，请参阅预留的工作原理。

这些预留符合计算灵活承诺使用折扣的条件。您必须使用 Accelerator 计算类或 Performance 计算类才能使用容量预留。

在开始之前，请先创建运行以下版本的 Autopilot 集群：
- 使用预留加速器（例如 GPU）：1.28.6-gke.1095000 或更高版本
- 在特定机器系列上运行 Pod，且每个 Pod 位于自己的节点上：1.28.6-gke.1369000 及更高版本或 1.29.1-gke.1575000 及更高版本。

为 Autopilot 创建容量预留

Autopilot Pod 可以使用与集群位于同一项目中的具有特定使用类型属性的预留，也可以使用来自其他项目的共享预留。您可以通过在清单中显式引用预留来使用预留的硬件。您可以在 Autopilot 中为以下类型的硬件使用预留：

以下任一种类型的 GPU：
- nvidia-gb200：NVIDIA GB200（预览版）
- nvidia-b200：NVIDIA B200 (180GB)
- nvidia-h200-141gb：NVIDIA H200 (141GB)
- nvidia-h100-mega-80gb：NVIDIA H100 Mega (80GB)
- nvidia-h100-80gb：NVIDIA H100 (80GB)
- nvidia-a100-80gb：NVIDIA A100 (80GB)
- nvidia-tesla-a100：NVIDIA A100 (40GB)
- nvidia-l4：NVIDIA L4
- nvidia-tesla-t4：NVIDIA T4
以下任一种类型的 TPU：
- tpu-v6e-slice：TPU v6e 切片
- tpu-v5p-slice：TPU v5p 切片
- tpu-v5-lite-podslice：TPU v5 lite podslice
- tpu-v5-lite-device：TPU v5 lite 设备
- tpu-v4-lite-device：TPU v4 lite 设备
- tpu-v4-podslice：TPU v4 podslice
- tpu-v3-device：TPU v3 设备
- tpu-v3-slice：TPU v3 podslice

如需创建容量预留，请参阅以下资源。该预留必须满足以下要求：

机器类型、加速器类型及加速器数量与您的工作负载将使用的容量相匹配。
预留采用特定的使用类型。例如，在 gcloud CLI 中，您必须在创建预留时指定 --require-specific-reservation 标志。
为单个项目创建预留
创建共享预留

GKE 会自动将所选特定预留中的所有本地 SSD 挂接到您的节点。您无需在工作负载清单中选择各个本地 SSD。例如，如果您选择的预留包含两个本地 SSD，则 GKE 基于该预留创建的节点会挂接两个本地 SSD。

在 Autopilot 中使用同一项目中的特定预留

本部分介绍如何使用集群所在项目中的特定容量预留。您可以使用 kubectl 或 Terraform。

kubectl

将以下清单保存为 specific-autopilot.yaml。此清单具有使用特定预留的节点选择器。您可以使用虚拟机实例或加速器。

虚拟机实例

  apiVersion: v1
  kind: Pod
  metadata:
    name: specific-same-project-pod
  spec:
    nodeSelector:
      cloud.google.com/compute-class: Performance
      cloud.google.com/machine-family: MACHINE_SERIES
      cloud.google.com/reservation-name: RESERVATION_NAME
      cloud.google.com/reservation-affinity: "specific"
    containers:
    - name: my-container
      image: "k8s.gcr.io/pause"
      resources:
        requests:
          cpu: 2
          memory: "4Gi"

替换以下内容：

MACHINE_SERIES：包含特定容量预留中的虚拟机的机器类型的机器系列。例如，如果您的预留适用于 c3-standard-4 机器类型，请在 MACHINE_SERIES 字段中指定 c3。
RESERVATION_NAME：Compute Engine 容量预留的名称。

GPU 加速器

  apiVersion: v1
  kind: Pod
  metadata:
    name: specific-same-project-pod
  spec:
    nodeSelector:
      cloud.google.com/gke-accelerator: ACCELERATOR
      cloud.google.com/reservation-name: RESERVATION_NAME
      cloud.google.com/reservation-affinity: "specific"
    containers:
    - name: my-container
      image: "k8s.gcr.io/pause"
      resources:
        requests:
          cpu: 12
          memory: "50Gi"
          ephemeral-storage: "200Gi"
        limits:
          nvidia.com/gpu: QUANTITY

替换以下内容：

ACCELERATOR：您在 Compute Engine 容量预留中预留的加速器。必须是以下值之一：
- nvidia-gb200：NVIDIA GB200（预览版）
- nvidia-b200：NVIDIA B200 (180GB)
- nvidia-h200-141gb：NVIDIA H200 (141GB)
- nvidia-h100-mega-80gb：NVIDIA H100 Mega (80GB)
- nvidia-h100-80gb：NVIDIA H100 (80GB)
- nvidia-a100-80gb：NVIDIA A100 (80GB)
- nvidia-tesla-a100：NVIDIA A100 (40GB)
- nvidia-l4：NVIDIA L4
- nvidia-tesla-t4：NVIDIA T4
RESERVATION_NAME：Compute Engine 容量预留的名称。
QUANTITY：要挂接到容器的 GPU 数量。必须是指定 GPU 支持的数量，具体请参阅支持的 GPU 数量。

TPU 加速器

  apiVersion: v1
  kind: Pod
  metadata:
    name: specific-same-project-pod
  spec:
    nodeSelector:
      cloud.google.com/gke-tpu-accelerator: ACCELERATOR
      cloud.google.com/gke-tpu-topology: TOPOLOGY
      cloud.google.com/reservation-name: RESERVATION_NAME
      cloud.google.com/reservation-affinity: "specific"
    containers:
    - name: my-container
      image: "k8s.gcr.io/pause"
      resources:
        requests:
          cpu: 12
          memory: "50Gi"
          ephemeral-storage: "200Gi"
        limits:
          google.com/tpu: QUANTITY

替换以下内容：

ACCELERATOR：您在 Compute Engine 容量预留中预留的加速器。必须是以下值之一：
- tpu-v6e-slice：TPU v6e 切片
- tpu-v5p-slice：TPU v5p 切片
- tpu-v5-lite-podslice：TPU v5 lite podslice
- tpu-v5-lite-device：TPU v5 lite 设备
- tpu-v4-lite-device：TPU v4 lite 设备
- tpu-v4-podslice：TPU v4 podslice
- tpu-v3-device：TPU v3 设备
- tpu-v3-slice：TPU v3 podslice
TOPOLOGY：TPU 拓扑。
RESERVATION_NAME：Compute Engine 容量预留的名称。
QUANTITY：要挂接到容器的 TPU 数量。必须与 TPU 拓扑保持一致。

部署 Pod：

kubectl apply -f specific-autopilot.yaml

Autopilot 会使用指定预留中的预留容量来预配新节点以放置 Pod。

Terraform

如需通过 Terraform 使用虚拟机实例所在项目中的特定预留，请参阅以下示例：

resource "kubernetes_pod_v1" "default_pod" {
  metadata {
    name = "specific-same-project-pod"
  }

  spec {
    node_selector = {
      "cloud.google.com/compute-class"        = "Performance"
      "cloud.google.com/machine-family"       = "c3"
      "cloud.google.com/reservation-name"     = google_compute_reservation.specific_pod.name
      "cloud.google.com/reservation-affinity" = "specific"
    }

    container {
      name  = "my-container"
      image = "registry.k8s.io/pause"

      resources {
        requests = {
          cpu               = 2
          memory            = "8Gi"
          ephemeral-storage = "1Gi"
        }
      }

      security_context {
        allow_privilege_escalation = false
        run_as_non_root            = false

        capabilities {
          add  = []
          drop = ["NET_RAW"]
        }
      }
    }

    security_context {
      run_as_non_root     = false
      supplemental_groups = []

      seccomp_profile {
        type = "RuntimeDefault"
      }
    }
  }

  depends_on = [
    google_compute_reservation.specific_pod
  ]
}

如需通过 Terraform 使用加速器计算类所在项目中的特定预留，请参阅以下示例：

resource "kubernetes_pod_v1" "default_accelerator" {
  metadata {
    name = "specific-same-project-accelerator"
  }

  spec {
    node_selector = {
      "cloud.google.com/compute-class"        = "Accelerator"
      "cloud.google.com/gke-accelerator"      = "nvidia-l4"
      "cloud.google.com/reservation-name"     = google_compute_reservation.specific_accelerator.name
      "cloud.google.com/reservation-affinity" = "specific"
    }

    container {
      name  = "my-container"
      image = "registry.k8s.io/pause"

      resources {
        requests = {
          cpu               = 2
          memory            = "7Gi"
          ephemeral-storage = "1Gi"
          "nvidia.com/gpu"  = 1

        }
        limits = {
          "nvidia.com/gpu" = 1
        }
      }

      security_context {
        allow_privilege_escalation = false
        run_as_non_root            = false

        capabilities {
          add  = []
          drop = ["NET_RAW"]
        }
      }
    }

    security_context {
      run_as_non_root     = false
      supplemental_groups = []

      seccomp_profile {
        type = "RuntimeDefault"
      }
    }
  }

  depends_on = [
    google_compute_reservation.specific_accelerator
  ]
}

如需详细了解如何使用 Terraform，请参阅针对 GKE 的 Terraform 支持。

在 Autopilot 中使用特定共享预留

本部分使用以下术语：

所有者项目：拥有预留并与其他项目共享的项目。
使用方项目：运行使用共享预留的工作负载的项目。

如需使用共享预留，您必须向 GKE 服务代理授予对拥有该预留的项目中预留的访问权限。执行以下操作：

在所有者项目中创建包含 compute.reservations.list 权限的自定义 IAM 角色：
```
gcloud iam roles create ROLE_NAME \
    --project=OWNER_PROJECT_ID \
    --permissions='compute.reservations.list'
```
替换以下内容：
- ROLE_NAME：新角色的名称。
- OWNER_PROJECT_ID：拥有容量预留的项目的项目 ID。

向使用方项目中的 GKE 服务代理授予列出所有者项目中共享预留的权限：

gcloud projects add-iam-policy-binding OWNER_PROJECT_ID \
    --project=OWNER_PROJECT_ID \
    --member=serviceAccount:service-CONSUMER_PROJECT_NUMBER@container-engine-robot.iam.gserviceaccount.com \
    --role='projects/OWNER_PROJECT_ID/roles/ROLE_NAME'

将 CONSUMER_PROJECT_NUMBER 替换为您的使用方项目的数字项目编号。如需查找此编号，请参阅 Resource Manager 文档中的识别项目部分。

将以下清单保存为 shared-autopilot.yaml。此清单具有 nodeSelector，用于指示 GKE 使用特定的共享预留。

虚拟机实例

apiVersion: v1
kind: Pod
metadata:
  name: performance-pod
spec:
  nodeSelector:
    cloud.google.com/compute-class: Performance
    cloud.google.com/machine-family: MACHINE_SERIES
    cloud.google.com/reservation-name: RESERVATION_NAME
    cloud.google.com/reservation-project: OWNER_PROJECT_ID
    cloud.google.com/reservation-affinity: "specific"
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 2
        memory: "4Gi"

替换以下内容：

MACHINE_SERIES：特定容量预留中虚拟机的机器类型所属的机器系列。例如，如果您的预留适用于 c3-standard-4 机器类型，请在 MACHINE_SERIES 字段中指定 c3。
RESERVATION_NAME：Compute Engine 容量预留的名称。
OWNER_PROJECT_ID：拥有容量预留的项目的项目 ID。

GPU 加速器

apiVersion: v1
kind: Pod
metadata:
  name: specific-same-project-pod
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR
    cloud.google.com/reservation-name: RESERVATION_NAME
    cloud.google.com/reservation-project: OWNER_PROJECT_ID
    cloud.google.com/reservation-affinity: "specific"
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral-storage: "200Gi"
      limits:
        nvidia.com/gpu: QUANTITY

替换以下内容：

ACCELERATOR：您在 Compute Engine 容量预留中预留的加速器。必须是以下值之一：
- nvidia-gb200：NVIDIA GB200（预览版）
- nvidia-b200：NVIDIA B200 (180GB)
- nvidia-h200-141gb：NVIDIA H200 (141GB)
- nvidia-h100-mega-80gb：NVIDIA H100 Mega (80GB)
- nvidia-h100-80gb：NVIDIA H100 (80GB)
- nvidia-a100-80gb：NVIDIA A100 (80GB)
- nvidia-tesla-a100：NVIDIA A100 (40GB)
- nvidia-l4：NVIDIA L4
- nvidia-tesla-t4：NVIDIA T4
RESERVATION_NAME：Compute Engine 容量预留的名称。
OWNER_PROJECT_ID：拥有容量预留的项目的项目 ID。
QUANTITY：要挂接到容器的 GPU 数量。必须是指定 GPU 支持的数量，具体请参阅支持的 GPU 数量。

TPU 加速器

apiVersion: v1
kind: Pod
metadata:
  name: specific-shared-project-pod
spec:
  nodeSelector:
    cloud.google.com/gke-tpu-accelerator: ACCELERATOR
    cloud.google.com/gke-tpu-topology: TOPOLOGY
    cloud.google.com/reservation-name: RESERVATION_NAME
    cloud.google.com/reservation-project: OWNER_PROJECT_ID
    cloud.google.com/reservation-affinity: "specific"
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral-storage: "200Gi"
      limits:
        google.com/tpu: QUANTITY

替换以下内容：

ACCELERATOR：您在 Compute Engine 容量预留中预留的加速器。必须是以下值之一：
- tpu-v6e-slice：TPU v6e 切片
- tpu-v5p-slice：TPU v5p 切片
- tpu-v5-lite-podslice：TPU v5 lite podslice
- tpu-v5-lite-device：TPU v5 lite 设备
- tpu-v4-lite-device：TPU v4 lite 设备
- tpu-v4-podslice：TPU v4 podslice
- tpu-v3-device：TPU v3 设备
- tpu-v3-slice：TPU v3 podslice
TOPOLOGY：TPU 拓扑。
RESERVATION_NAME：Compute Engine 容量预留的名称。
OWNER_PROJECT_ID：拥有容量预留的项目的项目 ID。
QUANTITY：要挂接到容器的 TPU 数量。必须与 TPU 拓扑保持一致。

部署 Pod：
```
kubectl apply -f shared-autopilot.yaml
```

Autopilot 会使用指定预留中的预留容量来预配新节点以放置 Pod。

在 Autopilot 中使用特定预留区块

本部分介绍如何使用集群所在项目或共享项目中的特定容量预留区块。此功能仅适用于特定加速器。您可以使用 kubectl 配置 Pod 使用预留区块。

将以下清单保存为 reservation-block-autopilot.yaml。此清单具有使用特定预留的节点选择器。

本地项目
```
apiVersion: v1
kind: Pod
metadata:
  name: specific-same-project-pod
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR
    cloud.google.com/reservation-name: RESERVATION_NAME
    cloud.google.com/reservation-affinity: "specific"
    cloud.google.com/reservation-blocks: RESERVATION_BLOCKS_NAME
  
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral-storage: "200Gi"
      limits:
        nvidia.com/gpu: QUANTITY
```
替换以下内容：
- ACCELERATOR：您在 Compute Engine 容量预留中预留的加速器。必须是以下值之一：
  - nvidia-b200：NVIDIA B200 (180GB)
  - nvidia-h200-141gb：NVIDIA H200 (141GB)
- RESERVATION_NAME：Compute Engine 容量预留的名称。
- RESERVATION_BLOCKS_NAME：Compute Engine 容量预留区块的名称。
- QUANTITY：要挂接到容器的 GPU 数量。必须是指定 GPU 支持的数量，具体请参阅支持的 GPU 数量。
对于归其他项目所有的预留，请将“cloud.google.com/reservation-project: OWNER_PROJECT_ID”添加到 spec.nodeSelector 字段。将 OWNER_PROJECT_ID 替换为拥有容量预留的项目的项目 ID。
部署 Pod：
```
kubectl apply -f reservation-block-autopilot.yaml
```
Autopilot 会使用指定预留区块中的预留容量来预配新节点以放置 Pod。

在 Autopilot 中使用特定预留子区块

本部分介绍如何使用集群所在项目或共享项目中的特定容量预留子区块。

将以下 ComputeClass 清单保存为 reservation-sub-block-computeclass.yaml：
```
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: specific-reservation-subblock
spec:
  nodePoolAutoCreation:
    enabled: true
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
    reservations:
      affinity: Specific
      specific:
      - name: RESERVATION_NAME
        project: RESERVATION_PROJECT_ID
        reservationBlock:
          name: RESERVATION_BLOCK_NAME
          reservationSubBlock:
            name: RESERVATION_SUB_BLOCK_NAME
```
替换以下内容：
- ACCELERATOR_TYPE：您在 Compute Engine 容量预留中预留的加速器。该值必须为 nvidia-gb200。
- ACCELERATOR_COUNT：要挂接到每个节点的加速器数量。该值必须是指定加速器类型支持的数量。如需了解详情，请参阅支持的 GPU 数量。
- RESERVATION_NAME：Compute Engine 容量预留的名称。
- RESERVATION_PROJECT_ID：拥有容量预留的项目的项目 ID。
- RESERVATION_BLOCK_NAME：Compute Engine 容量预留区块的名称。
- RESERVATION_SUB_BLOCK_NAME：Compute Engine 容量预留子区块的名称。

将以下 Pod 清单另存为 reservation-sub-block-pod.yaml：

apiVersion: v1
kind: Pod
metadata:
  name: reservation-sub-block-pod
spec:
  nodeSelector:
    cloud.google.com/compute-class: specific-reservation-subblock
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral-storage: "200Gi"
      limits:
        nvidia.com/gpu: CONTAINER_GPU_COUNT

将 CONTAINER_GPU_COUNT 替换为要分配给容器的 GPU 数量。该值必须小于或等于计算类挂接到每个节点的加速器数量。

部署 Pod：
```
kubectl apply -f reservation-sub-block-pod.yaml
```
Autopilot 会使用指定预留子区块中的预留容量来预配新节点以运行 Pod。

排查 Autopilot 中使用预留的问题

确保机器类型、加速器类型、本地 SSD 配置和加速器数量与您的工作负载将使用的容量相匹配。如需查看必须匹配的属性的完整列表，请参阅 Compute Engine 容量预留属性。
确保使用特定亲和性创建预留。
使用共享预留时，请确保使用方项目中的 GKE 服务代理有权列出所有者项目中的共享预留。

在 GKE Standard 中使用预留实例

在创建集群或节点池时，您可以通过指定 --reservation-affinity 标志来指明预留使用模式。

使用任何匹配的预留

您可以使用 gcloud CLI 或 Terraform 创建预留和实例，以使用任何预留。

gcloud

如需自动使用任何匹配的预留中的资源，请将预留相似性标志设置为 --reservation-affinity=any。由于 any 是在 Compute Engine 中定义的默认值，因此您可以完全忽略预留亲和性标志。

在 any 预留使用模式下，节点首先从所有单项目预留中获取容量，然后再使用任何共享预留，因为共享预留可供其他项目使用。如需详细了解实例自动使用方式，请参阅使用顺序。

创建包含三个虚拟机实例的预留：
```
gcloud compute reservations create RESERVATION_NAME \
    --machine-type=MACHINE_TYPE --vm-count=3
```
替换以下内容：
- RESERVATION_NAME：要创建的预留的名称。
- MACHINE_TYPE：用于预留的机器类型（仅含名称）。例如 n1-standard-2。

验证预留创建成功：

gcloud compute reservations describe RESERVATION_NAME

创建包含一个节点的集群以使用任何匹配的预留：

gcloud container clusters create CLUSTER_NAME \
    --machine-type=MACHINE_TYPE --num-nodes=1 \
    --reservation-affinity=any

将 CLUSTER_NAME 替换为要创建的集群的名称。

创建包含三个节点的节点池以使用任何匹配的预留：

gcloud container node-pools create NODEPOOL_NAME \
    --cluster CLUSTER_NAME --num-nodes=3 \
    --machine-type=MACHINE_TYPE --reservation-affinity=any

将 NODEPOOL_NAME 替换为要创建的节点池的名称。

总节点数为 4，超过了预留的容量。有 3 个节点使用预留资源，而最后一个节点则使用常规 Compute Engine 资源池中的容量。

Terraform

如需使用 Terraform 创建包含三个虚拟机实例的预留，请参阅以下示例：

resource "google_compute_reservation" "any_reservation" {
  name = "any-reservation"
  zone = "us-central1-a"

  specific_reservation {
    count = 3

    instance_properties {
      machine_type = "e2-medium"
    }
  }
}

如需使用 Terraform 创建包含一个节点的集群以使用任何匹配的预留，请参阅以下示例：

resource "google_container_cluster" "default" {
  name     = "gke-standard-zonal-cluster"
  location = "us-central1-a"

  initial_node_count = 1

  node_config {
    machine_type = "e2-medium"

    reservation_affinity {
      consume_reservation_type = "ANY_RESERVATION"
    }
  }

  depends_on = [
    google_compute_reservation.any_reservation
  ]
}

如需使用 Terraform 创建包含三个节点的节点池以使用任何匹配的预留，请参阅以下示例：

resource "google_container_node_pool" "any_node_pool" {
  name     = "gke-standard-zonal-any-node-pool"
  cluster  = google_container_cluster.default.name
  location = google_container_cluster.default.location

  initial_node_count = 3
  node_config {
    machine_type = "e2-medium"

    reservation_affinity {
      consume_reservation_type = "ANY_RESERVATION"
    }
  }
}

如需详细了解如何使用 Terraform，请参阅针对 GKE 的 Terraform 支持。

使用特定的单项目预留

如需使用特定预留，请将预留相似性标志设置为 --reservation-affinity=specific 并提供具体预留名称。在这种模式下，实例必须使用地区中指定预留的容量。如果此预留的资源容量不足，请求就会失败。

如需创建预留和实例以使用特定预留，请执行以下步骤。您可以使用 gcloud CLI 或 Terraform。

gcloud

为 3 个虚拟机实例创建特定预留：
```
gcloud compute reservations create RESERVATION_NAME \
    --machine-type=MACHINE_TYPE --vm-count=3 \
    --require-specific-reservation
```
替换以下内容：
- RESERVATION_NAME：要创建的预留的名称。
- MACHINE_TYPE：用于预留的机器类型（仅含名称）。例如 n1-standard-2。

创建一个具有单个节点的节点池以使用特定的单项目预留：

gcloud container node-pools create NODEPOOL_NAME \
    --cluster CLUSTER_NAME \
    --machine-type=MACHINE_TYPE --num-nodes=1 \
    --reservation-affinity=specific --reservation=RESERVATION_NAME

替换以下内容：

NODEPOOL_NAME：要创建的节点池的名称。
CLUSTER_NAME：您创建的集群的名称。

Terraform

如需使用 Terraform 创建特定预留，请参阅以下示例：

resource "google_compute_reservation" "specific_reservation" {
  name = "specific-reservation"
  zone = "us-central1-a"

  specific_reservation {
    count = 1

    instance_properties {
      machine_type = "e2-medium"
    }
  }

  specific_reservation_required = true
}

如需使用 Terraform 创建包含单个节点的节点池以使用特定的单项目预留，请参阅以下示例：

resource "google_container_node_pool" "specific_node_pool" {
  name     = "gke-standard-zonal-specific-node-pool"
  cluster  = google_container_cluster.default.name
  location = google_container_cluster.default.location

  initial_node_count = 1
  node_config {
    machine_type = "e2-medium"

    reservation_affinity {
      consume_reservation_type = "SPECIFIC_RESERVATION"
      key                      = "compute.googleapis.com/reservation-name"
      values                   = [google_compute_reservation.specific_reservation.name]
    }
  }

  depends_on = [
    google_compute_reservation.specific_reservation
  ]
}

如需详细了解如何使用 Terraform，请参阅针对 GKE 的 Terraform 支持。

使用特定的共享预留

如需创建特定的共享预留并使用该共享预留，请执行以下步骤。您可以使用 gcloud CLI 或 Terraform。

按照允许和限制项目创建和修改共享预留中的步骤操作。

gcloud

创建特定的共享预留：
```
gcloud compute reservations create RESERVATION_NAME \
    --machine-type=MACHINE_TYPE --vm-count=3 \
    --zone=ZONE \
    --require-specific-reservation \
    --project=OWNER_PROJECT_ID \
    --share-setting=projects \
    --share-with=CONSUMER_PROJECT_IDS
```
替换以下内容：
- RESERVATION_NAME：要创建的预留的名称。
- MACHINE_TYPE：用于预留的机器类型的名称。例如 n1-standard-2。
- OWNER_PROJECT_ID：您希望其创建此共享预留的项目的 ID。如果省略 --project 标志，GKE 默认使用当前项目作为所有者项目。
- CONSUMER_PROJECT_IDS：您要与之共享此预留的项目以英文逗号分隔的项目 ID 列表。例如 project-1,project-2。您可以添加 1 到 100 个使用方项目。这些项目必须与所有者项目位于同一组织中。请勿添加 OWNER_PROJECT_ID，因为它默认可以使用此预留。

使用共享预留：

  gcloud container node-pools create NODEPOOL_NAME \
      --cluster CLUSTER_NAME \
      --machine-type=MACHINE_TYPE --num-nodes=1 \
      --reservation-affinity=specific \
      --reservation=projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

替换以下内容：

NODEPOOL_NAME：要创建的节点池的名称。
CLUSTER_NAME：您创建的集群的名称。

Terraform

如需使用 Terraform 创建特定共享预留，请参阅以下示例：

resource "google_compute_reservation" "specific_reservation" {
  name = "specific-reservation"
  zone = "us-central1-a"

  specific_reservation {
    count = 1

    instance_properties {
      machine_type = "e2-medium"
    }
  }

  specific_reservation_required = true
}

如需通过 Terraform 使用特定共享预留，请参阅以下示例：

resource "google_container_node_pool" "specific_node_pool" {
  name     = "gke-standard-zonal-specific-node-pool"
  cluster  = google_container_cluster.default.name
  location = google_container_cluster.default.location

  initial_node_count = 1
  node_config {
    machine_type = "e2-medium"

    reservation_affinity {
      consume_reservation_type = "SPECIFIC_RESERVATION"
      key                      = "compute.googleapis.com/reservation-name"
      values                   = [google_compute_reservation.specific_reservation.name]
    }
  }

  depends_on = [
    google_compute_reservation.specific_reservation
  ]
}

如需详细了解如何使用 Terraform，请参阅针对 GKE 的 Terraform 支持。

使用特定预留的其他考虑事项

如果所创建的节点池具有特定预留相似度，包括创建集群时的默认节点池，其大小将限制为特定预留在节点池整个生命周期内的容量。这会影响到如下 GKE 功能：

包含多个可用区的集群：在区域级集群或多可用区集群中，一个节点池内的不同节点可能分布在不同的可用区。由于预留是单可用区式的，因此需要多个预留。如需在这些集群中创建使用特定预留的节点池，您必须在节点池的每个可用区中创建具有完全相同的名称和机器属性的特定预留。
集群自动扩缩和节点池升级：如果特定预留中没有额外的容量，节点池升级或自动扩缩可能会失败，因为这两种操作都需要创建额外的实例。若要解决此问题，您可以更改预留的大小，或者释放其部分受限资源。

使用 GPU 预留

如需创建 Standard 节点池以使用 GPU 预留或使用容量位于单个可用区中的任何预留，则必须在添加节点池时指定 --node-locations 标志。创建区域级 Standard 集群或多可用区级 Standard 集群时，指定节点位置可确保 GKE 仅在您预留了 GPU 容量的可用区中创建节点。

如需详细了解如何创建使用 GPU 的节点池，请参阅创建 GPU 节点池。

使用 TPU 预留

如需创建使用 TPU 预留的 Standard 节点池，您必须在添加节点池时指定 --node-locations 标志。创建区域级 Standard 集群或多可用区级 Standard 集群时，指定节点位置可确保 GKE 仅在您预留了 TPU 容量的可用区中创建节点。

TPU 预留与其他机器类型不同。以下是创建 TPU 预留时应考虑的特定于 TPU 的事项：

使用 GKE 中的 TPU 时，SPECIFIC 是 --reservation-affinity 标志唯一支持的值。

如需详细了解如何创建使用 TPU 的节点池，请参阅创建 TPU 节点池。

创建节点但不使用预留

如需明确避免使用任何预留中的资源，请将相似性设置为 --reservation-affinity=none。

创建一个不使用任何预留的集群：
```
gcloud container clusters create CLUSTER_NAME --reservation-affinity=none
```
将 CLUSTER_NAME 替换为要创建的集群的名称。

创建一个不使用任何预留的节点池：

gcloud container node-pools create NODEPOOL_NAME \
    --cluster CLUSTER_NAME \
    --reservation-affinity=none

将 NODEPOOL_NAME 替换为要创建的节点池的名称。

以下可用区之间的可用预留

使用在多个可用区中运行的节点池，并且预留之间的可用区不相等时，您可以使用 --location_policy=ANY 标志。这样可确保在向集群添加新节点时，在仍具有未使用预留的可用区中创建这些节点。

清理

为避免因本页中使用的资源导致您的 Cloud Billing 账号产生费用，请执行以下操作：

通过对每个集群运行以下命令来删除您创建的集群：
```
gcloud container clusters delete CLUSTER_NAME
```
通过为每个预留运行以下命令来删除您创建的预留：
```
gcloud compute reservations delete RESERVATION_NAME
```

使用预留地区级资源

GKE 中的预留使用简介

GKE 中的预留用量选项

准备工作

在 Autopilot 集群中使用容量预留

为 Autopilot 创建容量预留

在 Autopilot 中使用同一项目中的特定预留

kubectl

Terraform

在 Autopilot 中使用特定共享预留

虚拟机实例

GPU 加速器

TPU 加速器

在 Autopilot 中使用特定预留区块

在 Autopilot 中使用特定预留子区块

排查 Autopilot 中使用预留的问题

在 GKE Standard 中使用预留实例

使用任何匹配的预留

gcloud

Terraform

使用特定的单项目预留

gcloud

Terraform

使用特定的共享预留

gcloud

Terraform

使用特定预留的其他考虑事项

使用 GPU 预留

使用 TPU 预留

创建节点但不使用预留

以下可用区之间的可用预留

清理

后续步骤