将预留与 Vertex AI Workbench 实例搭配使用

为确保虚拟机资源在 Vertex AI Workbench 实例需要时可用,您可以使用 Compute Engine 预留。预留为获取 Compute Engine 可用区级资源的容量提供了较高的保障。

限制和要求

当 Vertex AI Workbench 实例使用预留时,需要遵循 Compute Engine 预留的所有限制。请参阅预留的工作原理

此外,将预留与 Vertex AI Workbench 实例搭配使用时,存在以下限制和要求:

  • Vertex AI Workbench 实例的预留目前为非公开预览版。如需请求访问权限,请参阅访问请求页面

  • 承诺使用折扣不适用。

  • 只能通过 Notebooks API 将预留与 Vertex AI Workbench 搭配使用。不支持使用 Google Cloud 控制台将预留与 Vertex AI Workbench 结合使用。

准备工作

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

所需的角色

如需确保您的用户账号拥有将预留用于 Vertex AI Workbench 实例所需的权限,请让您的管理员为您的用户账号授予项目的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理访问权限

您的管理员还可以通过自定义角色或其他预定义角色向您的用户账号授予所需的权限。

创建预留

  1. 创建 Compute Engine 预留。它可以是单项目预留,也可以是共享预留。如需了解详情,请参阅以下文档:

    预留可以包含 GPU 加速器。

将预留用于新实例

您可以使用 REST API 将预留添加到新的 Vertex AI Workbench 实例。

在使用任何请求数据之前,请先进行以下替换:

  • PROJECT_ID:您的项目 ID
  • LOCATION:实例所在的可用区
  • INSTANCE_NAME:实例的名称
  • MACHINE_TYPE:更改实例的机器类型
  • RESERVATION_TYPE:预留类型
  • RESERVATION_NAME:预留的名称

HTTP 方法和网址:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

请求 JSON 正文:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

如需发送请求,请选择以下方式之一:

curl

将请求正文保存在名为 request.json 的文件中,然后执行以下命令:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

将请求正文保存在名为 request.json 的文件中,然后执行以下命令:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
如果成功,响应正文将包含一个 Operation 实例。

停止使用预留

如需停止使用预留,您可以删除预留

如果您希望继续将您的预留用于其他资源,但不希望现有的 Vertex AI Workbench 实例使用它,则必须删除该实例。

结算

预留的 Compute Engine 虚拟机资源在 Vertex AI Workbench 实例运行时由 Vertex AI Workbench 计费,并在虚拟机资源未被 Vertex AI Workbench 使用时由 Compute Engine 计费。

后续步骤