Usa reservas con instancias de Vertex AI Workbench

Para asegurarte de que los recursos de VM estén disponibles cuando tus instancias de Vertex AI Workbench los necesiten, puedes usar las reservas de Compute Engine. Las reservas proporcionan un nivel de seguridad alto a fin de obtener capacidad para los recursos zonales de Compute Engine.

Limitaciones y requisitos

Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.

Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican las siguientes limitaciones y requisitos:

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

Roles obligatorios

Para garantizar que tu cuenta de usuario tenga los permisos necesarios para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que otorgue a tu cuenta de usuario los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Es posible que tu administrador también pueda otorgar a tu cuenta de usuario los permisos necesarios a través de roles personalizados o de otros roles predefinidos.

Crea una reserva

  1. Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:

    La reserva puede incluir aceleradores de GPU.

Usa la reserva con una instancia nueva

Puedes agregar tu reserva a una nueva instancia de Vertex AI Workbench con la API de REST.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • PROJECT_ID: el ID de tu proyecto
  • LOCATION: La zona en la que se encuentra la instancia.
  • INSTANCE_NAME: el nombre de tu instancia
  • MACHINE_TYPE: el tipo de máquina de la instancia
  • RESERVATION_TYPE: el tipo de reserva.
  • RESERVATION_NAME: el nombre de tu reserva

HTTP method and URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Cuerpo JSON de la solicitud:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Si se ejecuta correctamente, el cuerpo de la respuesta contiene una instancia de operación.

Deja de usar tu reserva

Para dejar de usar tu reserva, puedes borrarla.

Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.

Facturación

Vertex AI Workbench factura los recursos de VM de Compute Engine reservados mientras se ejecuta la instancia de Vertex AI Workbench, y Compute Engine los factura cuando Vertex AI Workbench no usa los recursos de VM.

¿Qué sigue?