Se usó la API de Cloud Translation para traducir esta página.

Crea un recurso persistente

Cuando creas un recurso persistente, el servicio de entrenamiento primero encuentra recursos del grupo de recursos de Compute Engine según las especificaciones que proporcionaste y, luego, aprovisiona un clúster de larga duración por ti. En esta página, se muestra cómo crear un recurso persistente para ejecutar tus trabajos de entrenamiento personalizados a través de la consola de Google Cloud , Google Cloud CLI y la API de REST.

Roles requeridos

Para obtener el permiso que necesitas para crear un recurso persistente, pídele a tu administrador que te otorgue el rol de IAM de administrador de Vertex AI (roles/aiplatform.admin) en tu proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene el permiso aiplatform.persistentResources.create, que se requiere para crear un recurso persistente.

También puedes obtener este permiso con roles personalizados o con otros roles predefinidos.

Crea un recurso persistente

Selecciona una de las siguientes pestañas para obtener instrucciones sobre cómo crear un recurso persistente.

Console

Para crear un recurso persistente con la Google Cloud consola, haz lo siguiente:

En la consola de Google Cloud , ve a la página Recursos persistentes.

Ir a Recursos persistentes
Haga clic en Crear clúster.
Configura el clúster de la siguiente manera:
- Nombre: ingresa un nombre para el clúster.
- Descripción: ingresa una descripción del clúster (opcional).
- Región: selecciona la región en la que deseas crear el clúster.
Haz clic en Continuar.
Configura los recursos de procesamiento para el clúster de la siguiente manera:
1. Haz clic en Grupo de trabajadores 1.
2. Selecciona la pestaña de la familia de máquinas que deseas usar y configura el grupo de trabajadores de la siguiente manera:
  De uso general
  Las VMs de uso general ofrecen la mejor relación entre precio y rendimiento en una variedad de cargas de trabajo.
  - Serie: selecciona una serie de máquinas.
  - Tipo de máquina: selecciona un tipo de máquina.
  - Tipo de disco: selecciona Disco estándar o Disco SSD.
  - Tamaño del disco: Ingresa el tamaño del disco que deseas.
  - Recuento mínimo de réplicas: ingresa la cantidad mínima de réplicas que se deben tener en el grupo de trabajadores.
  - Recuento máximo de réplicas: ingresa la cantidad máxima de réplicas permitidas en el grupo de trabajadores (opcional). Si se especifica, el grupo de trabajadores escala automáticamente la cantidad de réplicas hasta el recuento máximo de réplicas configurado según sea necesario.
  Optimizado para procesamiento
  Las VMs optimizadas para procesamiento ofrecen el mayor rendimiento por núcleo y están optimizadas para cargas de trabajo de procesamiento intensivo.
  - Serie: selecciona una serie de máquinas.
  - Tipo de máquina: selecciona un tipo de máquina.
  - Tipo de disco: selecciona Disco estándar o Disco SSD.
  - Tamaño del disco: Ingresa el tamaño del disco que deseas.
  - Recuento mínimo de réplicas: ingresa la cantidad mínima de réplicas que se deben tener en el grupo de trabajadores.
  - Recuento máximo de réplicas: ingresa la cantidad máxima de réplicas permitidas en el grupo de trabajadores (opcional). Si se especifica, el grupo de trabajadores escala automáticamente la cantidad de réplicas hasta el recuento máximo de réplicas configurado según sea necesario.
  Con optimización de memoria
  Con VMs con optimización de memoria: Ideal para cargas de trabajo que requieren mucha memoria, ya que ofrecen más memoria por núcleo que otras familias de máquinas (hasta 12 TB de memoria).
  - Serie: selecciona una serie de máquinas.
  - Tipo de máquina: selecciona un tipo de máquina.
  - Tipo de disco: selecciona Disco estándar o Disco SSD.
  - Tamaño del disco: Ingresa el tamaño del disco que deseas.
  - Recuento mínimo de réplicas: ingresa la cantidad mínima de réplicas que se deben tener en el grupo de trabajadores.
  - Recuento máximo de réplicas: ingresa la cantidad máxima de réplicas permitidas en el grupo de trabajadores (opcional). Si se especifica, el grupo de trabajadores escala automáticamente la cantidad de réplicas hasta el recuento máximo de réplicas configurado según sea necesario.
  GPU
  Estas VMs optimizadas para aceleradores son ideales para cargas de trabajo de procesamiento paralelizadas de forma masiva de la arquitectura unificada de dispositivos de procesamiento (CUDA), como el aprendizaje automático (AA) y la computación de alto rendimiento (HPC). Esta familia es la mejor opción para las cargas de trabajo que requieren GPUs.
  - Tipo de GPU: selecciona el tipo de GPU que deseas usar.
  - Cantidad de GPU: ingresa la cantidad de GPU que deseas usar.
  - Serie: selecciona una serie de máquinas.
  - Tipo de máquina: selecciona un tipo de máquina.
  - Tipo de disco: selecciona Disco estándar o Disco SSD.
  - Tamaño del disco: Ingresa el tamaño del disco que deseas.
  - Recuento mínimo de réplicas: ingresa la cantidad mínima de réplicas que se deben tener en el grupo de trabajadores.
  - Recuento máximo de réplicas: ingresa la cantidad máxima de réplicas permitidas en el grupo de trabajadores (opcional). Si se especifica, el grupo de trabajadores escala automáticamente la cantidad de réplicas hasta el recuento máximo de réplicas configurado según sea necesario.
3. Haz clic en Listo.
4. Para agregar grupos de trabajadores adicionales, haz clic en Agregar grupo de trabajadores (opcional).
Haz clic en Crear.

gcloud

Un recurso persistente puede tener uno o más grupos de recursos. Para crear varios grupos de recursos en un recurso persistente, especifica varias marcas --resource-pool-spec.

Cada grupo de recursos puede tener habilitado o inhabilitado el ajuste de escala automático. Para habilitar el ajuste de escala automático, especifica min_replica_count y max_replica_count.

Puedes especificar todas las configuraciones del grupo de recursos como parte de la línea de comandos o usar la marca --config para especificar la ruta de acceso a un archivo YAML que contiene las configuraciones.

Antes de usar cualquiera de los datos de comando a continuación, realiza los siguientes reemplazos:

PROJECT_ID: Es el ID del proyecto Google Cloud en el que deseas crear el recurso persistente.
LOCATION: la región en la que deseas crear el recurso persistente. Para obtener una lista de las regiones compatibles, consulta Disponibilidad de funciones.
PERSISTENT_RESOURCE_ID: el ID del recurso persistente.
DISPLAY_NAME: (opcional) el nombre visible del recurso persistente.
MACHINE_TYPE: el tipo de VM que se usará. Para obtener una lista de las VMs compatibles, consulta Tipos de máquinas. Este campo corresponde al campo machineSpec.machineType en el mensaje de la API de ResourcePool.
ACCELERATOR_TYPE: (Opcional) El tipo de GPU que se conectará a cada VM en el grupo de recursos. Para obtener una lista de las GPU compatibles, consulta GPU. Este campo corresponde al campo machineSpec.acceleratorType en el mensaje de la API de ResourcePool.
ACCELERATOR_COUNT: Es la cantidad de GPU que se deben adjuntar a cada VM en el grupo de recursos (opcional). El valor predeterminado es 1. Este campo corresponde al campo machineSpec.acceleratorCount en el mensaje de la API de ResourcePool.
REPLICA_COUNT: la cantidad de réplicas que se crearán cuando se cree este grupo de recursos. Este campo corresponde al campo replicaCount en el mensaje de la API de ResourcePool. Este campo es obligatorio si no especificas MIN_REPLICA_COUNT y MAX_REPLICA_COUNT.
MIN_REPLICA_COUNT: (opcional) la cantidad mínima de réplicas a la que el ajuste de escala automático puede reducir la escala para este grupo de recursos. MIN_REPLICA_COUNT y MAX_REPLICA_COUNT son necesarios para habilitar el ajuste de escala automático en este grupo de recursos.
MAX_REPLICA_COUNT: (opcional) la cantidad máxima de réplicas a la que el ajuste de escala automático puede escalar verticalmente para este grupo de recursos. MIN_REPLICA_COUNT y MAX_REPLICA_COUNT son necesarios para habilitar el ajuste de escala automático en este grupo de recursos.
BOOT_DISK_TYPE: Es el tipo de disco que se usará para el disco de arranque de cada VM en el grupo de recursos (opcional). Este campo corresponde al campo diskSpec.bootDiskType en el mensaje de la API de ResourcePool. Los valores aceptables son los siguientes:
- pd-standard (predeterminada)
- pd-ssd
BOOT_DISK_SIZE_GB: El tamaño del disco en GiB para el disco de arranque de cada VM en el grupo de recursos (opcional). Los valores aceptables son 100 (predeterminado) como 64000. Este campo corresponde al campo diskSpec.bootDiskSizeGb en el mensaje de la API de ResourcePool.
CONFIG: ruta de acceso al archivo de configuración YAML del recurso persistente. Este archivo debe contener una lista de ResourcePool. Si se especifica una opción en el archivo de configuración y en los argumentos de la línea de comandos, los argumentos de la línea de comandos anulan el archivo de configuración. Ten en cuenta que las claves con guiones bajos no son válidas.
Archivo de configuración YAML de ejemplo:
```
resourcePoolSpecs:
  machineSpec:
    machineType: n1-standard-4
  replicaCount: 1
    
```

Ejecuta el siguiente comando:

Linux, macOS o Cloud Shell

gcloud ai persistent-resources create \
    --persistent-resource-id=PERSISTENT_RESOURCE_ID \
    --display-name=DISPLAY_NAME \
    --project=PROJECT_ID \
    --region=LOCATION \
    --resource-pool-spec="replica-count=REPLICA_COUNT,min-replica-count=MIN_REPLICA_COUNT,max-replica-count=MAX_REPLICA_COUNT,machine-type=MACHINE_TYPE,accelerator-type=ACCELERATOR_TYPE,accelerator-count=ACCELERATOR_COUNT,disk-type=BOOT_DISK_TYPE,disk-size=BOOT_DISK_SIZE_GB"

Windows (PowerShell)

gcloud ai persistent-resources create `
    --persistent-resource-id=PERSISTENT_RESOURCE_ID `
    --display-name=DISPLAY_NAME `
    --project=PROJECT_ID `
    --region=LOCATION `
    --resource-pool-spec="replica-count=REPLICA_COUNT,min-replica-count=MIN_REPLICA_COUNT,max-replica-count=MAX_REPLICA_COUNT,machine-type=MACHINE_TYPE,accelerator-type=ACCELERATOR_TYPE,accelerator-count=ACCELERATOR_COUNT,disk-type=BOOT_DISK_TYPE,disk-size=BOOT_DISK_SIZE_GB"

Windows (cmd.exe)

gcloud ai persistent-resources create ^
    --persistent-resource-id=PERSISTENT_RESOURCE_ID ^
    --display-name=DISPLAY_NAME ^
    --project=PROJECT_ID ^
    --region=LOCATION ^
    --resource-pool-spec="replica-count=REPLICA_COUNT,min-replica-count=MIN_REPLICA_COUNT,max-replica-count=MAX_REPLICA_COUNT,machine-type=MACHINE_TYPE,accelerator-type=ACCELERATOR_TYPE,accelerator-count=ACCELERATOR_COUNT,disk-type=BOOT_DISK_TYPE,disk-size=BOOT_DISK_SIZE_GB"

Deberías recibir una respuesta similar a la que figura a continuación:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Operation to create PersistentResource [projects/123456789012/locations/us-central1/persistentResources/mypersistentresource/operations/1234567890123456789] is submitted successfully.

You may view the status of your PersistentResource create operation with the command

  $ gcloud ai operations describe projects/sample-project/locations/us-central1/operations/1234567890123456789

Comando gcloud de ejemplo

gcloud ai persistent-resources create \
    --persistent-resource-id=my-persistent-resource \
    --region=us-central1 \
    --resource-pool-spec="min-replica-count=4,max-replica-count=12,machine-type=n1-highmem-2,accelerator-type=NVIDIA_TESLA_T4,accelerator-count=1,disk-type=pd-standard,disk-size=200" \
    --resource-pool-spec="replica-count=4,machine-type=n1-standard-4"

Configuraciones `gcloud` avanzadas

Si deseas especificar opciones de configuración que no están disponibles en los ejemplos anteriores, puedes usar la marca --config para especificar la ruta a un archivo config.yaml en tu entorno local que contiene los campos de persistentResources. Por ejemplo:

gcloud ai persistent-resources create \
    --persistent-resource-id=PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION \
    --config=CONFIG

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.

Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

Para crear un recurso persistente que puedas usar con una ejecución de canalización, establece el parámetro enable_custom_service_account en True en el objeto ResourceRuntimeSpec mientras creas el recurso persistente.

from google.cloud.aiplatform.preview import persistent_resource
from google.cloud.aiplatform_v1beta1.types.persistent_resource import ResourcePool
from google.cloud.aiplatform_v1beta1.types.machine_resources import MachineSpec

# Create the persistent resource. This method returns the created resource.

my_example_resource = persistent_resource.PersistentResource.create(
    persistent_resource_id='PERSISTENT_RESOURCE_ID',
    display_name='DISPLAY_NAME',
    resource_pools=[
        ResourcePool(
            machine_spec=MachineSpec(
                machine_type='MACHINE_TYPE'
            ),
            replica_count=REPLICA_COUNT
        )
    ],
    enable_custom_service_account=True,
)

# Setting `sync` to `False` makes the method is non-blocking and the resource
# object returned syncs when the method completes.

SYNC=False

if not SYNC:
    my_example_resource.wait()

Reemplaza lo siguiente:

PERSISTENT_RESOURCE_ID: Es un ID único definido por el usuario para el recurso persistente. Debe comenzar con una letra, terminar con una letra o un número, y contener solo letras en minúscula, números y guiones (-).
DISPLAY_NAME: Opcional Es el nombre visible del recurso persistente.
MACHINE_TYPE: Es el tipo de máquina virtual (VM) que se usará. Para obtener una lista de las VMs compatibles, consulta Tipos de máquinas. Este campo corresponde al campo machineSpec.machineType en el
REPLICA_COUNT: Es la cantidad de réplicas que se crearán cuando se cree este grupo de recursos.

REST

Un recurso persistente puede tener uno o más grupos de recursos (machine_spec), y cada grupo de recursos puede tener habilitado o inhabilitado el ajuste de escala automático.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

PROJECT_ID: Es el ID del proyecto Google Cloud en el que deseas crear el recurso persistente.
LOCATION: la región en la que deseas crear el recurso persistente. Para obtener una lista de las regiones compatibles, consulta Disponibilidad de funciones.
PERSISTENT_RESOURCE_ID: el ID del recurso persistente.
DISPLAY_NAME: (opcional) el nombre visible del recurso persistente.
MACHINE_TYPE: el tipo de VM que se usará. Para obtener una lista de las VMs compatibles, consulta Tipos de máquinas. Este campo corresponde al campo machineSpec.machineType en el mensaje de la API de ResourcePool.
ACCELERATOR_TYPE: (Opcional) El tipo de GPU que se conectará a cada VM en el grupo de recursos. Para obtener una lista de las GPU compatibles, consulta GPU. Este campo corresponde al campo machineSpec.acceleratorType en el mensaje de la API de ResourcePool.
ACCELERATOR_COUNT: Es la cantidad de GPU que se deben adjuntar a cada VM en el grupo de recursos (opcional). El valor predeterminado es 1. Este campo corresponde al campo machineSpec.acceleratorCount en el mensaje de la API de ResourcePool.
REPLICA_COUNT: la cantidad de réplicas que se crearán cuando se cree este grupo de recursos. Este campo corresponde al campo replicaCount en el mensaje de la API de ResourcePool. Este campo es obligatorio si no especificas MIN_REPLICA_COUNT y MAX_REPLICA_COUNT.
MIN_REPLICA_COUNT: (opcional) la cantidad mínima de réplicas a la que el ajuste de escala automático puede reducir la escala para este grupo de recursos. MIN_REPLICA_COUNT y MAX_REPLICA_COUNT son necesarios para habilitar el ajuste de escala automático en este grupo de recursos.
MAX_REPLICA_COUNT: (opcional) la cantidad máxima de réplicas a la que el ajuste de escala automático puede escalar verticalmente para este grupo de recursos. MIN_REPLICA_COUNT y MAX_REPLICA_COUNT son necesarios para habilitar el ajuste de escala automático en este grupo de recursos.
BOOT_DISK_TYPE: Es el tipo de disco que se usará para el disco de arranque de cada VM en el grupo de recursos (opcional). Este campo corresponde al campo diskSpec.bootDiskType en el mensaje de la API de ResourcePool. Los valores aceptables son los siguientes:
- pd-standard (predeterminada)
- pd-ssd
BOOT_DISK_SIZE_GB: El tamaño del disco en GiB para el disco de arranque de cada VM en el grupo de recursos (opcional). Los valores aceptables son 100 (predeterminado) como 64000. Este campo corresponde al campo diskSpec.bootDiskSizeGb en el mensaje de la API de ResourcePool.

Método HTTP y URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources?persistent_resource_id=PERSISTENT_RESOURCE_ID

Cuerpo JSON de la solicitud:

{
  "display_name": "DISPLAY_NAME",
  "resource_pools": [
    {
      "machine_spec": {
        "machine_type": "MACHINE_TYPE",
        "accelerator_type": "ACCELERATOR_TYPE",
        "accelerator_count": ACCELERATOR_COUNT
      },
      "replica_count": REPLICA_COUNT,
      "autoscaling_spec": {
        "min_replica_count": MIN_REPLICA_COUNT,
        "max_replica_count": MAX_REPLICA_COUNT
      },
      "disk_spec": {
        "boot_disk_type": "BOOT_DISK_TYPE",
        "boot_disk_size_gb": BOOT_DISK_SIZE_GB
      }
    }
  ]
}

Para enviar tu solicitud, expande una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json. Ejecuta el comando siguiente en la terminal para crear o reemplazar este archivo en el directorio actual:

cat > request.json << 'EOF'
{
  "display_name": "DISPLAY_NAME",
  "resource_pools": [
    {
      "machine_spec": {
        "machine_type": "MACHINE_TYPE",
        "accelerator_type": "ACCELERATOR_TYPE",
        "accelerator_count": ACCELERATOR_COUNT
      },
      "replica_count": REPLICA_COUNT,
      "autoscaling_spec": {
        "min_replica_count": MIN_REPLICA_COUNT,
        "max_replica_count": MAX_REPLICA_COUNT
      },
      "disk_spec": {
        "boot_disk_type": "BOOT_DISK_TYPE",
        "boot_disk_size_gb": BOOT_DISK_SIZE_GB
      }
    }
  ]
}
EOF

Luego, ejecuta el siguiente comando para enviar tu solicitud de REST:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources?persistent_resource_id=PERSISTENT_RESOURCE_ID"

PowerShell (Windows)

Nota: El siguiente comando supone que accediste a la CLI de gcloud con tu cuenta de usuario mediante la ejecución de gcloud init o gcloud auth login. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json. Ejecuta el comando siguiente en la terminal para crear o reemplazar este archivo en el directorio actual:

@'
{
  "display_name": "DISPLAY_NAME",
  "resource_pools": [
    {
      "machine_spec": {
        "machine_type": "MACHINE_TYPE",
        "accelerator_type": "ACCELERATOR_TYPE",
        "accelerator_count": ACCELERATOR_COUNT
      },
      "replica_count": REPLICA_COUNT,
      "autoscaling_spec": {
        "min_replica_count": MIN_REPLICA_COUNT,
        "max_replica_count": MAX_REPLICA_COUNT
      },
      "disk_spec": {
        "boot_disk_type": "BOOT_DISK_TYPE",
        "boot_disk_size_gb": BOOT_DISK_SIZE_GB
      }
    }
  ]
}
'@  | Out-File -FilePath request.json -Encoding utf8

Luego, ejecuta el siguiente comando para enviar tu solicitud de REST:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources?persistent_resource_id=PERSISTENT_RESOURCE_ID" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

{
  "name": "projects/123456789012/locations/us-central1/persistentResources/mypersistentresource/operations/1234567890123456789",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreatePersistentResourceOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-02-08T21:17:15.009668Z",
      "updateTime": "2023-02-08T21:17:15.009668Z"
    }
  }
}

Agotamiento de recursos

Es posible que haya recursos insuficientes, como las GPU A100, lo que puede provocar una falla de creación de recursos persistentes cuando no hay recursos disponibles en la región que especificaste. En este caso, puedes intentar reducir la cantidad de réplicas, cambiar a un tipo de acelerador diferente, volver a intentarlo durante las horas de menor demanda o probar con otra región.

Crea un recurso persistente

Roles requeridos

Crea un recurso persistente

Console

De uso general

Optimizado para procesamiento

Con optimización de memoria

GPU

gcloud

Linux, macOS o Cloud Shell

Windows (PowerShell)

Windows (cmd.exe)

Configuraciones gcloud avanzadas

Python

REST

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Agotamiento de recursos

¿Qué sigue?

Configuraciones `gcloud` avanzadas