Descripción general de los recursos persistentes

Un recurso persistente de Vertex AI es un clúster de larga duración que puedes crear para ejecutar trabajos de entrenamiento personalizados. Una vez que se completa un trabajo de entrenamiento, el recurso persistente permanece disponible para ejecutar otros trabajos de entrenamiento hasta que lo borres. Puedes usar un recurso persistente para garantizar la disponibilidad del recurso de procesamiento y reducir el tiempo de inicio del trabajo que, de lo contrario, es necesario para la creación del recurso de procesamiento. Los recursos persistentes admiten todas las VMs y GPU compatibles con los trabajos de entrenamiento personalizados. En esta página, se explica cuándo usar un recurso persistente y se proporciona información sobre la facturación y la cuota.

Cuándo usar un recurso persistente

Recomendamos usar recursos persistentes en las siguientes situaciones:

  • Deseas garantizar la disponibilidad de capacidad para las cargas de trabajo de AA críticas o durante las temporadas de mayor demanda. A diferencia de los trabajos personalizados, en los que el servicio de entrenamiento libera el recurso después de que se completa el trabajo, el recurso persistente permanece disponible hasta que se borra.
  • Envías el mismo trabajo varias veces y puedes beneficiarte del almacenamiento en caché de datos e imágenes mediante la ejecución de los trabajos en el mismo recurso persistente.
  • Ejecutas muchos trabajos de entrenamiento de corta duración en los que el tiempo de entrenamiento real es más corto que el tiempo de inicio del trabajo.

Para obtener más contexto sobre cuándo y por qué usar un recurso persistente, consulta la entrada de blog Lleva la garantía de la capacidad y tiempos de inicio más rápidos a Vertex AI Training.

Detalles de facturación

Se te factura por todo el tiempo que un recurso persistente está en estado de ejecución, sin importar si hay un trabajo en ejecución en el recurso persistente. Para cada instancia en el grupo de recursos persistentes, se te factura por hora principal. Todos los trabajos que se ejecutan en un recurso persistente no se cobran por separado. Solo se te facturará por el recurso persistente.

Si configuras el ajuste de escala automático para tu recurso persistente, solo pagas por las instancias aprovisionadas. Por ejemplo, si min-replica-count se configura como 4, las instancias 4 siempre se aprovisionan y esta es la cantidad mínima que se te factura. Cuando tu carga de trabajo aumenta, el grupo de recursos puede escalar verticalmente hasta 6 para satisfacer la demanda creciente. Luego, se te facturará por las instancias aprovisionadas 6 hasta que el grupo de recursos vuelva a reducir la escala. Con el objetivo de pagar nodos inactivos, usa el ajuste de escala automático para tu recurso persistente o bórralo cuando ya no lo necesites. Para obtener más información sobre los precios, consulta la sección Modelos entrenados personalizados en la página de precios de Vertex AI.

Cuotas

Los recursos persistentes usan tu cuota de entrenamiento, por lo que debes verificar que tengas suficiente cuota para la creación de recursos persistentes. Para obtener más información sobre las cuotas, consulta Cuotas y límites de entrenamiento.

¿Qué sigue?