Panoramica della risorsa permanente

Una risorsa permanente Vertex AI è un cluster a lunga esecuzione che puoi creare per eseguire job di addestramento personalizzato. Al termine di un job di addestramento, la risorsa permanente rimane disponibile per eseguire altri job di addestramento finché non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e per ridurre i tempi di avvio del job altrimenti necessari per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate da job di addestramento personalizzati. Questa pagina spiega quando utilizzare una risorsa persistente e fornisce informazioni su fatturazione e quota.

Quando utilizzare una risorsa permanente

Ti consigliamo di utilizzare risorse permanenti nei seguenti scenari:

  • Vuoi garantire la disponibilità di capacità per carichi di lavoro ML critici o durante i periodi di picco. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa dopo il completamento del job, la risorsa permanente rimane disponibile fino a quando non viene eliminata.
  • Stai inviando lo stesso job più volte e puoi trarre vantaggio dalla memorizzazione nella cache di dati e immagini eseguendo i job sulla stessa risorsa permanente.
  • Esegui molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è più breve del tempo di avvio del job.

Per saperne di più su quando e perché utilizzare una risorsa persistente, consulta il blog post Bringing capacità garanzia e tempi di avvio più rapidi per Vertex AI Training.

Dettagli di fatturazione

Ti viene addebitato il costo per l'intera durata del periodo in cui una risorsa permanente si trova in stato di esecuzione, indipendentemente dal fatto che ci sia un job in esecuzione sulla risorsa permanente. Per ogni istanza nel pool di risorse permanenti, i costi sono fatturati per ora core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo per la risorsa permanente.

Se configuri la scalabilità automatica per la risorsa permanente, paghi solo per le istanze di cui è stato eseguito il provisioning. Ad esempio, se il criterio min-replica-count è impostato su 4, viene sempre eseguito il provisioning di 4 istanze e questo è l'importo minimo che ti viene addebitato. Quando il carico di lavoro aumenta, il pool di risorse potrebbe fare lo scale up fino a 6 per adeguare l'aumento della domanda. Quindi ti verrà addebitato il costo per le 6 istanze di cui è stato eseguito il provisioning fino a quando il pool di risorse non farà nuovamente lo scale down. Per evitare di pagare per i nodi inattivi, utilizza la scalabilità automatica per la risorsa permanente o eliminala quando non ti serve più. Per scoprire di più sui prezzi, consulta la sezione Modelli con addestramento personalizzato nella pagina dei prezzi di Vertex AI.

Quote

Le risorse permanenti utilizzano la tua quota di addestramento, quindi verifica di disporre di una quota sufficiente per la creazione di risorse permanenti. Per saperne di più sulle quote, consulta Quote e limiti per l'addestramento.

Passaggi successivi