Panoramica della risorsa permanente

Una risorsa permanente Vertex AI è un cluster a lunga esecuzione che puoi per eseguire job di addestramento personalizzati. Al termine di un job di addestramento, rimane disponibile per eseguire altri job di addestramento finché non eliminarlo. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e ridurre il tempo di avvio del job altrimenti necessario per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU che sono supportate da job di addestramento personalizzati. In questa pagina viene spiegato quando utilizzare un oggetto risorsa permanente e fornisce informazioni su fatturazione e quota.

Quando utilizzare una risorsa permanente

Ti consigliamo di utilizzare le risorse permanenti nei seguenti scenari:

  • Vuoi garantire la disponibilità di capacità per carichi di lavoro ML critici o durante durante i periodi di alta stagione. A differenza dei job personalizzati, in cui il servizio di addestramento viene rilasciato della risorsa al termine del job, la risorsa permanente rimane disponibile viene eliminata.
  • Stai inviando lo stesso job più volte e puoi trarre vantaggio da dati e di memorizzazione nella cache delle immagini eseguendo i job sulla stessa risorsa permanente.
  • Esegui molti job di addestramento di breve durata in cui il tempo effettivo è rispetto al tempo di avvio del job.

Per saperne di più su quando e perché utilizzare una risorsa permanente, vedi il post del blog Garantire la capacità e tempi di avvio più rapidi per Vertex AI Training.

Dettagli di fatturazione

Ti viene addebitato l'intero periodo di tempo in cui una risorsa permanente si trova in indipendentemente dal fatto che sia presente un job in esecuzione risorsa. Per ogni istanza nel pool di risorse permanenti, il costo ora core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.

Se configuri la scalabilità automatica per la risorsa permanente, paghi solo per le istanze di cui è stato eseguito il provisioning. Ad esempio, se il criterio min-replica-count è impostato su 4, Viene sempre eseguito il provisioning di 4 istanze e questo è l'importo minimo che ti viene addebitato . Quando il carico di lavoro aumenta, il pool di risorse potrebbe fare lo scale up fino a 6 per rispondere all'aumento della domanda. Dopodiché, ti verranno addebitate le istanze di cui è stato eseguito il provisioning per 6 fino a quando il pool di risorse non verrà ridotto di nuovo. Per evitare di pagare per i nodi inattivi, usa la scalabilità automatica per la risorsa permanente, oppure eliminala ne hai bisogno. Per saperne di più sui prezzi, consulta la sezione Modelli con addestramento personalizzato nella pagina dei prezzi di Vertex AI.

Quote

Le risorse permanenti utilizzano la quota di addestramento, quindi verifica di avere una quota sufficiente per la creazione di risorse permanenti. Per saperne di più sulle quote, consulta Quote e limiti per l'addestramento.

Passaggi successivi