Resource persisten Vertex AI adalah cluster yang berjalan lama, yang dapat Anda buat untuk menjalankan tugas pelatihan kustom. Setelah tugas pelatihan selesai, resource persisten akan tetap tersedia untuk menjalankan tugas pelatihan lainnya sampai Anda menghapusnya. Anda dapat menggunakan resource persisten untuk memastikan ketersediaan resource komputasi, dan untuk mengurangi waktu startup tugas yang biasanya diperlukan untuk pembuatan resource komputasi. Halaman ini menjelaskan kapan Anda harus menggunakan resource persisten, serta memberikan Anda informasi terkait penagihan dan kuota.
Kapan harus menggunakan resource persisten
Sebaiknya gunakan resource persisten dalam skenario berikut ini:
- Anda ingin memastikan ketersediaan kapasitas untuk workload ML penting atau selama musim puncak. Tidak seperti tugas kustom, yang mengharuskan layanan pelatihan untuk merilis resource setelah tugas selesai, resource persisten akan tetap tersedia hingga resource persisten tersebut dihapus.
- Anda mengirimkan tugas yang sama beberapa kali, dan bisa mendapatkan manfaat dari data dan cache gambar dengan menjalankan tugas tersebut pada resource persisten yang sama.
- Anda menjalankan banyak tugas pelatihan berjangka pendek, yang waktu pelatihan sebenarnya lebih singkat dari waktu startup tugas.
Untuk mengetahui konteks selengkapnya tentang kapan dan mengapa menggunakan resource persisten, lihat postingan blog Menghadirkan jaminan kapasitas dan waktu startup yang lebih cepat ke Pelatihan Vertex AI.
Detail penagihan
Anda akan dikenai biaya untuk seluruh durasi jika resource persisten berada dalam status berjalan, terlepas dari apakah ada tugas yang berjalan pada resource persisten tersebut, atau tidak. Untuk setiap instance dalam kumpulan resource persisten, Anda akan ditagih berdasarkan jam inti. Semua tugas yang berjalan pada resource persisten tidak dikenai biaya secara terpisah. Anda hanya ditagih untuk resource persisten.
Jika menyiapkan penskalaan otomatis untuk resource persisten, Anda hanya perlu untuk membayar
instance yang disediakan. Misalnya, jika min-replica-count
ditetapkan ke 4
,
instance 4
selalu disediakan, dan ini adalah jumlah minimum yang ditagihkan
kepada Anda. Saat workload Anda meningkat, kumpulan resource mungkin akan diskalakan hingga 6
untuk
mengakomodasi peningkatan permintaan. Kemudian, Anda akan ditagih untuk instance 6
yang disediakan
sampai kumpulan resource Anda turun lagi. Agar tidak perlu membayar node yang tidak memiliki aktivitas,
gunakan penskalaan otomatis untuk resource persisten, atau hapus resource tersebut saat Anda
tidak lagi memerlukannya. Untuk mempelajari harga lebih lanjut, lihat bagian Model yang dilatih khusus
di halaman harga Vertex AI.
Kuota
Resource persisten menggunakan kuota pelatihan Anda, sehingga, pastikan Anda memiliki kuota yang cukup untuk pembuatan resource persisten. Untuk mempelajari kuota lebih lanjut, lihat Kuota dan batas pelatihan.
Langkah selanjutnya
- Membuat dan menggunakan resource persisten.
- Menjalankan tugas pelatihan pada resource persisten.
- Mendapatkan informasi tentang resource persisten.
- Menghapus resource persisten.