Halaman ini menunjukkan cara menjalankan tugas pelatihan kustom pada resource persisten menggunakan Google Cloud CLI, Vertex AI SDK untuk Python, dan REST API.
Biasanya, saat membuat tugas pelatihan kustom, Anda perlu menentukan resource komputasi yang dibuat dan dijalankan oleh tugas tersebut. Setelah membuat resource persisten, Anda dapat mengonfigurasi tugas pelatihan kustom untuk dijalankan pada satu atau beberapa kumpulan resource dari resource persisten tersebut. Menjalankan tugas pelatihan kustom pada resource persisten akan mengurangi waktu startup tugas yang biasanya diperlukan untuk pembuatan resource komputasi secara signifikan.
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan guna menjalankan tugas pelatihan kustom pada resource persisten,
minta administrator untuk memberi Anda
peran IAM Vertex AI User (roles/aiplatform.user
) di project Anda.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin aiplatform.customJobs.create
, yang diperlukan untuk menjalankan tugas pelatihan kustom pada resource persisten.
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Membuat tugas pelatihan yang berjalan di resource persisten
Untuk membuat tugas pelatihan kustom yang berjalan pada resource persisten, lakukan modifikasi berikut pada petunjuk standar untuk membuat tugas pelatihan kustom:
gcloud
- Tentukan flag
--persistent-resource-id
dan tetapkan nilai ke ID resource persisten (PERSISTENT_RESOURCE_ID) yang ingin Anda gunakan. - Tentukan flag
--worker-pool-spec
sehingga nilai untukmachine-type
dandisk-type
sama persis dengan kumpulan resource yang sesuai dari resource persisten. Tentukan satu--worker-pool-spec
untuk pelatihan node tunggal dan beberapa untuk pelatihan terdistribusi. - Tentukan
replica-count
yang kurang dari atau sama denganreplica-count
ataumax-replica-count
dari kumpulan resource yang terkait.
Python
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi Python API.
REST
- Tentukan parameter
persistent_resource_id
dan tetapkan nilai ke ID resource persisten (PERSISTENT_RESOURCE_ID) yang ingin Anda gunakan. - Tentukan parameter
worker_pool_specs
sedemikian rupa sehingga nilaimachine_spec
dandisk_spec
untuk setiap kumpulan resource sama persis dengan kumpulan resource yang sesuai dari resource persisten. Tentukan salah satumachine_spec
untuk pelatihan node tunggal dan beberapa untuk pelatihan terdistribusi. - Tentukan
replica_count
yang kurang dari atau sama denganreplica_count
ataumax_replica_count
dari kumpulan resource yang terkait, tidak termasuk jumlah replika tugas lain yang berjalan pada kumpulan resource tersebut.
Langkah berikutnya
- Mempelajari resource persisten.
- Membuat dan menggunakan resource persisten.
- Mendapatkan informasi tentang resource persisten.
- Memulai ulang resource persisten.
- Menghapus resource persisten.