Dokumen ini menjelaskan cara membuat grup instance terkelola (MIG) dengan instance virtual machine (VM) yang telah memasang GPU. Panduan ini menjelaskan cara menambahkan VM GPU sekaligus dalam grup menggunakan permintaan pengubahan ukuran.
Penggunaan permintaan pengubahan ukuran akan meningkatkan ketersediaan VM GPU di MIG. Dalam permintaan, tentukan jumlah VM GPU dan durasi yang Anda inginkan untuk menjalankan VM tersebut. Dynamic Workload Scheduler (DWS), mekanisme penjadwal yang mendasarinya, menjadwalkan permintaan pengubahan ukuran yang dibuat di seluruh Compute Engine berdasarkan durasi yang diminta dan ketersediaan resource. Saat resource tersedia, MIG akan otomatis membuat VM.
Jika tugas yang berjalan di VM ini selesai lebih awal dari durasi yang diminta, Anda dapat menghapus VM tersebut. Jika tidak, MIG akan otomatis menghapus VM saat durasi berakhir.
Anda juga dapat membaca skenario dasar lainnya untuk membuat MIG.
Sebelum memulai
- Untuk memastikan Anda memiliki kuota GPU yang cukup untuk resource yang Anda minta, periksa kuota GPU Anda.
- Untuk memahami penggunaan kuota, baca VM GPU dan kuota alokasi yang dapat dihentikan.
-
Jika Anda belum melakukannya, siapkan autentikasi.
Autentikasi adalah
proses verifikasi identitas Anda untuk mengakses layanan dan API Google Cloud.
Untuk menjalankan kode atau contoh dari lingkungan pengembangan lokal, Anda dapat mengautentikasi ke Compute Engine dengan memilih salah satu opsi berikut:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
Buat template instance, yang diperlukan untuk membuat MIG. MIG membuat setiap VM dalam grup berdasarkan template instance. Dalam template, tentukan konfigurasi untuk VM GPU dan konfigurasi tambahan yang diperlukan untuk menggunakan permintaan pengubahan ukuran.
Untuk mengetahui informasi selengkapnya tentang template instance, lihat Tentang template instance.
Buat MIG dan permintaan pengubahan ukuran untuk menambahkan VM GPU sekaligus.
Buka halaman Template instance.
Klik Create instance template.
Di kolom Name, masukkan nama untuk template instance.
Di bagian Machine configuration, lakukan hal berikut:
- Klik tab GPU.
- Dalam daftar GPU type, pilih jenis GPU.
- Dalam daftar Number of GPU, pilih jumlah GPU.
- Dalam daftar Machine type, pilih jenis mesin.
Opsional: Untuk mengubah jenis atau image boot disk nilai default, di bagian Boot disk, klik Change. Kemudian, ikuti petunjuk untuk mengubah disk booting.
Luaskan bagian Opsi lanjutan, lalu lakukan hal berikut:
- Luaskan bagian Management.
- Dalam daftar Reservations, pilih Don't use.
Klik Create.
INSTANCE_TEMPLATE_NAME
: nama template instance.MACHINE_TYPE
: jenis mesin yang mendukung GPU. Jika Anda menentukan jenis mesin N1, sertakan flag--accelerator
untuk menentukan jumlah dan jenis GPU yang akan dilampirkan ke VM Anda.PROJECT_ID
: ID project tempat Anda ingin membuat MIG.INSTANCE_TEMPLATE_NAME
: nama template instance.MACHINE_TYPE
: jenis mesin yang mendukung GPU. Jika Anda menentukan jenis mesin N1, sertakan kolomguestAccelerators
untuk menentukan jumlah dan jenis GPU yang akan dilampirkan ke VM Anda.Buka halaman Instance groups.
Klik Create instance group.
Masukkan kolom berikut:
- Nama: Masukkan nama untuk grup.
- Instance template: Pilih template instance yang Anda konfigurasi di bagian sebelumnya.
- Di bagian Lokasi:
- Pilih Single zone.
- Di daftar Region dan Zone, pilih lokasi tempat Anda ingin membuat grup.
Kolom Number of instances akan diaktifkan untuk diedit setelah Anda menghapus konfigurasi penskalaan otomatis dan menonaktifkan perbaikan di langkah berikutnya.
Hapus konfigurasi penskalaan otomatis sebagai berikut:
- Di bagian Autoscaling, klik daftar Autoscaling mode, lalu klik Delete autoscaling configuration.
- Pada dialog Hapus konfigurasi penskalaan otomatis?, klik Hapus.
Nonaktifkan perbaikan di MIG sebagai berikut:
Di bagian VM instance lifecycle, tetapkan kolom Default action on failure ke No action.
Tentukan jumlah VM GPU dan durasi operasi untuk membuat permintaan perubahan ukuran:
Di kolom Number of instances, masukkan jumlah VM GPU yang ingin Anda buat sekaligus.
Centang kotak Use resize request to create VMs all at once. Kolom untuk memasukkan durasi operasi akan muncul.
Di kolom Requested run duration dan daftar Unit, tentukan durasi operasi VM GPU. Durasi harus antara 1 jam dan 7 hari.
Klik Create.
Buat MIG zona menggunakan perintah
instance-groups managed create
.gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Di MIG, buat permintaan pengubahan ukuran menggunakan perintah
instance-groups managed resize-requests create
. Tentukan jumlah VM GPU yang Anda inginkan dan durasi yang ingin Anda gunakan untuk menjalankan VM tersebut.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION\ --zone=ZONE
INSTANCE_GROUP_NAME
: nama MIG.INSTANCE_TEMPLATE_NAME
: nama template instance untuk VM GPU.ZONE
: salah satu zona yang tersedia untuk Compute Engine.RESIZE_REQUEST_NAME
: nama permintaan perubahan ukuran.COUNT
: jumlah VM yang akan ditambahkan sekaligus dalam grup.RUN_DURATION
: durasi yang Anda inginkan untuk VM yang diminta. Nilai harus diformat sebagai jumlah hari, jam, menit, atau detik yang diikuti dengand
,h
,m
, dans
. Misalnya, tentukan30m
selama 30 menit atau1d2h3m4s
selama 1 hari, 2 jam, 3 menit, dan 4 detik. Nilainya harus antara 10 menit dan 7 hari.Buat MIG zona dengan membuat permintaan
POST
ke metodeinstanceGroupManagers.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Di MIG, buat permintaan pengubahan ukuran dengan membuat permintaan
POST
ke metodeinstanceGroupManagerResizeRequests.insert
. Dalam isi permintaan, tentukan jumlah VM GPU yang ingin Anda buat sekaligus dan durasi yang Anda inginkan untuk menjalankan VM tersebut.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT, "requestedRunDuration": { "seconds": "RUN_DURATION" } }
PROJECT_ID
: ID project tempat Anda ingin membuat MIG.INSTANCE_GROUP_NAME
: nama MIG.INSTANCE_TEMPLATE_NAME
: nama template instance untuk VM GPU.ZONE
: salah satu zona yang tersedia untuk Compute Engine.RESIZE_REQUEST_NAME
: nama permintaan perubahan ukuran.COUNT
: jumlah VM yang akan ditambahkan sekaligus dalam grup.RUN_DURATION
: durasi, dalam detik, yang Anda inginkan untuk VM yang diminta agar berjalan sebelum MIG otomatis menghapusnya. Nilainya harus antara600
, yaitu 600 detik (10 menit), dan604800
, yaitu 604.800 detik (7 hari).Pelajari cara kerja permintaan pengubahan ukuran di MIG.
Pelajari cara membuat MIG regional yang kompatibel dengan permintaan pengubahan ukuran (Pratinjau).
Pelajari cara melihat, membatalkan, atau menghapus permintaan perubahan ukuran di MIG.
Pelajari cara melihat info tentang MIG dan VM terkelola.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Untuk informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud.
Batasan
Tinjau batasan untuk membuat permintaan perubahan ukuran di MIG.
Membuat MIG dan menambahkan VM GPU sekaligus
Untuk membuat MIG dan menambahkan VM GPU sekaligus dalam grup, lakukan hal berikut:
Membuat template instance
Buat template instance seperti yang dijelaskan di bagian ini, lalu gunakan template tersebut untuk membuat MIG.
Konsol
gcloud
Buat template instance menggunakan perintah
instance-templates create
.Perintah berikut membuat template instance global berdasarkan Deep Learning VM image.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --machine-type=MACHINE_TYPE \ --image-project=deeplearning-platform-release \ --image-family=common-cu121 \ --maintenance-policy=TERMINATE \ --reservation-affinity=none
Ganti kode berikut:
REST
Buat template instance dengan membuat permintaan
POST
ke metodeinstanceTemplates.insert
.Permintaan berikut membuat template instance global berdasarkan Deep Learning VM image.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "machineType": "MACHINE_TYPE", "disks": [ { "boot": true, "mode": "READ_WRITE", "type": "PERSISTENT", "initializeParams": { "sourceImage": "projects/deeplearning-platform-release/global/images/family/common-cu121" } } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-IP", "type": "ONE_TO_ONE_NAT" } ], "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "onHostMaintenance": "TERMINATE" } } }
Ganti kode berikut:
Membuat MIG dan menambahkan VM GPU sekaligus
Buat MIG seperti yang dijelaskan di bagian ini. Untuk menggunakan permintaan pengubahan ukuran di MIG, Anda tidak boleh mengonfigurasi penskalaan otomatis dan harus menonaktifkan perbaikan.
Konsol
gcloud
Ganti kode berikut:
REST
Ganti kode berikut:
Permintaan pengubahan ukuran yang Anda buat tetap dalam status
ACCEPTED
hingga MIG membuat semua VM GPU yang diminta. Setelah semua VM GPU dibuat dalam grup, status permintaan akan berubah menjadiSUCCEEDED
.Langkah selanjutnya
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2024-11-27 UTC.
-