Membuat instance Deep Learning VM PyTorch

Halaman ini menunjukkan cara membuat instance Deep Learning VM Image PyTorch dengan PyTorch dan alat lainnya yang telah diinstal sebelumnya. Anda dapat membuat instance PyTorch dari Cloud Marketplace dalam konsol Google Cloud atau menggunakan command line.

Sebelum memulai

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Jika Anda menggunakan GPU dengan Deep Learning VM, periksa halaman kuota untuk memastikan bahwa Anda memiliki cukup GPU yang tersedia dalam project Anda. Jika GPU tidak tercantum di halaman kuota atau Anda memerlukan kuota GPU tambahan, minta penambahan kuota.

Membuat instance Deep Learning VM PyTorch dari Cloud Marketplace

Untuk membuat instance VM Deep Learning PyTorch dari Cloud Marketplace, selesaikan langkah-langkah berikut:

  1. Buka halaman Deep Learning VM Cloud Marketplace di konsol Google Cloud.

    Buka halaman Deep Learning VM Cloud Marketplace

  2. Klik Mulai.

  3. Masukkan Nama deployment, yang akan menjadi root nama VM Anda. Compute Engine akan menambahkan -vm ke nama ini saat memberi nama instance Anda.

  4. Pilih Zone.

  5. Di bagian Machine type, pilih spesifikasi yang Anda inginkan untuk VM. Pelajari jenis mesin lebih lanjut.

  6. Di bagian GPUs, pilih GPU type dan Number of GPUs. Jika Anda tidak ingin menggunakan GPU, klik tombol Hapus GPU dan lanjutkan ke langkah 7. Pelajari GPU lebih lanjut.

    1. Pilih Jenis GPU. Tidak semua jenis GPU tersedia di semua zona. Temukan kombinasi yang didukung.
    2. Pilih Number of GPUs. Setiap GPU mendukung jumlah GPU yang berbeda. Temukan kombinasi yang didukung.
  7. Di bagian Framework, pilih PyTorch 1.8 + fast.ai 2.1 (CUDA 11.0).

  8. Jika Anda menggunakan GPU, driver NVIDIA diperlukan. Anda dapat menginstal driver sendiri, atau memilih Instal driver GPU NVIDIA secara otomatis saat mulai pertama kali.

  9. Anda memiliki opsi untuk memilih Aktifkan akses ke JupyterLab melalui URL, bukan SSH (Beta). Dengan mengaktifkan fitur Beta ini, Anda dapat mengakses instance JupyterLab menggunakan URL. Siapa pun yang memiliki peran Editor atau Pemilik di project Google Cloud Anda dapat mengakses URL ini. Saat ini, fitur ini hanya berfungsi di Amerika Serikat, Uni Eropa, dan Asia.

  10. Pilih jenis dan ukuran boot disk.

  11. Pilih setelan jaringan yang Anda inginkan.

  12. Klik Deploy.

Jika Anda memilih untuk menginstal driver NVIDIA, tunggu 3-5 menit hingga penginstalan selesai.

Setelah VM di-deploy, halaman akan diperbarui dengan petunjuk untuk mengakses instance.

Membuat instance PyTorch Deep Learning VM dari command line

Untuk menggunakan Google Cloud CLI guna membuat instance VM Deep Learning baru, Anda harus menginstal dan menginisialisasi Google Cloud CLI terlebih dahulu:

  1. Download dan instal Google Cloud CLI menggunakan petunjuk yang diberikan di bagian Menginstal Google Cloud CLI.
  2. Lakukan inisialisasi SDK menggunakan petunjuk yang diberikan di Menginisialisasi Cloud SDK.

Untuk menggunakan gcloud di Cloud Shell, aktifkan Cloud Shell terlebih dahulu menggunakan petunjuk yang diberikan di Memulai Cloud Shell.

Tanpa GPU

Untuk membuat instance Deep Learning VM dengan kelompok image PyTorch terbaru dan CPU, masukkan perintah berikut di command line:

export IMAGE_FAMILY="pytorch-latest-cpu"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-instance"

gcloud compute instances create $INSTANCE_NAME \
  --zone=$ZONE \
  --image-family=$IMAGE_FAMILY \
  --image-project=deeplearning-platform-release

Opsi:

  • --image-family harus berupa pytorch-latest-cpu atau pytorch-VERSION-cpu (misalnya, pytorch-1-13-cpu).

  • --image-project harus berupa deeplearning-platform-release.

Dengan satu atau beberapa GPU

Compute Engine menawarkan opsi untuk menambahkan satu atau beberapa GPU ke instance virtual machine Anda. GPU menawarkan pemrosesan yang lebih cepat untuk banyak tugas data dan machine learning yang kompleks. Untuk mempelajari GPU lebih lanjut, lihat GPU di Compute Engine.

Untuk membuat instance Deep Learning VM dengan grup image PyTorch terbaru dan satu atau beberapa GPU yang terpasang, masukkan perintah berikut di command line:

export IMAGE_FAMILY="pytorch-latest-gpu"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-instance"

gcloud compute instances create $INSTANCE_NAME \
  --zone=$ZONE \
  --image-family=$IMAGE_FAMILY \
  --image-project=deeplearning-platform-release \
  --maintenance-policy=TERMINATE \
  --accelerator="type=nvidia-tesla-v100,count=1" \
  --metadata="install-nvidia-driver=True"

Opsi:

  • --image-family harus berupa pytorch-latest-gpu atau pytorch-VERSION-CUDA-VERSION (misalnya, pytorch-1-10-cu110).

  • --image-project harus berupa deeplearning-platform-release.

  • --maintenance-policy harus berupa TERMINATE. Untuk mempelajari lebih lanjut, lihat Batasan GPU.

  • --accelerator menentukan jenis GPU yang akan digunakan. Harus ditentukan dalam format --accelerator="type=TYPE,count=COUNT". Misalnya, --accelerator="type=nvidia-tesla-p100,count=2". Lihat tabel model GPU untuk mengetahui daftar jenis dan jumlah GPU yang tersedia.

    Tidak semua jenis GPU didukung di semua region. Untuk mengetahui detailnya, lihat Ketersediaan region dan zona GPU.

  • --metadata digunakan untuk menentukan bahwa driver NVIDIA harus diinstal atas nama Anda. Nilainya adalah install-nvidia-driver=True. Jika ditentukan, Compute Engine akan memuat driver stabil terbaru saat booting pertama dan melakukan langkah-langkah yang diperlukan (termasuk mulai ulang akhir untuk mengaktifkan driver).

Jika Anda memilih untuk menginstal driver NVIDIA, tunggu 3-5 menit hingga penginstalan selesai.

Mungkin perlu waktu hingga 5 menit sebelum VM Anda disediakan sepenuhnya. Selama waktu ini, Anda tidak akan dapat melakukan SSH ke komputer. Setelah penginstalan selesai, untuk memastikan bahwa penginstalan driver berhasil, Anda dapat menggunakan SSH dan menjalankan nvidia-smi.

Setelah mengonfigurasi image, Anda dapat menyimpan snapshot image sehingga dapat memulai instance turunan tanpa harus menunggu penginstalan driver.

Membuat instance preemptible

Anda dapat membuat instance Deep Learning VM preemptible. Instance preemptible adalah instance yang dapat Anda buat dan jalankan dengan harga yang jauh lebih rendah daripada instance normal. Namun, Compute Engine dapat menghentikan (preempt) instance ini jika memerlukan akses ke resource tersebut untuk tugas lainnya. Preemptible instance selalu berhenti setelah 24 jam. Untuk mempelajari instance preemptible lebih lanjut, lihat Instance VM Preemptible.

Untuk membuat instance Deep Learning VM preemptible:

  • Ikuti petunjuk yang ada di atas untuk membuat instance baru menggunakan command line. Untuk perintah gcloud compute instances create, tambahkan hal berikut:

      --preemptible

Langkah selanjutnya

Untuk petunjuk cara menghubungkan ke instance Deep Learning VM baru melalui konsol Google Cloud atau command line, lihat Menghubungkan ke Instance. Nama instance Anda adalah Nama deployment yang Anda tentukan dengan tambahan -vm.