Membuat instance VM TensorFlow Deep Learning

Halaman ini menunjukkan cara membuat instance TensorFlow Deep Learning VM Image dengan TensorFlow dan fitur lain yang sudah diinstal sebelumnya. Anda dapat membuat instance TensorFlow dari Cloud Marketplace dalam Konsol Google Cloud atau menggunakan command line.

Sebelum memulai

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  3. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.

  4. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  5. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.

  6. Jika Anda menggunakan GPU dengan Deep Learning VM, periksa halaman kuota untuk memastikan bahwa Anda memiliki cukup GPU yang tersedia dalam project Anda. Jika GPU tidak tercantum di halaman kuota atau Anda memerlukan kuota GPU tambahan, minta penambahan kuota.

Membuat instance VM TensorFlow Deep Learning dari Cloud Marketplace

Untuk membuat instance VM TensorFlow Deep Learning dari Cloud Marketplace, selesaikan langkah-langkah berikut:

  1. Buka halaman Deep Learning VM Cloud Marketplace di Konsol Google Cloud.

    Buka halaman Deep Learning VM Cloud Marketplace

  2. Klik Launch.

  3. Masukkan Nama deployment, yang akan menjadi root nama VM Anda. Compute Engine menambahkan -vm ke nama ini saat memberi nama instance Anda.

  4. Pilih Zone.

  5. Di bagian Machine type, pilih spesifikasi yang Anda inginkan untuk VM Anda. Pelajari jenis mesin lebih lanjut.

  6. Di bagian GPU, pilih Jenis GPU dan Jumlah GPU. Jika Anda tidak ingin menggunakan GPU, klik tombol Hapus GPU dan lanjutkan ke langkah 7. Pelajari GPU lebih lanjut.

    1. Pilih jenis GPU. Tidak semua jenis GPU tersedia di semua zona. Temukan kombinasi yang didukung.
    2. Pilih Jumlah GPU. Setiap GPU mendukung jumlah GPU yang berbeda. Temukan kombinasi yang didukung.
  7. Di bagian Framework, pilih salah satu versi framework TensorFlow.

  8. Jika menggunakan GPU, Anda memerlukan driver NVIDIA. Anda dapat menginstal driver sendiri, atau memilih Install NVIDIA GPU driver automatically saat pertama kali memulai.

  9. Anda memiliki opsi untuk memilih Aktifkan akses ke JupyterLab melalui URL, bukan SSH (Beta). Mengaktifkan fitur Beta ini memungkinkan Anda mengakses instance JupyterLab menggunakan URL. Siapa pun yang memiliki peran Editor atau Pemilik di project Google Cloud Anda dapat mengakses URL ini. Saat ini, fitur ini hanya berfungsi di Amerika Serikat, Uni Eropa, dan Asia.

  10. Pilih jenis boot disk dan ukuran boot disk.

  11. Pilih setelan jaringan yang Anda inginkan.

  12. Klik Deploy.

Jika Anda memilih untuk menginstal driver NVIDIA, tunggu selama 3-5 menit hingga penginstalan selesai.

Setelah VM di-deploy, halaman akan diperbarui dengan petunjuk untuk mengakses instance.

Membuat instance VM TensorFlow Deep Learning dari command line

Agar dapat menggunakan Google Cloud CLI untuk membuat instance VM Deep Learning baru, Anda harus menginstal dan menginisialisasi Google Cloud CLI terlebih dahulu:

  1. Download dan instal Google Cloud CLI menggunakan petunjuk yang diberikan pada Menginstal Google Cloud CLI.
  2. Inisialisasi SDK menggunakan petunjuk yang diberikan pada Inisialisasi Cloud SDK.

Untuk menggunakan gcloud di Cloud Shell, aktifkan Cloud Shell terlebih dahulu menggunakan petunjuk yang diberikan pada Memulai Cloud Shell.

Anda dapat membuat instance TensorFlow dengan atau tanpa GPU.

Tanpa GPU

Untuk menyediakan instance VM Deep Learning tanpa GPU:

export IMAGE_FAMILY="tf-ent-latest-cpu"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-instance"

gcloud compute instances create $INSTANCE_NAME \
  --zone=$ZONE \
  --image-family=$IMAGE_FAMILY \
  --image-project=deeplearning-platform-release

Opsi:

  • --image-family harus salah satu dari yang berikut:
  • --image-project harus deeplearning-platform-release.

Dengan satu atau beberapa GPU

Compute Engine menawarkan opsi untuk menambahkan satu atau beberapa GPU ke instance virtual machine Anda. GPU menawarkan pemrosesan yang lebih cepat untuk banyak tugas data dan machine learning yang kompleks. Untuk mempelajari GPU lebih lanjut, lihat GPU di Compute Engine.

Untuk menyediakan instance VM Deep Learning dengan satu atau beberapa GPU:

export IMAGE_FAMILY="tf-ent-latest-gpu"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-instance"

gcloud compute instances create $INSTANCE_NAME \
  --zone=$ZONE \
  --image-family=$IMAGE_FAMILY \
  --image-project=deeplearning-platform-release \
  --maintenance-policy=TERMINATE \
  --accelerator="type=nvidia-tesla-v100,count=1" \
  --metadata="install-nvidia-driver=True"

Opsi:

  • --image-family harus berupa salah satu dari berikut ini:

  • --image-project harus deeplearning-platform-release.

  • --maintenance-policy harus TERMINATE. Untuk mempelajari lebih lanjut, lihat Pembatasan GPU.

  • --accelerator menentukan jenis GPU yang akan digunakan. Harus ditentukan dalam format --accelerator="type=TYPE,count=COUNT". Misalnya, --accelerator="type=nvidia-tesla-p100,count=2". Lihat tabel model GPU untuk mengetahui daftar jenis dan jumlah GPU yang tersedia.

    Tidak semua jenis GPU didukung di semua region. Untuk mengetahui detailnya, lihat Ketersediaan region dan zona GPU.

  • --metadata digunakan untuk menentukan bahwa driver NVIDIA harus diinstal untuk Anda. Nilainya adalah install-nvidia-driver=True. Jika ditentukan, Compute Engine akan memuat driver stabil terbaru saat booting pertama dan melakukan langkah-langkah yang diperlukan (termasuk mulai ulang terakhir untuk mengaktifkan driver).

Jika Anda memilih untuk menginstal driver NVIDIA, tunggu selama 3-5 menit hingga penginstalan selesai.

Diperlukan waktu hingga 5 menit sebelum VM Anda disediakan sepenuhnya. Saat ini, Anda tidak akan dapat melakukan SSH ke komputer Anda. Setelah penginstalan selesai, untuk menjamin bahwa penginstalan driver berhasil, Anda dapat melakukan SSH di dan menjalankan nvidia-smi.

Setelah mengonfigurasi gambar, Anda dapat menyimpan snapshot gambar sehingga dapat memulai instance turunan tanpa harus menunggu penginstalan driver.

Tentang TensorFlow Enterprise

TensorFlow Enterprise adalah distribusi TensorFlow yang telah dioptimalkan untuk dijalankan di Google Cloud dan menyertakan Dukungan Versi Jangka Panjang.

Membuat preemptible instance

Anda dapat membuat instance Deep Learning VM yang dapat dihentikan. Preemptible instance adalah instance yang dapat Anda buat dan jalankan dengan harga yang jauh lebih rendah daripada instance normal. Namun, Compute Engine dapat menghentikan (preemption) instance ini jika memerlukan akses ke resource tersebut untuk tugas lain. Preemptible instance selalu berhenti setelah 24 jam. Untuk mempelajari preemptible instance lebih lanjut, baca artikel Instance preemptible VM.

Untuk membuat instance Deep Learning VM yang dapat dihentikan:

  • Ikuti petunjuk yang terletak di atas untuk membuat instance baru menggunakan command line. Ke perintah gcloud compute instances create, tambahkan kode berikut:

      --preemptible

Langkah selanjutnya

Untuk mengetahui petunjuk cara menghubungkan ke instance VM Deep Learning baru Anda melalui konsol Google Cloud atau command line, lihat bagian Menghubungkan ke Instance. Nama instance Anda adalah Nama deployment yang Anda tentukan dengan tambahan -vm.