Mengelola resource TPU

Halaman ini menjelaskan cara membuat, mencantumkan, menghentikan, memulai, menghapus, dan terhubung ke Cloud TPU menggunakan Create Node API. Create Node API dipanggil saat Anda menjalankan perintah gcloud compute tpus tpu-vm create menggunakan Google Cloud CLI dan saat Anda membuat TPU menggunakan konsol Google Cloud . Saat Anda menggunakan Create Node API, permintaan Anda akan segera diproses. Jika kapasitas tidak memadai untuk memenuhi permintaan Anda, permintaan akan gagal.

Praktik terbaiknya adalah membuat TPU menggunakan resource yang diantrekan, bukan Create Node API. Saat Anda meminta resource yang diantrekan, permintaan akan ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Saat tersedia, resource yang diminta akan disertakan ke project Google Cloud untuk penggunaan eksklusif Anda secara langsung. Untuk mengetahui informasi selengkapnya, lihat Mengelola resource dalam antrean.

Saat menggunakan Multislice, Anda harus menggunakan resource yang diantrekan. Untuk informasi selengkapnya, lihat Pengantar multislice.

Jika ingin menggunakan Google Kubernetes Engine (GKE) untuk mengelola resource TPU, Anda harus membuat cluster GKE terlebih dahulu. Kemudian, Anda menambahkan node pool yang berisi slice TPU ke cluster. Untuk mengetahui informasi selengkapnya, lihat Tentang TPU di GKE.

Prasyarat

Sebelum menjalankan prosedur ini, Anda harus menginstal Google Cloud CLI, membuat project Google Cloud , dan mengaktifkan Cloud TPU API. Untuk mengetahui petunjuknya, lihat Menyiapkan lingkungan Cloud TPU.

Jika menggunakan Google Cloud CLI, Anda dapat menjalankan perintah menggunakan Cloud Shell, VM Compute Engine, atau komputer lokal. Cloud Shell memungkinkan Anda berinteraksi dengan Cloud TPU tanpa harus menginstal software apa pun. Cloud Shell akan terputus setelah periode tidak aktif. Jika Anda menjalankan perintah yang berjalan lama, sebaiknya instal Google Cloud CLI di komputer lokal Anda. Untuk mengetahui informasi selengkapnya tentang Google Cloud CLI, lihat Referensi gcloud.

Membuat Cloud TPU menggunakan Create Node API

Anda dapat membuat Cloud TPU menggunakan gcloud, konsol Google Cloud , atau Cloud TPU API.

Saat membuat Cloud TPU, Anda harus menentukan image VM TPU (juga disebut versi software TPU). Untuk menentukan image VM yang harus Anda gunakan, lihat image VM TPU.

Anda juga perlu menentukan konfigurasi TPU dalam hal chip TensorCores atau TPU. Untuk informasi selengkapnya, lihat bagian untuk versi TPU yang Anda gunakan di Arsitektur sistem.

gcloud

Untuk membuat TPU menggunakan Create Node API, gunakan perintah gcloud compute tpus tpu-vm create. Untuk mengonfigurasi alamat IP internal atau eksternal tertentu, lihat petunjuk di Alamat IP internal dan eksternal.

Perintah berikut menggunakan konfigurasi TPU v4-8:

$ gcloud compute tpus tpu-vm create tpu-name \
  --zone=us-central2-b \
  --accelerator-type=v4-8 \
  --version=tpu-software-version

Deskripsi flag perintah

zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
version
Versi software TPU.
shielded-secure-boot (opsional)
Menentukan bahwa instance TPU dibuat dengan mengaktifkan booting aman. Hal ini secara implisit menjadikannya instance Shielded VM. Lihat Apa itu Shielded VM? untuk mengetahui detail selengkapnya.

Perintah berikut akan membuat TPU dengan topologi tertentu:

$ gcloud compute tpus tpu-vm create tpu-name \
  --zone=us-central2-b \
  --type=v4 \
  --topology=2x2x1 \
  --version=tpu-software-version

Flag yang diperlukan

tpu-name
Nama VM TPU yang Anda buat.
zone
Zona tempat Anda membuat Cloud TPU.
type
Versi TPU yang ingin Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat versi TPU.
topology
Pengaturan fisik chip TPU, yang menentukan jumlah chip dalam setiap dimensi. Untuk mengetahui informasi selengkapnya tentang topologi yang didukung untuk setiap versi TPU, lihat Versi TPU.
version
Versi software TPU yang ingin Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.

Konsol

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat TPU akan dibuat.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk informasi selengkapnya, lihat Gambar VM TPU.

  7. Klik Create untuk membuat resource.

curl

Perintah berikut menggunakan curl untuk membuat TPU.

$ curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: 'v4-8', \
runtime_version:'tpu-vm-tf-2.18.0-pjrt', \
network_config: {enable_external_ips: true}, \
shielded_instance_config: { enable_secure_boot: true }}" \
https://tpu.googleapis.com/v2/projects/project-id/locations/us-central2-b/nodes?node_id=node_name

Kolom wajib diisi

runtime_version
Versi runtime Cloud TPU yang ingin Anda gunakan.
project
Nama project Google Cloud yang terdaftar.
zone
Zona tempat Anda membuat Cloud TPU.
node_name
Nama VM TPU yang Anda buat.

Menjalankan skrip startup

Anda dapat menjalankan skrip startup di setiap VM TPU dengan menentukan flag --metadata startup-script saat membuat VM TPU. Perintah berikut membuat VM TPU menggunakan skrip startup.

$ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central2-b \
    --accelerator-type=tpu-type \
    --version=tpu-vm-tf-2.18.0-pjrt \
    --metadata startup-script='#! /bin/bash
      pip3 install numpy
      EOF'

Menghubungkan ke Cloud TPU

gcloud

Hubungkan ke Cloud TPU Anda menggunakan SSH:

$ gcloud compute tpus tpu-vm ssh tpu-name --zone=zone

Saat Anda meminta slice yang lebih besar dari satu host, Cloud TPU akan membuat VM TPU untuk setiap host. Jumlah TPU chip per host bergantung pada versi TPU.

Untuk menginstal biner atau menjalankan kode, hubungkan ke setiap VM TPU menggunakan tpu-vm ssh command.

$ gcloud compute tpus tpu-vm ssh tpu-name

Untuk terhubung ke VM TPU tertentu menggunakan SSH, gunakan flag --worker yang mengikuti indeks berbasis 0:

$ gcloud compute tpus tpu-vm ssh tpu-name --worker=1

Untuk menjalankan perintah di semua VM TPU dengan satu perintah, gunakan flag --worker=all dan --command:

$ gcloud compute tpus tpu-vm ssh tpu-name \
  --project=your_project_ID \
  --zone=zone \
  --worker=all \
  --command='pip install "jax[tpu]==0.4.20" -f https://storage.googleapis.com/jax-releases/libtpu_releases.html'

Untuk Multislice, Anda dapat menjalankan perintah di satu VM menggunakan nama TPU yang dihitung, dengan setiap awalan slice dan angka yang ditambahkan ke dalamnya. Untuk menjalankan perintah di semua VM TPU di semua slice, gunakan flag --node=all, --worker=all, dan --command, dengan flag --batch-size opsional.

$ gcloud compute tpus queued-resources ssh ${QUEUED_RESOURCE_ID} \
  --project=project_ID \
  --zone=zone \
  --node=all \
  --worker=all \
  --command='pip install "jax[tpu]==0.4.20" -f https://storage.googleapis.com/jax-releases/libtpu_releases.html' \
  --batch-size=4

Konsol

Untuk terhubung ke TPU di konsol Google Cloud , gunakan SSH-in-browser:

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Dalam daftar VM TPU, klik SSH di baris VM TPU yang ingin Anda hubungkan.

Mencantumkan resource Cloud TPU

Anda dapat mencantumkan semua Cloud TPU di zona yang ditentukan.

gcloud

$ gcloud compute tpus tpu-vm list --zone=zone

Konsol

Di konsol Google Cloud , buka halaman TPU:

Buka TPU

Mengambil informasi tentang Cloud TPU Anda

Anda dapat mengambil informasi tentang Cloud TPU yang ditentukan.

gcloud

$ gcloud compute tpus tpu-vm describe tpu-name \
  --zone=zone

Konsol

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Klik nama Cloud TPU Anda. Konsol akan menampilkan halaman detail Cloud TPU.

Menghentikan resource Cloud TPU

Anda dapat menghentikan satu Cloud TPU untuk berhenti dikenai biaya tanpa kehilangan konfigurasi dan software VM.

gcloud

$ gcloud compute tpus tpu-vm stop tpu-name \
  --zone=zone

Konsol

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Pilih kotak centang di samping Cloud TPU Anda.

  3. Klik Hentikan.

Memulai resource Cloud TPU

Anda dapat memulai Cloud TPU saat dihentikan.

gcloud

$ gcloud compute tpus tpu-vm start tpu-name \
  --zone=zone

Konsol

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Pilih kotak centang di samping Cloud TPU Anda.

  3. Klik Start.

Menghapus Cloud TPU

Hapus slice VM TPU Anda di akhir sesi.

gcloud

$ gcloud compute tpus tpu-vm delete tpu-name \
  --project=project-id \
  --zone=zone \
  --quiet

Deskripsi flag perintah

zone
Zona tempat Anda berencana menghapus Cloud TPU.

Konsol

  1. Di konsol Google Cloud , buka halaman TPU:

    Buka TPU

  2. Pilih kotak centang di samping Cloud TPU Anda.

  3. Klik Delete.