Mengelola resource dalam antrean

Resource dalam antrean memungkinkan Anda meminta resource Cloud TPU dalam antrean. Saat Anda meminta resource yang diantrekan, permintaan akan ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Saat tersedia, resource yang diminta akan disertakan ke project Google Cloud Anda untuk penggunaan eksklusif langsung. ID ini akan tetap ditetapkan ke project Anda kecuali jika Anda menghapusnya atau ID tersebut didahului. Hanya VM Spot TPU dan TPU preemptible yang memenuhi syarat untuk preemption.

Anda dapat menentukan waktu mulai dan berakhir opsional dalam permintaan resource yang diantrekan. Waktu mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum terisi pada waktu berakhir yang ditentukan, masa berlaku permintaan akan berakhir. Permintaan tetap berada dalam antrean setelah masa berlakunya habis.

Permintaan resource dalam antrean dapat berada dalam salah satu status berikut:

WAITING_FOR_RESOURCES
Permintaan telah lulus validasi awal dan telah ditambahkan ke antrean. Status ini akan tetap ada hingga ada resource gratis yang memadai untuk mulai menyediakan permintaan Anda atau interval alokasi berakhir. Jika permintaan tinggi, tidak semua permintaan dapat segera disediakan. Jika Anda memerlukan ketersediaan TPU yang lebih andal, pertimbangkan untuk membeli reservasi.
PROVISIONING
Permintaan telah dipilih dari antrean dan resource-nya sedang dialokasikan.
ACTIVE
Permintaan telah dialokasikan. Saat permintaan resource yang diantrean berada dalam status ACTIVE, Anda dapat mengelola VM TPU seperti yang dijelaskan dalam Mengelola TPU.
FAILED
Permintaan tidak dapat diselesaikan, baik karena ada masalah dengan permintaan atau resource yang diminta tidak tersedia dalam interval alokasi. Permintaan akan tetap berada dalam antrean hingga dihapus secara eksplisit.
SUSPENDING
Resource yang terkait dengan permintaan sedang dihapus.
SUSPENDED
Resource yang ditentukan dalam permintaan telah dihapus. Jika permintaan berada dalam status SUSPENDED, permintaan tersebut tidak lagi memenuhi syarat untuk alokasi lebih lanjut.

Prasyarat

Sebelum menjalankan perintah dalam panduan ini, Anda harus menginstal Google Cloud CLI, membuat project Google Cloud, dan mengaktifkan Cloud TPU API. Untuk mengetahui petunjuknya, lihat Menyiapkan lingkungan Cloud TPU.

Meminta resource dalam antrean on demand

Resource on-demand tidak akan di-preempt, tetapi kuota on-demand tidak menjamin bahwa akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. Untuk informasi selengkapnya tentang resource on-demand, lihat Jenis kuota.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Klik Buat untuk membuat permintaan resource yang diantrekan.

Ukuran slice default untuk resource yang diantrekan sesuai permintaan

Saat menggunakan kuota on-demand, Anda harus meminta ukuran slice yang kurang dari batas default untuk jenis akselerator yang Anda gunakan. Permintaan yang melebihi batas default akan ditolak oleh sistem.

Tabel berikut menunjukkan jenis TPU dan batas defaultnya.

Jenis akselerator Batas default (dalam jumlah TensorCore)
v2 128
v3 128
v4 384
v5 32

Jika Anda memerlukan ukuran slice yang lebih besar, hubungi dukungan Cloud TPU untuk mendapatkan informasi tambahan.

Meminta resource yang diantrekan menggunakan reservasi

Anda dapat meminta resource yang diantrekan menggunakan reservasi. Untuk membeli reservasi, hubungi tim akun Google Cloud Anda.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --reserved

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
reserved
Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
reserved
Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Luaskan bagian Management.

  10. Centang kotak Gunakan reservasi yang ada.

  11. Klik Buat untuk membuat permintaan resource yang diantrekan.

Meminta resource yang diantrekan TPU Spot VM

Spot VM adalah resource yang dapat di-preempt dan ditetapkan ke workload lain kapan saja. Resource Spot VM harganya lebih murah, dan Anda mungkin mendapatkan akses ke resource lebih cepat dibandingkan dengan permintaan VM non-Spot. Untuk mengetahui informasi selengkapnya tentang Spot VM TPU, lihat Mengelola Spot VM TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.18.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.18.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
spot
Flag boolean yang menentukan bahwa resource yang diantrekan adalah Spot VM.

Meminta resource yang diantrekan untuk dialokasikan sebelum atau setelah waktu yang ditentukan

Anda dapat menentukan waktu mulai atau waktu akhir opsional dalam permintaan resource yang diantrekan. Waktu mulai atau durasi mulai menentukan waktu paling awal untuk mengisi permintaan. Waktu berakhir atau durasi berakhir menentukan berapa lama permintaan tetap valid. Jika permintaan belum terisi pada waktu akhir yang ditentukan atau dalam durasi yang ditentukan, permintaan akan habis masa berlakunya. Setelah masa berlakunya habis, permintaan tersebut tetap berada dalam antrean, tetapi tidak lagi memenuhi syarat untuk dialokasikan.

Anda juga dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.

Untuk mengetahui daftar format stempel waktu dan durasi yang didukung, lihat Tanggal waktu.

Meminta resource yang diantrekan untuk dipenuhi setelah waktu yang ditentukan

Dalam permintaan resource yang diantrekan, Anda dapat menentukan waktu atau durasi setelah resource harus dialokasikan.

gcloud

Perintah berikut meminta TPU v4-4096 yang akan dialokasikan setelah pukul 09.00 pada 14 Desember 2022.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-time 2022-12-14T09:00:00Z

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-after-time
Waktu setelah resource dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal waktu topik Google Cloud CLI.

curl

Perintah berikut meminta TPU v4-4096 yang akan dialokasikan setelah pukul 09.00 pada 14 Desember 2022.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_after_time': {
        'seconds': 2022-12-14T09:00:00Z
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-after-time
Waktu setelah resource dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal waktu topik Google Cloud CLI.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.

  10. Klik Buat untuk membuat permintaan resource yang diantrekan.

Contoh berikut meminta v4-32 dialokasikan setelah enam jam.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
        --node-id your-node-id \
        --project your-project-id \
        --zone us-central2-b \
        --accelerator-type v4-32 \
        --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
        --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_after_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-after-duration
Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Tanggal waktu topik Google Cloud CLI

Meminta resource yang diantrekan yang akan berakhir masa berlakunya setelah waktu tertentu

Dalam permintaan resource yang diantrekan, Anda dapat menentukan berapa lama permintaan resource yang diantrekan tetap valid. Jika permintaan belum dipenuhi pada waktu atau durasi yang Anda tentukan, masa berlaku permintaan akan berakhir.

gcloud

Perintah berikut meminta TPU v4-4096. Jika permintaan tidak dipenuhi sebelum 14 Desember 2022 pukul 09.00, masa berlaku permintaan akan berakhir.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-time 2022-12-14T09:00:00Z

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-until-time
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.

curl

Perintah berikut meminta TPU v4-4096. Jika permintaan tidak dipenuhi sebelum 14 Desember 2022 pukul 09.00, masa berlaku permintaan akan berakhir.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_until_time': {
        'seconds': 1655197200
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-until-time
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Di kolom Cancel request on, masukkan waktu saat permintaan resource dalam antrean akan berakhir masa berlakunya jika tidak terisi.

  10. Klik Buat untuk membuat permintaan resource yang diantrekan.

Contoh berikut meminta v4-32. Masa berlaku permintaan akan berakhir jika tidak terisi dalam enam jam.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_until_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-until-duration
Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI

Meminta resource yang diantrekan untuk dialokasikan dalam interval yang ditentukan

Anda dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.

gcloud

Perintah berikut meminta v4-32 dalam 5 jam 30 menit dari waktu saat ini, yang akan dibuat paling lambat 14 Desember 2022 pukul 09.00.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-duration 5h30m \
    --valid-until-time 2022-12-14T09:00:00Z

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-until-timw
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
valid-until-duration
Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.

curl

Perintah berikut meminta v4-32 dalam 5 jam 30 menit dari waktu saat ini, yang akan dibuat paling lambat 14 Desember 2022 pukul 09.00.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
valid-until-timw
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
valid-until-duration
Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.

  10. Di kolom Cancel request on, masukkan waktu saat permintaan resource dalam antrean akan berakhir masa berlakunya jika tidak terisi.

  11. Klik Buat untuk membuat permintaan resource yang diantrekan.

Meminta resource yang diantrekan dengan skrip startup

Anda dapat menentukan skrip yang akan dijalankan pada resource yang diantrekan setelah disediakan.

gcloud

Saat menggunakan perintah gcloud, Anda dapat menggunakan flag --metadata atau --metadata-from-file untuk menentukan perintah skrip atau file yang berisi kode skrip. Contoh berikut membuat permintaan resource yang diantrekan yang akan menjalankan skrip startup-script.sh.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.12.0 \
    --metadata-from-file='startup-script=startup-script.sh'

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
validInterval
Waktu selama permintaan valid, setelah itu permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
metadata-from-file
Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource yang diantrekan disediakan.
metadata
Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource yang diantrekan disediakan.

curl

Saat menggunakan curl, Anda harus menyertakan kode skrip dalam konten JSON. Contoh berikut menyertakan skrip inline dalam isi JSON.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    tpu: {
        node_spec: {
        parent: 'projects/your-project-number/locations/us-central2-b',
        node_id: 'your-node-id',
        node: {
            accelerator_type: 'v2-8',
            runtime_version: 'tpu-vm-tf-2.18.0-pjrt',
            metadata: {
                "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
            }
        }
        }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
validInterval
Waktu selama permintaan valid, setelah itu permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
metadata-from-file
Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource yang diantrekan disediakan.
metadata
Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource yang diantrekan disediakan.

Meminta resource yang diantrekan dengan jaringan dan subnetwork yang ditentukan

Dalam permintaan resource yang diantrekan, Anda dapat menentukan jaringan dan subnetwork yang ingin dihubungkan ke TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --network network-name \
    --subnetwork subnetwork-name

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
reserved
Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
network
Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
Subnetwork yang akan menjadi bagian dari resource yang diantrekan.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        'network_config': {
            'network': 'network-name',
            'subnetwork': 'subnetwork-name',
            'enable_external_ips': true
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU.
reserved
Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
network
Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
Subnetwork yang akan menjadi bagian dari resource yang diantrekan.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik Buat TPU.

  3. Di kolom Nama, masukkan nama untuk TPU Anda.

  4. Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.

  5. Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.

  6. Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.

  7. Klik tombol Aktifkan antrean.

  8. Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.

  9. Luaskan bagian Jaringan.

  10. Di kolom Network dan Subnetwork, pilih jaringan dan subnetwork yang ingin Anda gunakan.

  11. Klik Buat untuk membuat permintaan resource yang diantrekan.

Menghapus permintaan resource yang diantrekan

Anda dapat menghapus permintaan resource yang diantrekan dan TPU yang terkait dengan permintaan tersebut dengan menghapus permintaan resource yang diantrekan:

gcloud

Teruskan flag --force ke perintah queued-resource delete:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project my-project \
    --zone us-central2-b \
    --force \
    --async

Deskripsi flag perintah

your-queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.
force
Hapus VM TPU dan permintaan resource yang diantrekan.

curl

Gunakan parameter kueri force=true dalam permintaan curl Anda:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/your-queued-resource-id?force=true

Deskripsi flag perintah

your-queued-resource-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.
force
Hapus VM TPU dan permintaan resource yang diantrekan.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik tab Resource dalam antrean.

  3. Centang kotak di samping permintaan resource yang ada dalam antrean.

  4. Klik Delete.

Jika menghapus TPU secara langsung, Anda juga perlu menghapus resource yang diantrekan, seperti yang ditunjukkan dalam contoh berikut. Saat Anda menghapus TPU, permintaan resource yang diantrekan akan bertransisi ke status SUSPENDED, setelah itu permintaan resource yang diantrekan dapat dihapus.

gcloud

Hapus TPU:

$ gcloud compute tpus tpu-vm delete your-node-id \
    --project=your-project \
    --zone=zone \
    --quiet

Deskripsi flag perintah

project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.
your-node-id
Nama TPU yang ingin Anda hapus.

Saat Anda menghapus TPU, resource yang diantrekan terkait akan berstatus SUSPENDING, lalu berstatus SUSPENDED. Jika resource dalam antrean berada dalam status SUSPENDED, Anda dapat menghapusnya:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project your-project-id \
    --zone us-central2-b

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.

curl

Hapus TPU:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project/locations/us-central2-b/nodes?node_id=your-node-id

Deskripsi flag perintah

project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.
your-node-id
Nama TPU yang ingin Anda hapus.

Saat Anda menghapus TPU, resource yang diantrekan terkait akan berstatus SUSPENDING, lalu berstatus SUSPENDED. Jika resource dalam antrean berada dalam status SUSPENDED, Anda dapat menghapusnya:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.

Konsol

Menghapus TPU:

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Centang kotak di samping TPU Anda.

  3. Klik Delete.

Saat Anda menghapus TPU, resource yang diantrekan terkait akan beralih ke status Suspending, lalu status Suspended. Jika resource yang diantrekan berada dalam status Ditangguhkan, Anda dapat menghapusnya:

  1. Klik tab Resource dalam antrean.
  2. Centang kotak di samping permintaan resource yang ada dalam antrean.
  3. Klik Delete.

Mengambil informasi status dan diagnostik tentang permintaan resource yang diantrekan

Ambil informasi status dan diagnostik tentang permintaan resource yang diantrekan:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
    --project your-project-id \
    --zone us-central2-b

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik tab Resource dalam antrean.

  3. Klik nama permintaan resource yang diantrekan.

Setelah TPU disediakan, Anda juga dapat melihat detail tentang permintaan resource yang diantrekan dengan membuka halaman TPU, menemukan TPU, dan mengklik nama permintaan resource yang diantrekan yang sesuai.

Jika permintaan gagal, output akan berisi informasi error. Untuk permintaan yang menunggu resource, output-nya terlihat mirip dengan berikut ini:

gcloud

    name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
    state:
    state: WAITING_FOR_RESOURCES
    tpu:
    nodeSpec:
    - node:
        acceleratorType: v4-8
        bootDisk: {}
        networkConfig:
            enableExternalIps: true
        queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
        runtimeVersion: tpu-vm-tf-2.10.0
        schedulingConfig: {}
        serviceAccount: {}
        shieldedInstanceConfig: {}
        useTpuVm: true
        nodeId: your-node-id
        parent: projects/your-project-number/locations/us-central2-b

Konsol

Kolom Status resource dalam antrean menampilkan Menunggu resource.

Mencantumkan permintaan resource yang diantrekan di project Anda

Cantumkan permintaan resource yang diantrekan di project Anda:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
    --zone us-central2-b

Deskripsi flag perintah

project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Deskripsi flag perintah

project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

Konsol

  1. Di konsol Google Cloud, buka halaman TPUs:

    Buka TPU

  2. Klik tab Resource dalam antrean.