Mengelola resource dalam antrean
Resource dalam antrean memungkinkan Anda meminta resource Cloud TPU dalam antrean. Saat Anda meminta resource yang diantrekan, permintaan akan ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Saat tersedia, resource yang diminta akan disertakan ke project Google Cloud Anda untuk penggunaan eksklusif langsung. ID ini akan tetap ditetapkan ke project Anda kecuali jika Anda menghapusnya atau ID tersebut didahului. Hanya VM Spot TPU dan TPU preemptible yang memenuhi syarat untuk preemption.
Anda dapat menentukan waktu mulai dan berakhir opsional dalam permintaan resource yang diantrekan. Waktu mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum terisi pada waktu berakhir yang ditentukan, masa berlaku permintaan akan berakhir. Permintaan tetap berada dalam antrean setelah masa berlakunya habis.
Permintaan resource dalam antrean dapat berada dalam salah satu status berikut:
WAITING_FOR_RESOURCES
- Permintaan telah lulus validasi awal dan telah ditambahkan ke antrean. Status ini akan tetap ada hingga ada resource gratis yang memadai untuk mulai menyediakan permintaan Anda atau interval alokasi berakhir. Jika permintaan tinggi, tidak semua permintaan dapat segera disediakan. Jika Anda memerlukan ketersediaan TPU yang lebih andal, pertimbangkan untuk membeli reservasi.
PROVISIONING
- Permintaan telah dipilih dari antrean dan resource-nya sedang dialokasikan.
ACTIVE
- Permintaan telah dialokasikan. Saat permintaan resource yang diantrean berada dalam
status
ACTIVE
, Anda dapat mengelola VM TPU seperti yang dijelaskan dalam Mengelola TPU. FAILED
- Permintaan tidak dapat diselesaikan, baik karena ada masalah dengan permintaan atau resource yang diminta tidak tersedia dalam interval alokasi. Permintaan akan tetap berada dalam antrean hingga dihapus secara eksplisit.
SUSPENDING
- Resource yang terkait dengan permintaan sedang dihapus.
SUSPENDED
- Resource yang ditentukan dalam permintaan telah dihapus. Jika permintaan berada dalam status
SUSPENDED
, permintaan tersebut tidak lagi memenuhi syarat untuk alokasi lebih lanjut.
Prasyarat
Sebelum menjalankan perintah dalam panduan ini, Anda harus menginstal Google Cloud CLI, membuat project Google Cloud, dan mengaktifkan Cloud TPU API. Untuk mengetahui petunjuknya, lihat Menyiapkan lingkungan Cloud TPU.
Meminta resource dalam antrean on demand
Resource on-demand tidak akan di-preempt, tetapi kuota on-demand tidak menjamin bahwa akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. Untuk informasi selengkapnya tentang resource on-demand, lihat Jenis kuota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Ukuran slice default untuk resource yang diantrekan sesuai permintaan
Saat menggunakan kuota on-demand, Anda harus meminta ukuran slice yang kurang dari batas default untuk jenis akselerator yang Anda gunakan. Permintaan yang melebihi batas default akan ditolak oleh sistem.
Tabel berikut menunjukkan jenis TPU dan batas defaultnya.
Jenis akselerator | Batas default (dalam jumlah TensorCore) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Jika Anda memerlukan ukuran slice yang lebih besar, hubungi dukungan Cloud TPU untuk mendapatkan informasi tambahan.
Meminta resource yang diantrekan menggunakan reservasi
Anda dapat meminta resource yang diantrekan menggunakan reservasi. Untuk membeli reservasi, hubungi tim akun Google Cloud Anda.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --reserved
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Luaskan bagian Management.
Centang kotak Gunakan reservasi yang ada.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Meminta resource yang diantrekan TPU Spot VM
Spot VM adalah resource yang dapat di-preempt dan ditetapkan ke workload lain kapan saja. Resource Spot VM harganya lebih murah, dan Anda mungkin mendapatkan akses ke resource lebih cepat dibandingkan dengan permintaan VM non-Spot. Untuk mengetahui informasi selengkapnya tentang Spot VM TPU, lihat Mengelola Spot VM TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
spot
- Flag boolean yang menentukan bahwa resource yang diantrekan adalah Spot VM.
Meminta resource yang diantrekan untuk dialokasikan sebelum atau setelah waktu yang ditentukan
Anda dapat menentukan waktu mulai atau waktu akhir opsional dalam permintaan resource yang diantrekan. Waktu mulai atau durasi mulai menentukan waktu paling awal untuk mengisi permintaan. Waktu berakhir atau durasi berakhir menentukan berapa lama permintaan tetap valid. Jika permintaan belum terisi pada waktu akhir yang ditentukan atau dalam durasi yang ditentukan, permintaan akan habis masa berlakunya. Setelah masa berlakunya habis, permintaan tersebut tetap berada dalam antrean, tetapi tidak lagi memenuhi syarat untuk dialokasikan.
Anda juga dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.
Untuk mengetahui daftar format stempel waktu dan durasi yang didukung, lihat Tanggal waktu.
Meminta resource yang diantrekan untuk dipenuhi setelah waktu yang ditentukan
Dalam permintaan resource yang diantrekan, Anda dapat menentukan waktu atau durasi setelah resource harus dialokasikan.
gcloud
Perintah berikut meminta TPU v4-4096 yang akan dialokasikan setelah pukul 09.00 pada 14 Desember 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-time
- Waktu setelah resource dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal waktu topik Google Cloud CLI.
curl
Perintah berikut meminta TPU v4-4096 yang akan dialokasikan setelah pukul 09.00 pada 14 Desember 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-time
- Waktu setelah resource dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal waktu topik Google Cloud CLI.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Image VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Contoh berikut meminta v4-32 dialokasikan setelah enam jam.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-duration
- Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Tanggal waktu topik Google Cloud CLI
Meminta resource yang diantrekan yang akan berakhir masa berlakunya setelah waktu tertentu
Dalam permintaan resource yang diantrekan, Anda dapat menentukan berapa lama permintaan resource yang diantrekan tetap valid. Jika permintaan belum dipenuhi pada waktu atau durasi yang Anda tentukan, masa berlaku permintaan akan berakhir.
gcloud
Perintah berikut meminta TPU v4-4096. Jika permintaan tidak dipenuhi sebelum 14 Desember 2022 pukul 09.00, masa berlaku permintaan akan berakhir.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
curl
Perintah berikut meminta TPU v4-4096. Jika permintaan tidak dipenuhi sebelum 14 Desember 2022 pukul 09.00, masa berlaku permintaan akan berakhir.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Cancel request on, masukkan waktu saat permintaan resource dalam antrean akan berakhir masa berlakunya jika tidak terisi.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Contoh berikut meminta v4-32. Masa berlaku permintaan akan berakhir jika tidak terisi dalam enam jam.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI
Meminta resource yang diantrekan untuk dialokasikan dalam interval yang ditentukan
Anda dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.
gcloud
Perintah berikut meminta v4-32 dalam 5 jam 30 menit dari waktu saat ini, yang akan dibuat paling lambat 14 Desember 2022 pukul 09.00.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-timw
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
curl
Perintah berikut meminta v4-32 dalam 5 jam 30 menit dari waktu saat ini, yang akan dibuat paling lambat 14 Desember 2022 pukul 09.00.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-timw
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.
Di kolom Cancel request on, masukkan waktu saat permintaan resource dalam antrean akan berakhir masa berlakunya jika tidak terisi.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Meminta resource yang diantrekan dengan skrip startup
Anda dapat menentukan skrip yang akan dijalankan pada resource yang diantrekan setelah disediakan.
gcloud
Saat menggunakan perintah gcloud
, Anda dapat menggunakan flag --metadata
atau --metadata-from-file
untuk menentukan perintah skrip atau file
yang berisi kode skrip. Contoh berikut membuat
permintaan resource yang diantrekan yang akan menjalankan skrip startup-script.sh
.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
validInterval
- Waktu selama permintaan valid, setelah itu permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
metadata-from-file
- Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource yang diantrekan disediakan.
metadata
- Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource yang diantrekan disediakan.
curl
Saat menggunakan curl
, Anda harus menyertakan kode skrip dalam konten JSON.
Contoh berikut menyertakan skrip inline dalam isi JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.18.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditentukan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
validInterval
- Waktu selama permintaan valid, setelah itu permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat tanggal dan waktu topik Google Cloud CLI.
metadata-from-file
- Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource yang diantrekan disediakan.
metadata
- Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource yang diantrekan disediakan.
Meminta resource yang diantrekan dengan jaringan dan subnetwork yang ditentukan
Dalam permintaan resource yang diantrekan, Anda dapat menentukan jaringan dan subnetwork yang ingin dihubungkan ke TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
network
- Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
- Subnetwork yang akan menjadi bagian dari resource yang diantrekan.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource yang diantrekan dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource yang diantrekan sebagai bagian dari reservasi Cloud TPU.
network
- Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
- Subnetwork yang akan menjadi bagian dari resource yang diantrekan.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik Buat TPU.
Di kolom Nama, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Gambar VM TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Luaskan bagian Jaringan.
Di kolom Network dan Subnetwork, pilih jaringan dan subnetwork yang ingin Anda gunakan.
Klik Buat untuk membuat permintaan resource yang diantrekan.
Menghapus permintaan resource yang diantrekan
Anda dapat menghapus permintaan resource yang diantrekan dan TPU yang terkait dengan permintaan tersebut dengan menghapus permintaan resource yang diantrekan:
gcloud
Teruskan flag --force
ke perintah queued-resource delete
:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project my-project \ --zone us-central2-b \ --force \ --async
Deskripsi flag perintah
your-queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
force
- Hapus VM TPU dan permintaan resource yang diantrekan.
curl
Gunakan parameter kueri force=true
dalam permintaan curl
Anda:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/your-queued-resource-id?force=true
Deskripsi flag perintah
your-queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
force
- Hapus VM TPU dan permintaan resource yang diantrekan.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik tab Resource dalam antrean.
Centang kotak di samping permintaan resource yang ada dalam antrean.
Klik
Delete.
Jika menghapus TPU secara langsung, Anda juga perlu menghapus resource yang diantrekan, seperti
yang ditunjukkan dalam contoh berikut. Saat Anda menghapus TPU, permintaan resource
yang diantrekan akan bertransisi ke status SUSPENDED
, setelah itu permintaan resource
yang diantrekan dapat dihapus.
gcloud
Hapus TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project \ --zone=zone \ --quiet
Deskripsi flag perintah
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
your-node-id
- Nama TPU yang ingin Anda hapus.
Saat Anda menghapus TPU, resource yang diantrekan terkait akan berstatus
SUSPENDING
, lalu berstatus SUSPENDED
. Jika resource dalam antrean berada dalam status SUSPENDED
, Anda dapat menghapusnya:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
curl
Hapus TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central2-b/nodes?node_id=your-node-id
Deskripsi flag perintah
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
your-node-id
- Nama TPU yang ingin Anda hapus.
Saat Anda menghapus TPU, resource yang diantrekan terkait akan berstatus
SUSPENDING
, lalu berstatus SUSPENDED
. Jika resource dalam antrean berada dalam status SUSPENDED
, Anda dapat menghapusnya:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
Konsol
Menghapus TPU:
Di konsol Google Cloud, buka halaman TPUs:
Centang kotak di samping TPU Anda.
Klik
Delete.
Saat Anda menghapus TPU, resource yang diantrekan terkait akan beralih ke status Suspending, lalu status Suspended. Jika resource yang diantrekan berada dalam status Ditangguhkan, Anda dapat menghapusnya:
- Klik tab Resource dalam antrean.
- Centang kotak di samping permintaan resource yang ada dalam antrean.
- Klik Delete.
Mengambil informasi status dan diagnostik tentang permintaan resource yang diantrekan
Ambil informasi status dan diagnostik tentang permintaan resource yang diantrekan:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik tab Resource dalam antrean.
Klik nama permintaan resource yang diantrekan.
Setelah TPU disediakan, Anda juga dapat melihat detail tentang permintaan resource yang diantrekan dengan membuka halaman TPU, menemukan TPU, dan mengklik nama permintaan resource yang diantrekan yang sesuai.
Jika permintaan gagal, output akan berisi informasi error. Untuk permintaan yang menunggu resource, output-nya terlihat mirip dengan berikut ini:
gcloud
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Konsol
Kolom Status resource dalam antrean menampilkan Menunggu resource.
Mencantumkan permintaan resource yang diantrekan di project Anda
Cantumkan permintaan resource yang diantrekan di project Anda:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
Deskripsi flag perintah
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Deskripsi flag perintah
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Konsol
Di konsol Google Cloud, buka halaman TPUs:
Klik tab Resource dalam antrean.