Panduan pengguna resource yang diantrekan
Resource yang diantrekan memungkinkan Anda meminta resource Cloud TPU melalui antrean. Saat Anda meminta resource dalam antrean, permintaan tersebut ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Jika sudah tersedia, resource yang diminta akan ditetapkan ke project Google Cloud Anda untuk langsung digunakan secara eksklusif. Project ini akan tetap ditetapkan ke project Anda, kecuali jika Anda menghapusnya atau di-preempt. Hanya TPU yang dapat dihentikan yang memenuhi syarat untuk melakukan preemption.
Anda dapat menentukan waktu mulai dan waktu berakhir opsional dalam permintaan resource dalam antrean. Waktu mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum diisi hingga waktu berakhir yang ditentukan, permintaan akan berakhir masa berlakunya. Permintaan tetap berada dalam antrean setelah masa berlakunya habis.
Permintaan resource yang diantrekan dapat memiliki salah satu status berikut:
WAITING_FOR_RESOURCES
- Permintaan telah lulus validasi awal dan telah ditambahkan ke antrean. Status ini akan tetap bertahan hingga ada resource kosong yang cukup untuk mulai menyediakan permintaan Anda atau interval alokasi berlalu. Saat permintaan tinggi, tidak semua permintaan dapat langsung disediakan. Jika Anda menginginkan TPU yang lebih andal, pertimbangkan untuk membeli reservasi.
PROVISIONING
- Permintaan telah dipilih dari antrean dan resource-nya saat ini sedang dialokasikan.
ACTIVE
- Permintaan telah dialokasikan. Ketika permintaan resource dalam antrean berada dalam status
ACTIVE
, Anda dapat mengelola VM TPU seperti yang dijelaskan dalam Mengelola TPU. FAILED
- Permintaan tidak dapat diselesaikan karena ada masalah dengan permintaan atau resource yang diminta tidak tersedia dalam interval alokasi. Permintaan tetap berada dalam antrean sampai dihapus secara eksplisit.
SUSPENDING
- Resource yang terkait dengan permintaan sedang dihapus.
SUSPENDED
- Resource yang ditentukan dalam permintaan telah dihapus. Saat berada dalam status
SUSPENDED
, permintaan tidak lagi memenuhi syarat untuk alokasi lebih lanjut.
Prasyarat
Sebelum menjalankan perintah dalam panduan ini, pastikan Anda:
- Instal komponen alfa Google Cloud CLI
- Mengaktifkan Cloud TPU API
Meminta resource dalam antrean on demand
Anda dapat meminta resource dalam antrean on demand menggunakan perintah gcloud compute tpus queued-resources create
. Untuk mengetahui informasi selengkapnya tentang resource on-demand, lihat Jenis kuota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
Ukuran slice default untuk resource dalam antrean on demand
Saat menggunakan kuota on demand, Anda harus meminta ukuran slice yang kurang dari batas default untuk jenis akselerator yang Anda gunakan. Permintaan yang melebihi batas default akan ditolak oleh sistem.
Tabel berikut menunjukkan jenis TPU dan batas default terkait.
Jenis akselerator | Batas default (jumlah TensorCore) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Jika Anda memerlukan ukuran slice yang lebih besar, hubungi dukungan Cloud TPU untuk mengetahui informasi tambahan.
Meminta resource yang diantrekan menggunakan kuota yang dicadangkan
Anda dapat meminta resource dalam antrean menggunakan kuota yang dicadangkan dengan menentukan flag --reserved
dalam perintah gcloud
atau guaranteed.reserved=true
dalam permintaan curl. Untuk mengetahui informasi selengkapnya tentang kuota yang direservasi, lihat Jenis kuota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
Meminta resource preemptible antrean
Anda dapat meminta resource dalam antrean yang dapat dihentikan. Resource yang dapat dihentikan adalah resource yang dapat ditetapkan ke beban kerja lain jika resource tambahan diperlukan oleh beban kerja lain. Biaya resource yang dapat dihentikan lebih murah dan Anda dapat memperoleh akses ke resource lebih cepat dibandingkan dengan permintaan yang tidak dapat dihentikan. Untuk mengetahui informasi lebih lanjut tentang kuota yang dapat dihentikan, lihat Jenis kuota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
best-effort
- Flag boolean yang menentukan bahwa resource yang diantrekan dapat dihentikan.
Meminta resource yang diantrekan untuk dialokasikan sebelum atau setelah waktu yang ditentukan
Anda dapat menentukan waktu mulai, waktu berakhir, durasi mulai, atau durasi akhir opsional dalam permintaan resource dalam antrean. Waktu mulai atau durasi mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum diisi pada waktu berakhir yang ditentukan atau selama durasi yang ditentukan, permintaan tersebut akan berakhir masa berlakunya. Setelah masa berlakunya habis, permintaan tersebut tetap berada dalam antrean, tetapi tidak lagi memenuhi syarat untuk alokasi.
Anda juga dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi, dan waktu berakhir atau durasi.
Lihat Datetime untuk mengetahui daftar format durasi dan stempel waktu yang didukung.
Meminta resource yang diantrekan setelah durasi yang ditentukan
Anda dapat menentukan durasi sebelum resource harus dialokasikan menggunakan
tanda --valid-after-duration
. Contoh berikut meminta v4-32 untuk
dialokasikan setelah enam jam.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
valid-after-duration
- Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI
Meminta resource dalam antrean yang habis masa berlakunya setelah durasi yang ditentukan
Anda dapat menentukan berapa lama permintaan resource yang diantrekan tetap valid menggunakan
tanda --valid-until-duration
. Contoh berikut meminta v4-32 yang akan berakhir jika tidak diisi dalam waktu enam jam.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
valid-until-duration
- Durasi permintaan valid. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI
Meminta resource yang diantrekan setelah waktu yang ditentukan
Anda dapat menentukan waktu hingga resource harus dialokasikan menggunakan
tanda --valid-after-time
.
Perintah berikut meminta TPU v4-4096 dengan
versi runtime tpu-vm-tf-2.16.1-pjrt
untuk dialokasikan setelah pukul 09.00 pada 14 Desember 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
valid-after-time
- Waktu, setelah itu, resource harus dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Tanggal dan waktu topik Google Cloud CLI.
Meminta resource dalam antrean sebelum waktu yang ditentukan
Anda dapat menentukan waktu sebelum resource harus dialokasikan menggunakan
tanda --valid-until-time
.
Perintah berikut meminta node TPU v4-4096 dengan
versi runtime tpu-vm-tf-2.10.0-pod
agar dibuat paling lambat 14 Desember 2022 pukul 09.00.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
Meminta resource yang diantrekan untuk dialokasikan dalam interval yang ditentukan
Anda dapat menentukan interval alokasi menggunakan pasangan tanda --valid-after-time
,
--valid-after-duration
, --valid-until-duration
, dan --valid-until-time
,
asalkan satu flag menentukan awal interval alokasi dan
yang lainnya menentukan akhir interval alokasi.
Perintah berikut meminta v4-32 dalam waktu 5 jam 30 menit dari waktu saat ini, agar dibuat paling lambat 14 Desember 2022 pukul 09.00.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
valid-until-timw
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
valid-until-duration
- Durasi permintaan valid. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
Meminta resource dalam antrean dengan skrip startup
Anda dapat menentukan skrip yang akan dijalankan pada resource yang diantrekan setelah resource tersebut disediakan. Saat menggunakan perintah gcloud
, Anda dapat menggunakan tanda --metadata
atau --metadata-from-file
untuk menentukan perintah skrip atau file yang berisi
kode skrip. Saat menggunakan curl
, Anda harus menyertakan kode skrip dalam konten JSON. Contoh berikut membuat permintaan resource
dalam antrean yang akan menjalankan skrip yang terdapat dalam startup-script.sh
. Contoh curl
menunjukkan skrip inline dalam isi JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
validInterval
- Waktu saat permintaan valid setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
metadata-from-file
- Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah ini menganggap file tersebut berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource dalam antrean disediakan.
metadata
- Menentukan metadata untuk permintaan. Dalam contoh ini, metadatanya adalah perintah skrip startup yang dijalankan saat resource dalam antrean disediakan.
Meminta resource dalam antrean dengan jaringan dan subnetwork yang ditentukan
Anda dapat meminta resource dalam antrean yang menentukan jaringan dan subnetwork tempat Anda ingin menghubungkan TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
- ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
- Versi software Cloud TPU .
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
network
- Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
- Subnetwork tempat resource yang diantrekan akan menjadi bagiannya.
Menghapus permintaan sumber daya yang diantrekan
Anda dapat menghapus permintaan resource yang diantrekan dan VM TPU yang dibuat oleh permintaan tersebut dengan meneruskan flag --force
ke perintah queued-resource delete
. Jika tidak, Anda harus menghapus VM TPU sebelum menghapus permintaan resource yang diantrekan. Saat Anda menghapus VM TPU, permintaan resource yang diantrekan akan bertransisi ke status SUSPENDED
, setelah itu permintaan resource yang diantrekan dapat dihapus.
Perintah berikut menghapus permintaan resource dalam antrean bernama "my-queued-resource" pada project "my-project" di zona "us-central2-b". Tindakan ini menggunakan flag --force
untuk menghapus VM TPU dan permintaan resource yang diantrekan.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
force
- Hapus VM TPU dan permintaan resource yang diantrekan.
Perintah berikut menghapus permintaan resource dalam antrean bernama "my-queued-resource" pada project "my-project" di zona "us-central2-b".
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Mengambil informasi status dan diagnostik tentang permintaan resource yang diantrekan
Ambil informasi status dan diagnostik tentang permintaan resource dalam antrean:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Deskripsi flag perintah
queued-resource-request-id
- ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
- ID project tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Jika permintaan gagal, respons akan berisi informasi error. Untuk permintaan yang menunggu resource, outputnya akan terlihat seperti berikut:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Mencantumkan permintaan resource dalam antrean di project Anda
Perintah berikut mencantumkan permintaan resource yang diantrekan dalam project "your-project-id":
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Deskripsi flag perintah
project
- Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.