Panduan pengguna resource yang diantrekan

Resource yang diantrekan memungkinkan Anda meminta resource Cloud TPU melalui antrean. Saat Anda meminta resource dalam antrean, permintaan tersebut ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Jika sudah tersedia, resource yang diminta akan ditetapkan ke project Google Cloud Anda untuk langsung digunakan secara eksklusif. Project ini akan tetap ditetapkan ke project Anda, kecuali jika Anda menghapusnya atau di-preempt. Hanya TPU yang dapat dihentikan yang memenuhi syarat untuk melakukan preemption.

Anda dapat menentukan waktu mulai dan waktu berakhir opsional dalam permintaan resource dalam antrean. Waktu mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum diisi hingga waktu berakhir yang ditentukan, permintaan akan berakhir masa berlakunya. Permintaan tetap berada dalam antrean setelah masa berlakunya habis.

Permintaan resource yang diantrekan dapat memiliki salah satu status berikut:

WAITING_FOR_RESOURCES
Permintaan telah lulus validasi awal dan telah ditambahkan ke antrean. Status ini akan tetap bertahan hingga ada resource kosong yang cukup untuk mulai menyediakan permintaan Anda atau interval alokasi berlalu. Saat permintaan tinggi, tidak semua permintaan dapat langsung disediakan. Jika Anda menginginkan TPU yang lebih andal, pertimbangkan untuk membeli reservasi.
PROVISIONING
Permintaan telah dipilih dari antrean dan resource-nya saat ini sedang dialokasikan.
ACTIVE
Permintaan telah dialokasikan. Ketika permintaan resource dalam antrean berada dalam status ACTIVE, Anda dapat mengelola VM TPU seperti yang dijelaskan dalam Mengelola TPU.
FAILED
Permintaan tidak dapat diselesaikan karena ada masalah dengan permintaan atau resource yang diminta tidak tersedia dalam interval alokasi. Permintaan tetap berada dalam antrean sampai dihapus secara eksplisit.
SUSPENDING
Resource yang terkait dengan permintaan sedang dihapus.
SUSPENDED
Resource yang ditentukan dalam permintaan telah dihapus. Saat berada dalam status SUSPENDED, permintaan tidak lagi memenuhi syarat untuk alokasi lebih lanjut.

Prasyarat

Sebelum menjalankan perintah dalam panduan ini, pastikan Anda:

Meminta resource dalam antrean on demand

Anda dapat meminta resource dalam antrean on demand menggunakan perintah gcloud compute tpus queued-resources create. Untuk mengetahui informasi selengkapnya tentang resource on-demand, lihat Jenis kuota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .

Ukuran slice default untuk resource dalam antrean on demand

Saat menggunakan kuota on demand, Anda harus meminta ukuran slice yang kurang dari batas default untuk jenis akselerator yang Anda gunakan. Permintaan yang melebihi batas default akan ditolak oleh sistem.

Tabel berikut menunjukkan jenis TPU dan batas default terkait.

Jenis akselerator Batas default (jumlah TensorCore)
v2 128
v3 128
v4 384
v5 32

Jika Anda memerlukan ukuran slice yang lebih besar, hubungi dukungan Cloud TPU untuk mengetahui informasi tambahan.

Meminta resource yang diantrekan menggunakan kuota yang dicadangkan

Anda dapat meminta resource dalam antrean menggunakan kuota yang dicadangkan dengan menentukan flag --reserved dalam perintah gcloud atau guaranteed.reserved=true dalam permintaan curl. Untuk mengetahui informasi selengkapnya tentang kuota yang direservasi, lihat Jenis kuota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
reserved
Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.

Meminta resource preemptible antrean

Anda dapat meminta resource dalam antrean yang dapat dihentikan. Resource yang dapat dihentikan adalah resource yang dapat ditetapkan ke beban kerja lain jika resource tambahan diperlukan oleh beban kerja lain. Biaya resource yang dapat dihentikan lebih murah dan Anda dapat memperoleh akses ke resource lebih cepat dibandingkan dengan permintaan yang tidak dapat dihentikan. Untuk mengetahui informasi lebih lanjut tentang kuota yang dapat dihentikan, lihat Jenis kuota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--best-effort

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
best-effort
Flag boolean yang menentukan bahwa resource yang diantrekan dapat dihentikan.

Meminta resource yang diantrekan untuk dialokasikan sebelum atau setelah waktu yang ditentukan

Anda dapat menentukan waktu mulai, waktu berakhir, durasi mulai, atau durasi akhir opsional dalam permintaan resource dalam antrean. Waktu mulai atau durasi mulai menentukan waktu paling awal untuk mengisi permintaan. Jika permintaan belum diisi pada waktu berakhir yang ditentukan atau selama durasi yang ditentukan, permintaan tersebut akan berakhir masa berlakunya. Setelah masa berlakunya habis, permintaan tersebut tetap berada dalam antrean, tetapi tidak lagi memenuhi syarat untuk alokasi.

Anda juga dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi, dan waktu berakhir atau durasi.

Lihat Datetime untuk mengetahui daftar format durasi dan stempel waktu yang didukung.

Meminta resource yang diantrekan setelah durasi yang ditentukan

Anda dapat menentukan durasi sebelum resource harus dialokasikan menggunakan tanda --valid-after-duration. Contoh berikut meminta v4-32 untuk dialokasikan setelah enam jam.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
valid-after-duration
Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI

Meminta resource dalam antrean yang habis masa berlakunya setelah durasi yang ditentukan

Anda dapat menentukan berapa lama permintaan resource yang diantrekan tetap valid menggunakan tanda --valid-until-duration. Contoh berikut meminta v4-32 yang akan berakhir jika tidak diisi dalam waktu enam jam.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
valid-until-duration
Durasi permintaan valid. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI

Meminta resource yang diantrekan setelah waktu yang ditentukan

Anda dapat menentukan waktu hingga resource harus dialokasikan menggunakan tanda --valid-after-time.

Perintah berikut meminta TPU v4-4096 dengan versi runtime tpu-vm-tf-2.16.1-pjrt untuk dialokasikan setelah pukul 09.00 pada 14 Desember 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
valid-after-time
Waktu, setelah itu, resource harus dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Tanggal dan waktu topik Google Cloud CLI.

Meminta resource dalam antrean sebelum waktu yang ditentukan

Anda dapat menentukan waktu sebelum resource harus dialokasikan menggunakan tanda --valid-until-time.

Perintah berikut meminta node TPU v4-4096 dengan versi runtime tpu-vm-tf-2.10.0-pod agar dibuat paling lambat 14 Desember 2022 pukul 09.00.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
valid-until-time
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.

Meminta resource yang diantrekan untuk dialokasikan dalam interval yang ditentukan

Anda dapat menentukan interval alokasi menggunakan pasangan tanda --valid-after-time, --valid-after-duration, --valid-until-duration, dan --valid-until-time, asalkan satu flag menentukan awal interval alokasi dan yang lainnya menentukan akhir interval alokasi.

Perintah berikut meminta v4-32 dalam waktu 5 jam 30 menit dari waktu saat ini, agar dibuat paling lambat 14 Desember 2022 pukul 09.00.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
valid-until-timw
Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
valid-until-duration
Durasi permintaan valid. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.

Meminta resource dalam antrean dengan skrip startup

Anda dapat menentukan skrip yang akan dijalankan pada resource yang diantrekan setelah resource tersebut disediakan. Saat menggunakan perintah gcloud, Anda dapat menggunakan tanda --metadata atau --metadata-from-file untuk menentukan perintah skrip atau file yang berisi kode skrip. Saat menggunakan curl, Anda harus menyertakan kode skrip dalam konten JSON. Contoh berikut membuat permintaan resource dalam antrean yang akan menjalankan skrip yang terdapat dalam startup-script.sh. Contoh curl menunjukkan skrip inline dalam isi JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU buatan pengguna yang dibuat sebagai respons terhadap permintaan.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
validInterval
Waktu saat permintaan valid setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat datetime topik Google Cloud CLI.
metadata-from-file
Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah ini menganggap file tersebut berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource dalam antrean disediakan.
metadata
Menentukan metadata untuk permintaan. Dalam contoh ini, metadatanya adalah perintah skrip startup yang dijalankan saat resource dalam antrean disediakan.

Meminta resource dalam antrean dengan jaringan dan subnetwork yang ditentukan

Anda dapat meminta resource dalam antrean yang menentukan jaringan dan subnetwork tempat Anda ingin menghubungkan TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Deskripsi parameter perintah

queued-resource-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
node-id
ID TPU yang ditetapkan pengguna yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
Project Google Cloud Anda.
zone
Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
runtime-version
Versi software Cloud TPU .
reserved
Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
network
Jaringan yang akan menjadi bagian dari resource yang diantrekan.
subnetwork
Subnetwork tempat resource yang diantrekan akan menjadi bagiannya.

Menghapus permintaan sumber daya yang diantrekan

Anda dapat menghapus permintaan resource yang diantrekan dan VM TPU yang dibuat oleh permintaan tersebut dengan meneruskan flag --force ke perintah queued-resource delete. Jika tidak, Anda harus menghapus VM TPU sebelum menghapus permintaan resource yang diantrekan. Saat Anda menghapus VM TPU, permintaan resource yang diantrekan akan bertransisi ke status SUSPENDED, setelah itu permintaan resource yang diantrekan dapat dihapus.

Perintah berikut menghapus permintaan resource dalam antrean bernama "my-queued-resource" pada project "my-project" di zona "us-central2-b". Tindakan ini menggunakan flag --force untuk menghapus VM TPU dan permintaan resource yang diantrekan.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona Cloud TPU yang akan dihapus.
force
Hapus VM TPU dan permintaan resource yang diantrekan.

Perintah berikut menghapus permintaan resource dalam antrean bernama "my-queued-resource" pada project "my-project" di zona "us-central2-b".

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

Mengambil informasi status dan diagnostik tentang permintaan resource yang diantrekan

Ambil informasi status dan diagnostik tentang permintaan resource dalam antrean:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Deskripsi flag perintah

queued-resource-request-id
ID yang ditetapkan pengguna dari permintaan aset dalam antrean.
project
ID project tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.

Jika permintaan gagal, respons akan berisi informasi error. Untuk permintaan yang menunggu resource, outputnya akan terlihat seperti berikut:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Mencantumkan permintaan resource dalam antrean di project Anda

Perintah berikut mencantumkan permintaan resource yang diantrekan dalam project "your-project-id":

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Deskripsi flag perintah

project
Project Google Cloud tempat resource yang diantrekan dialokasikan.
zone
Zona tempat Anda berencana membuat Cloud TPU.