Kuota

Dokumen ini mencantumkan kuota yang berlaku untuk Cloud TPU. Untuk mengetahui informasi tentang harga Cloud TPU, lihat Harga Cloud TPU.

Kuota membatasi jumlah resource Google Cloud bersama yang dapat digunakan project Google Cloud Anda, termasuk komponen hardware, software, dan jaringan. Oleh karena itu, kuota adalah bagian dari sistem yang melakukan hal berikut:

  • Memantau penggunaan atau pemakaian produk dan layanan Google Cloud oleh Anda.
  • Membatasi Anda konsumsi resource tersebut, karena alasan yang mencakup memastikan keadilan dan mengurangi lonjakan penggunaan.
  • Mempertahankan konfigurasi yang secara otomatis menerapkan pembatasan yang telah ditentukan.
  • Menyediakan sarana untuk meminta atau membuat perubahan pada kuota.

Pada umumnya, jika kuota terlampaui, sistem akan langsung memblokir akses ke resource Google yang relevan, dan tugas yang Anda coba lakukan akan gagal. Pada umumnya, kuota berlaku untuk setiap project Google Cloud serta digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project Google Cloud tersebut.

Jenis kuota

Jika Anda menggunakan GKE, lihat Pastikan kuota yang memadai untuk mengetahui informasi lebih lanjut tentang kuota GKE. Jika Anda memiliki kuota Cloud TPU API, ada kuota terpisah untuk resource Cloud TPU yang dipesan, sesuai permintaan, dan yang dapat dihentikan. Tabel berikut membandingkan setiap jenis kuota.

Jenis kuota Deskripsi Nilai default Cara meminta Tanda untuk pembuatan TPU
Dipesan Jumlah resource Cloud TPU yang aksesnya Anda miliki. Anda harus memiliki perjanjian reservasi untuk mengakses resource yang dicadangkan. Resource yang dicadangkan terlindungi dari kehabisan stok tetapi dapat terganggu. 0 Untuk meminta kuota yang dicadangkan, hubungi perwakilan akun Google Cloud Anda. Gunakan flag --reserved.
Sesuai permintaan Jumlah resource on-demand yang dapat Anda akses. Resource on-demand tidak akan di-preempt, tetapi kuota on demand tidak menjamin akan ada cukup resource Cloud TPU untuk memenuhi permintaan Anda. v3-8 dan v2-8: 16 TensorCores
Lainnya: 0
Lihat bagian Meminta kuota tambahan. Tanda tidak diperlukan, dipilih secara default.
Preemptible Jumlah resource Cloud TPU yang dapat dihentikan dan dapat Anda akses. Resource yang dapat dihentikan mungkin di-preempt untuk memberi ruang bagi tugas dengan prioritas yang lebih tinggi. Kuota yang dapat dihentikan tidak menjamin bahwa akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. Untuk mengetahui informasi selengkapnya, lihat TPU yang dapat dihentikan. v3-8 dan v2-8: 48 TensorCores
Lainnya: 0
Lihat bagian Meminta kuota tambahan. Gunakan flag --preemptible atau flag --best-effort untuk permintaan resource dalam antrean.

Alokasi kuota

Kuota Cloud TPU diberikan secara berbeda berdasarkan versi TPU yang Anda gunakan.

TPU v4 dan v5p

Untuk TPU v4 dan v5p, kuota dapat ditentukan dalam hal chip TPU atau TensorCore. Anda dapat menggunakan kuota dalam kombinasi bagian apa pun. Misalnya, jika memiliki kuota untuk slice v4-32, Anda dapat menggunakan kuota ini untuk membuat empat slice v4-8.

TPU v5e (pelatihan dan inferensi)

v5e mendukung pelatihan dan inferensi. Slice v5e yang digunakan untuk inferensi mencakup TPU dengan jenis akselerator v5litepod-1, v5litepod-4, atau v5litepod-8. Anda memerlukan kuota tpu-v5s-litepod-serving untuk Cloud TPU on-demand, tpu-v5s-litepod-serving-preemptible untuk Cloud TPU yang dapat dihentikan, dan tpu-v5s-litepod-serving-reserved untuk Cloud TPU yang dipesan.

TPU v2 dan v3

Kuota TPU v2 dan v3 ditentukan dalam kaitannya dengan TensorCore. Satu perangkat TPU berisi empat chip TPU dan delapan TensorCore (dua TensorCore per chip). TPU v2 dan v3 memiliki kuota terpisah untuk satu perangkat TPU dan Pod TPU. Anda tidak dapat menggunakan kuota Pod TPU v2 atau v3 untuk TPU v2-8 atau v3-8. Misalnya, jika memiliki kuota untuk slice v3-32, Anda tidak dapat menggunakannya untuk membuat empat TPU v3-8.

Untuk mengetahui informasi selengkapnya tentang chip TPU dan TensorCore, lihat arsitektur Sistem TPU.

Melihat dan meminta kuota tambahan

Anda dapat melihat kuota yang dialokasikan untuk project Google Cloud di halaman Kuota di Google Cloud Console. Jika memerlukan kuota Cloud TPU tambahan, Anda dapat memintanya dari halaman Kuota. Untuk mengetahui informasi selengkapnya, lihat Meminta batas kuota yang lebih tinggi.