Kuota Cloud TPU
Dokumen ini mencantumkan kuota yang berlaku untuk Cloud TPU. Untuk mengetahui informasi tentang harga Cloud TPU, lihat Harga Cloud TPU.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah resource Google Cloud yang dapat digunakan project Google Cloud Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas pengguna Google Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian produk dan layanan Google Cloud oleh Anda
- Membatasi pemakaian resource tersebut
- Memberikan cara untuk meminta perubahan pada nilai kuota
Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level project Google Cloud. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud, kuota dibagikan ke semua aplikasi dan alamat IP.
Kuota TPU
Ada kuota yang berbeda untuk setiap versi TPU. Misalnya, ada kuota yang berbeda untuk TPU v2, v3, dan sebagainya. Untuk setiap versi TPU, ada berbagai jenis kuota: on-demand dan preemptible (Spot VM). Tabel berikut menjelaskan berbagai jenis kuota.
Jenis kuota | Deskripsi | Nilai default | Cara meminta | Flag untuk pembuatan TPU |
---|---|---|---|---|
Sesuai permintaan | Jumlah resource on demand yang aksesnya Anda miliki. Resource on-demand tidak akan di-preempt, tetapi kuota on-demand tidak menjamin bahwa akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. |
v3-8 dan v2-8: 16 TensorCore Semua lainnya: 0 |
Lihat Meminta kuota tambahan. | Tidak perlu tanda, dipilih secara default. |
Preemptible | Jumlah resource Cloud TPU yang dapat dihentikan yang aksesnya Anda miliki. Kuota ini berlaku untuk TPU yang dapat dihentikan dan TPU Spot VM. Resource yang dapat di-preempt dapat di-preempt untuk memberi ruang bagi tugas dengan prioritas yang lebih tinggi. Kuota preemptible tidak menjamin akan ada resource Cloud TPU yang tersedia cukup untuk memenuhi permintaan Anda. Untuk mengetahui informasi selengkapnya, lihat TPU Preemptible dan Mengelola Spot VM TPU. |
v3-8 dan v2-8: 48 TensorCores Semua lainnya: 0 |
Lihat Meminta kuota tambahan. |
|
Kuota TPU ditentukan dalam hal core TPU per project per zona atau core TPU per project per region.
Kuota TPU v5p
Anda dapat menggunakan kuota TPU v5p dalam kombinasi core apa pun. Misalnya, jika Anda memiliki kuota untuk 32 core, Anda dapat menggunakan kuota ini untuk membuat empat slice TPU masing-masing dengan 8 core.
Kuota preemptible:
- Core TPU v5p yang dapat dihentikan per project per region
- Core TPU v5p yang dapat diakhiri per project per zona
Kuota on-demand:
- Core TPU v5p per project per region
- Core TPU v5p per project per zona
Kuota TPU v5e
TPU v5e dapat digunakan untuk pelatihan dan penayangan. Ada kuota terpisah untuk pelatihan dan penayangan serta satu host (core lite) dan multi-host (core pod lite).
Kuota penayangan
Kuota penayangan preemptible:
- Core pod TPU v5 lite yang dapat dihentikan untuk penayangan per project per region
- Core pod TPU v5 lite yang dapat dihentikan untuk penayangan per project per zona
Kuota penayangan on demand:
- Core pod TPU v5 lite untuk penayangan per project per region
- Core pod TPU v5 lite untuk penayangan per project per zona
Kuota pelatihan
Kuota pelatihan preemptible:
- Core TPU v5 lite yang dapat diakhiri per project per region
- Core TPU v5 lite yang dapat dihentikan per project per zona
- Core pod TPU v5 lite yang dapat diakhiri per project per region
- Core pod TPU v5 lite yang dapat dihentikan per project per zona
Kuota pelatihan on demand:
- Core TPU v5 lite per project per region
- Core TPU v5 lite per project per zone
- Core pod TPU v5 lite per project per region
- Core pod TPU v5 lite per project per zone
Kuota TPU v4
Anda dapat menggunakan kuota TPU v4 dalam kombinasi core apa pun. Misalnya, jika Anda memiliki kuota untuk 32 core, Anda dapat menggunakan kuota ini untuk membuat empat slice TPU masing-masing dengan 8 core.
Kuota preemptible:
- Core pod TPU v4 yang dapat dihentikan per project per region
- Core pod TPU v4 yang dapat diakhiri per project per zona
Kuota on demand:
- Core pod TPU v4 per project per region
- Core pod TPU v4 per project per zona
Kuota TPU v3
Ada kuota TPU v3 terpisah untuk TPU host tunggal (core) dan TPU multihost (pod). Anda harus menggunakan kuota pod v3 untuk membuat TPU dengan lebih dari 8 core.
Kuota preemptible:
- Core TPU v3 yang dapat diakhiri per project per region
- Core TPU v3 yang dapat diakhiri per project per zona
- Core pod TPU v3 yang dapat dihentikan per project per region
- Core pod TPU v3 yang dapat diakhiri per project per zona
Kuota on demand:
- Core TPU v3 per project per region
- Core TPU v3 per project per zone
- Core pod TPU v3 per project per region
- Core pod TPU v3 per project per zona
Kuota TPU v2
Ada kuota TPU v2 terpisah untuk TPU host tunggal (core) dan TPU multi-host (pod).
Kuota preemptible:
- Core TPU v2 yang dapat diakhiri per project per region
- Core TPU v2 yang dapat diakhiri per project per zona
- Core pod TPU v2 yang dapat diakhiri per project per region
- Core pod TPU v2 yang dapat diakhiri per project per zona
Kuota on demand:
- Core TPU v2 per project per region
- Core TPU v2 per project per zone
- Core pod TPU v2 per project per region
- Core pod TPU v2 per project per zone
Untuk informasi selengkapnya tentang chip TPU dan TensorCore, lihat Arsitektur sistem TPU.
Melihat dan meminta kuota tambahan
Anda dapat melihat kuota yang dialokasikan untuk project Google Cloud Anda di halaman Kuota di konsol Google Cloud. Jika memerlukan kuota Cloud TPU tambahan, Anda dapat memintanya dari halaman Quotas. Untuk mengetahui informasi selengkapnya, lihat Meminta batas kuota yang lebih tinggi.
Saat layanan Google Cloud meningkatkan nilai kuota default untuk resource dan API, perubahan ini akan dilakukan secara bertahap. Hal ini dapat mengakibatkan peluncuran yang sedang berlangsung di berbagai region atau resource. Selama peluncuran, nilai kuota yang muncul di konsol Google Cloud atau Cloud Quotas API tidak akan mencerminkan nilai kuota baru yang ditingkatkan hingga peluncuran selesai. Untuk informasi selengkapnya, lihat Melihat peluncuran yang sedang berlangsung.