Kuota alokasi


Dokumen ini mencantumkan kuota alokasi yang berlaku untuk Compute Engine.

Kuota alokasi

Kuota alokasi, juga dikenal sebagai kuota resource, menentukan jumlah resource yang dapat diakses project Anda. Compute Engine memberlakukan kuota alokasi pada penggunaan resource karena berbagai alasan. Misalnya, kuota membantu melindungi komunitas pengguna Google Cloud dengan mencegah lonjakan penggunaan yang tidak terduga. Google Cloud juga menawarkan kuota uji coba gratis yang menyediakan akses terbatas untuk project guna membantu Anda menjelajahi Google Cloud berdasarkan uji coba gratis.

Tidak semua project memiliki kuota yang sama. Seiring meningkatnya penggunaan Google Cloud dari waktu ke waktu, kuota Anda mungkin meningkat. Jika Anda memperkirakan adanya peningkatan penggunaan yang signifikan di masa mendatang, Anda dapat secara proaktif meminta penyesuaian kuota dari halaman Kuota di konsol Google Cloud.

Untuk mengetahui informasi spesifik terkait kuota untuk batas kapasitas Compute Engine API, lihat Kuota API.

Ketersediaan kuota dan resource

Kuota alokasi adalah jumlah maksimum resource yang dapat Anda buat untuk jenis resource tersebut, jika resource tersedia. Kuota tidak menjamin bahwa resource selalu tersedia. Jika resource tidak tersedia, atau jika region yang dipilih tidak memiliki resource, Anda tidak dapat membuat resource baru dengan jenis tersebut meskipun memiliki sisa kuota di region atau project Anda. Misalnya, Anda mungkin masih memiliki kuota untuk membuat alamat IP eksternal di us-central1, tetapi mungkin tidak ada alamat IP yang tersedia di region tersebut.

Demikian pula, meskipun Anda memiliki kuota regional, resource mungkin tidak tersedia di zona tertentu. Misalnya, Anda mungkin memiliki kuota untuk membuat instance VM di region us-central1, tetapi Anda mungkin tidak dapat membuat instance VM di zona us-central1-a jika zona habis. Dalam kasus seperti itu, coba buat resource yang sama di zona lain, misalnya us-central1-f. Untuk mempelajari opsi Anda lebih lanjut jika resource zona habis, lihat dokumentasi untuk memecahkan masalah ketersediaan resource.

Kuota alokasi

Saat merencanakan kebutuhan instance VM, Anda harus mempertimbangkan beberapa kuota yang memengaruhi jumlah instance VM yang dapat dibuat.

Kuota regional dan global

Kuota VM dikelola di tingkat regional. Instance VM, grup instance, kuota disk, dan CPU dapat dipakai oleh VM mana pun di region, di mana pun zonanya. Misalnya, kuota CPU adalah kuota regional sehingga terdapat batas dan jumlah penggunaan yang berbeda untuk setiap region. Untuk meluncurkan instance n2-standard-16 di zona mana pun di region us-central1, Anda memerlukan kuota yang cukup untuk setidaknya 16 CPU dalam us-central1.

Kuota jaringan dan load balancing diperlukan untuk membuat firewall, load balancer, jaringan, dan VPN. Kuota ini adalah kuota global yang tidak bergantung pada suatu region. Setiap region dapat menggunakan kuota global. Misalnya, alamat IP eksternal yang sedang digunakan dan bersifat statis yang ditetapkan ke load balancer serta proxy HTTP dan HTTPS menggunakan kuota global.

Instance VM

Kuota instance VM adalah kuota regional dan membatasi jumlah instance VM yang ada di region tertentu, terlepas dari apakah VM berjalan atau tidak. Kuota ini dapat dilihat di konsol Google Cloud di halaman Kuota. Compute Engine secara otomatis menetapkan kuota ini sebesar 10 kali kuota CPU reguler Anda. Anda tidak perlu meminta kuota ini. Jika Anda memerlukan kuota untuk lebih banyak instance VM, minta lebih banyak CPU karena memiliki lebih banyak CPU akan meningkatkan kuota instance VM. Kuota berlaku untuk VM yang berjalan dan tidak berjalan, dan untuk instance normal dan preemptible instance.

  1. Di konsol Google Cloud, buka halaman Kuota.

    Buka Kuota

  2. Dalam daftar Filter , pilih opsi berikut:

    • Untuk Layanan, pilih Compute Engine API.
    • Untuk Type, pilih Quota.
    • Untuk Nama, pilih Instance VM.
    • Opsional: Untuk Metrik, pilih nama kuota CPU atau CPU yang Dikomit lain yang ingin Anda filter.
  3. Opsional: Untuk mengurutkan tabel menurut wilayah, klik kolom Dimensi (mis., lokasi).

  4. Pilih region yang kuotanya ingin Anda ubah.

  5. Klik Edit.

  6. Isi formulir.

  7. Klik Kirim permintaan.

Grup instance

Untuk menggunakan grup instance, Anda harus memiliki kuota yang tersedia untuk semua resource yang digunakan grup (misalnya, kuota CPU) dan kuota yang tersedia untuk resource grup itu sendiri. Bergantung pada jenis grup yang Anda buat, kuota penggunaan resource grup berikut berlaku:

Jenis layanan Kuota layanan
Grup instance terkelola regional (multi-zona) Regional instance group managers
Grup instance terkelola zona (zona tunggal) Keduanya dari:
  • Instance group managers
  • Instance groups
Grup instance tidak terkelola (zona tunggal) Instance groups
Autoscaler regional (multi-zona) Regional autoscalers
Autoscaler zona (zona tunggal) Autoscalers

Kuota disk

Kuota Persistent Disk, Hyperdisk, dan SSD Lokal berikut berlaku untuk setiap region:

  • Hyperdisk Balanced Capacity (GB). Kuota ini adalah total ukuran gabungan dari disk Hyperdisk Balanced yang dapat Anda buat di suatu region. Di gcloud CLI dan API, kuota ini disebut sebagai HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s). Kuota ini adalah jumlah total throughput yang dapat Anda sediakan untuk semua disk Hyperdisk Balanced di zona. Di gcloud CLI dan API, kuota ini disebut sebagai HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS. Kuota ini adalah jumlah total IOPS yang dapat Anda sediakan untuk semua disk Hyperdisk Balanced di zona. Di gcloud CLI dan API, kuota ini disebut sebagai HDB-TOTAL-IOPS.
  • Hyperdisk ML Capacity (GB). Kuota ini adalah total ukuran gabungan dari disk Hyperdisk ML yang dapat Anda buat di region. Di gcloud CLI dan API, kuota ini disebut sebagai HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s). Kuota ini adalah jumlah total throughput yang dapat Anda sediakan untuk semua disk Hyperdisk ML di suatu region. Di gcloud CLI dan API, kuota ini disebut sebagai HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB). Kuota ini adalah ukuran total Persistent Disk Standar yang dapat dibuat di suatu region. Di gcloud CLI dan API, kuota ini disebut sebagai DISKS_TOTAL_GB. Kuota ini juga berlaku untuk:
    • Persistent Disk Standar Regional, tetapi Persistent Disk Regional menggunakan dua kali jumlah kuota per GiB karena replikasi di dua zona dalam satu region.
    • Jika Anda memilih untuk mempertahankan data SSD Lokal saat menghentikan atau menangguhkan VM, kuota Persistent Disk Standar dalam jumlah yang setara akan digunakan.
  • Persistent disk SSD (GB). Kuota ini adalah total ukuran gabungan dari volume Persistent Disk yang Didukung SSD yang dapat dibuat di suatu region. Di gcloud CLI dan API, kuota ini disebut sebagai SSD_TOTAL_GB. Kuota ini terpisah dari kuota untuk disk SSD Lokal. Kuota ini berlaku untuk jenis disk berikut:

    • Persistent Disk SSD Zonal dan Regional
    • Persistent Disk Seimbang Zonal dan Regional

    Persistent Disk Regional memakai dua kali jumlah kuota per GiB karena replikasi di dua zona dalam satu region.

  • Persistent Disk IOPS. Kuota ini adalah jumlah total operasi I/O per detik untuk volume Persistent Disk Ekstrem yang dapat dibuat di suatu region. Di gcloud CLI dan API, kuota ini disebut sebagai PD-EXTREME-TOTAL-PROVISIONED-IOPS. Kuota ini terpisah dari kuota IOPS untuk Hyperdisk Google Cloud.

  • Local SSD per machine family (GB). Kuota ini adalah total ukuran gabungan dari disk SSD Lokal yang dapat Anda pasang ke VM di region berdasarkan jenis mesin setiap VM. SSD lokal adalah ephemeral disk cepat yang harus digunakan untuk tugas scratch, cache lokal, atau pemrosesan dengan fault-tolerance yang tinggi, karena disk ini tidak dimaksudkan untuk mampu bertahan melewati reboot instance VM.

    Disk SSD Lokal dijual dengan kelipatan 375 GiB atau 3 TiB, bergantung pada jenis mesin. Ada juga jumlah maksimum disk SSD Lokal yang dapat dilampirkan ke satu VM, bergantung pada jenis mesin. Jumlah maksimum disk SSD Lokal, dan ukuran setiap disk SSD Lokal membuat batasan jumlah total kapasitas disk SSD Lokal yang dapat Anda alokasikan untuk VM. Di gcloud CLI dan API, batas ini disebut sebagai kuota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Untuk VM ultra A3 dan A2, Anda tidak perlu meminta kuota ini karena SSD Lokal otomatis ditambahkan ke VM ini. Namun, Anda harus meminta LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY untuk VM yang dioptimalkan akselerator lainnya.

Kuota penyimpanan bersama

Untuk kapasitas, Penyimpanan Gabungan Hyperdisk dengan Penyediaan kapasitas lanjutan memiliki kuota berikut, yang diukur dalam GB (atau 1.000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): Jumlah total ruang disk yang dapat Anda pesan per region di Hyperdisk Balanced Storage Pool dengan penyediaan kapasitas Lanjutan.

    • gcloud CLI dan API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrik: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): Jumlah total ruang disk yang dapat Anda pesan per region di Hyperdisk Throughput Storage Pool dengan penyediaan kapasitas Lanjutan.

    • gcloud CLI dan API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrik: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Untuk performa, Penyimpanan Gabungan Hyperdisk dengan Penyediaan performa lanjutan memiliki kuota berikut:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: Total IOPS yang dapat Anda pesan di Hyperdisk Balanced Storage Pool dengan penyediaan performa Lanjutan untuk suatu region.

    • gcloud CLI dan API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Metrik: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): Total throughput yang dapat Anda pesan di Hyperdisk Balanced Storage Pool dengan penyediaan performa Advanced untuk suatu region.

    • gcloud CLI dan API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrik: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): Total throughput yang dapat Anda pesan di Hyperdisk Throughput Storage Pool dengan penyediaan performa Advanced untuk suatu region.

    • gcloud CLI dan API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrik: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Batas kuota CPU

Kuota CPU adalah jumlah total CPU virtual di semua instance VM di suatu region. Kuota CPU berlaku untuk VM yang berjalan dan pemesanan VM. Baik VM yang telah ditetapkan sebelumnya maupun preemptible VM akan memakai kuota ini.

Untuk membantu melindungi sistem Compute Engine dan pengguna lainnya, beberapa akun dan project baru juga memiliki kuota CPUs (All Regions) global. Kuota tersebut berlaku untuk semua region dan diukur sebagai jumlah semua vCPU Anda di semua region.

Misalnya, jika Anda memiliki 48 vCPU yang tersisa di satu region seperti us-central1, tetapi hanya tersisa 32 vCPU untuk kuota CPUs (All Regions), Anda hanya dapat meluncurkan 32 vCPU di region us-central1, meskipun ada sisa kuota di region tersebut. Ini karena Anda mencapai kuota CPU (All Regions) dan perlu menghapus instance yang sudah ada sebelum dapat meluncurkan instance baru.

Jenis mesin E2 dan N1 menggunakan kumpulan kuota CPU yang sama. Kecuali jika dinyatakan lain, semua jenis mesin lainnya memiliki kumpulan kuota CPU terpisah yang unik.

Jika menggunakan diskon abonemen untuk VM, Anda harus memiliki kuota diskon abonemen sebelum membeli kontrak diskon abonemen.

Jenis mesin Kumpulan kuota Nama kuota CPU Nama kuota CPU yang dikomitmenkan
N1 kumpulan bersama CPUS Committed_CPUS
E2 kumpulan bersama CPUS Committed_CPUS
N2 kumpulan terpisah N2_CPUS Committed_N2_CPUS
N4 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D kumpulan terpisah N2D_CPUS Committed_N2D_CPUS
T2D kumpulan terpisah T2D_CPUS Committed_T2D_CPUS
T2A kumpulan terpisah T2A_CPUS Tidak tersedia (T/A) untuk T2A
Z3 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 kumpulan terpisah M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 kumpulan terpisah M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 kumpulan terpisah M3_CPUS Committed_M3_CPUS
X4 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 kumpulan terpisah C2_CPUS Committed_C2_CPUS
C2D kumpulan terpisah C2D_CPUS Committed_C2D_CPUS
C3 kumpulan terpisah C3_CPUS Committed_C3_CPUS
C3D kumpulan terpisah CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A kumpulan terpisah CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2* kumpulan terpisah A2_CPUS Committed_A2_CPUS
A3 Tidak berlaku (T/A) untuk A3 Tidak berlaku (T/A) untuk A3 Tidak berlaku (T/A) untuk A3
G2 Tidak berlaku (T/A) untuk G2 Tidak berlaku (T/A) untuk G2 Tidak berlaku (T/A) untuk G2
Preemptible VM kumpulan bersama PREEMPTIBLE_CPUS Tidak tersedia (T/A) untuk preemptible VM

*Untuk VM A2, Anda tidak perlu meminta kuota CPU. Jika Anda memiliki kuota GPU NVIDIA A100 yang diperlukan, itu adalah semua yang diperlukan untuk membuat VM ini.

Untuk VM A3 dan G2, kuota CPU tidak berlaku. Jika Anda memiliki kuota GPU NVIDIA H100 dan L4 yang diperlukan, itu adalah semua yang diperlukan untuk membuat VM ini.

Kuota GPU

Sama seperti kuota CPU virtual, kuota GPU mengacu pada jumlah total GPU virtual di semua instance VM di suatu region. Kuota GPU berlaku untuk VM yang berjalan dan pemesanan VM. Baik VM yang telah ditetapkan sebelumnya maupun preemptible VM akan memakai kuota ini.

Buka halaman Kuota untuk memastikan bahwa Anda memiliki cukup GPU yang tersedia dalam project, dan untuk meminta peningkatan kuota. Selain itu, akun dan project baru memiliki kuota GPU global yang berlaku untuk semua region.

Saat meminta kuota GPU, Anda harus meminta kuota untuk model GPU yang ingin dibuat di setiap region, dan kuota global tambahan (GPUs (all regions)) untuk jumlah total semua jenis GPU di semua region. Minta kuota GPU preemptible untuk menggunakan resource tersebut.

Jenis mesin Jenis GPU Nama kuota GPU Keluarga GPU Nama kuota GPU yang dikomitmenkan Workstation virtual Preemptible GPU Workstation virtual preemptible GPU
A3 Mega H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS T/A PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS T/A
A3 Edge dan A3 High H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS T/A PREEMPTIBLE_NVIDIA_H100_GPUS T/A
A2 Ultra A100 80GB NVIDIA_A100_80GB_GPUS T/A COMMITTED_NVIDIA_A100_80GB_GPUS T/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS T/A
Standar A2 A100 40GB NVIDIA_A100_GPUS T/A COMMITTED_NVIDIA_A100_GPUS T/A PREEMPTIBLE_NVIDIA_A100_GPUS T/A
G2 L4 NVIDIA_L4_GPUS T/A COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS T/A COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS T/A COMMITTED_NVIDIA_V100_GPUS T/A PREEMPTIBLE_NVIDIA_V100_GPUS T/A
P100 NVIDIA_P100_GPUS T/A COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS T/A COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Kuota preemptible

Anda dapat meminta kuota preemptible untuk Preemptible CPUs, Preemptible GPUs, dan Preemptible Local SSDs (GB). Kuota preemptible ini berlaku untuk CPU, GPU, dan SSD lokal VM berikut:

Jika project tidak memiliki kuota preemptible, dan Anda tidak pernah meminta kuota preemptible, resource ini akan menggunakan kuota standar. Namun, setelah Anda meminta kuota preemptible di project, resource yang berlaku hanya dapat menggunakan kuota preemptible dan tidak dapat kembali menggunakan kuota standar.

Meminta kuota preemptible dapat membantu Anda meningkatkan ketersediaan kuota dengan menyediakan kuota terpisah untuk resource sementara. Setelah Compute Engine memberi Anda kuota preemptible di suatu region, semua resource yang berlaku akan otomatis menggunakan kuota preemptible. Jika kuota ini habis, Anda harus meminta kuota preemptible untuk resource tersebut.

Alamat IP eksternal

Anda harus memiliki alamat IP eksternal yang cukup untuk setiap VM yang harus dapat dijangkau langsung dari internet publik. Kuota IP regional digunakan untuk menetapkan alamat IPv4 ke VM di region tersebut. Kuota IP global digunakan untuk menetapkan alamat IPv4 ke resource global networking seperti load balancer. Google Cloud menawarkan berbagai jenis alamat IP, sesuai kebutuhan Anda. Untuk mengetahui informasi tentang biaya, lihat Harga alamat IP eksternal. Untuk mengetahui informasi mengenai spesifikasi kuota, lihat Kuota dan batas.

  • Alamat IP eksternal yang sedang digunakan. Mencakup alamat IP statis dan ephemeral yang sedang digunakan oleh suatu resource.

  • Alamat IP Eksternal Statis: Alamat IP eksternal yang dicadangkan untuk resource Anda yang akan tetap ada setelah mesin dimulai ulang. Anda dapat mendaftarkan alamat ini dengan layanan penyedia domain dan DNS untuk memberikan alamat yang mudah digunakan. Misalnya, www.example-site.com.

  • Alamat IP Internal Statis: Alamat IP internal statis memungkinkan Anda memesan alamat IP internal dari rentang IP internal yang dikonfigurasi di subnet. Anda dapat menetapkan alamat internal yang dipesan tersebut ke resource sesuai kebutuhan.

Peluncuran kuota

Terkadang, Google Cloud mengubah kuota default untuk resource dan API. Perubahan ini dilakukan secara bertahap. Selama peluncuran kuota default baru, kuota maksimum yang muncul di konsol Google Cloud mungkin tidak mencerminkan kuota maksimum sebenarnya yang tersedia untuk Anda.

Misalnya, jika Google Cloud mengubah kuota maksimum default untuk aturan firewall dari 200 menjadi 300, dan Anda menggunakan konsol Google Cloud untuk melihat kuota, Anda mungkin akan melihat kuota baru sebesar 300, meskipun kuota sebenarnya adalah 200 hingga peluncuran selesai.

Untuk mengetahui informasi tentang peluncuran kuota yang sedang berlangsung, lihat masalah umum. Jika tidak ada masalah yang dijelaskan, tidak ada peluncuran kuota yang sedang berlangsung.

Jika peluncuran kuota sedang berlangsung dan Anda ingin mengonfirmasi kuota maksimum sebenarnya yang tersedia untuk Anda, gunakan Google Cloud CLI untuk memeriksa kuota. Jika Anda memerlukan kuota lebih banyak dari yang dapat diakses, kirimkan permintaan penambahan kuota.

Langkah selanjutnya