Kelola kapasitas dan kuota

Last reviewed 2023-08-21 UTC

Dokumen dalam Framework Arsitektur Google Cloud ini menunjukkan cara memberikan evaluasi serta merencanakan kapasitas dan kuota Anda di cloud.

Di pusat data konvensional, Anda biasanya menghabiskan siklus setiap kuartal untuk meninjau persyaratan resource saat ini dan memperkirakan persyaratan mendatang. Anda harus mempertimbangkan masalah terkait fisik, logistik, dan sumber daya manusia. Urusan seperti ruang rak, pendinginan, listrik, bandwidth, pemasangan kabel, waktu pengadaan, waktu pengiriman, dan jumlah engineer yang tersedia untuk menyiapkan rak dan menumpuk peralatan baru perlu dipertimbangkan. Anda juga harus secara aktif mengelola distribusi kapasitas dan workload sehingga tugas yang membutuhkan banyak resource, seperti pipeline Hadoop, tidak akan mengganggu layanan, seperti server web, yang harus memiliki banyak ketersediaan.

Sebaliknya, saat menggunakan Google Cloud, Anda menyerahkan sebagian besar perencanaan kapasitas kepada Google. Menggunakan cloud berarti Anda tidak perlu menyediakan dan memelihara resource nonaktif saat tidak diperlukan. Misalnya, Anda dapat membuat, meningkatkan skala, dan menurunkan skala instance VM sesuai kebutuhan. Karena membayar untuk apa yang digunakan, Anda dapat mengoptimalkan pengeluaran, termasuk kelebihan kapasitas yang hanya Anda butuhkan pada waktu puncak traffic. Untuk membantu Anda menyimpan, Compute Engine memberikan rekomendasi jenis mesin jika Compute Engine mendeteksi bahwa Anda memiliki instance VM yang kurang dimanfaatkan, yang dapat diubah ukurannya atau dihapus.

Evaluasi kebutuhan kapasitas cloud Anda

Untuk mengelola kapasitas secara efektif, Anda perlu mengetahui persyaratan kapasitas organisasi Anda.

Untuk mengevaluasi persyaratan kapasitas Anda, mulailah dengan mengidentifikasi workload cloud teratas Anda. Berikan evaluasi penggunaan rata-rata dan puncak workload ini, serta kebutuhan kapasitasnya saat ini dan di masa mendatang.

Identifikasi tim yang menggunakan workload teratas ini. Bekerja dengan mereka untuk membangun proses perencanaan permintaan internal. Gunakan proses ini untuk memahami kebutuhan resource cloud mereka saat ini dan perkiraan kebutuhannya.

Analisis pola pemuatan dan distribusi panggilan. Gunakan faktor seperti 30 hari terakhir terakhir, puncak per jam, dan puncak per menit dalam analisis Anda.

Pertimbangkan untuk menggunakan Cloud Monitoring untuk mendapatkan visibilitas yang ada kaitannya dengan performa, waktu beroperasi, dan kondisi keseluruhan aplikasi serta infrastruktur Anda.

Lihat metrik penggunaan infrastruktur Anda

Untuk mempermudah perencanaan kapasitas, kumpulkan dan simpan data historis tentang penggunaan resource cloud yang digunakan organisasi Anda.

Pastikan Anda memiliki visibilitas terkait metrik penggunaan infrastruktur. Misalnya, untuk workload teratas, evaluasi hal berikut:

  • Pemakaian rata-rata dan puncak
  • Lonjakan dalam pola penggunaan
  • Lonjakan musiman berdasarkan persyaratan bisnis, seperti periode liburan untuk retailer
  • Jumlah penyediaan yang berlebihan yang diperlukan untuk mempersiapkan peristiwa puncak dan menangani potensi lonjakan traffic dengan cepat

Pastikan organisasi Anda telah menyiapkan pemberitahuan agar mendapatkan pemberitahuan secara otomatis saat Anda mendekati batas kuota dan kapasitas.

Gunakan alat pemantauan Google untuk mendapatkan insight penggunaan dan kapasitas aplikasi. Misalnya, Anda dapat menentukan metrik kustom dengan Monitoring. Gunakan metrik kustom ini untuk menentukan tren pemberitahuan. Monitoring juga menyediakan dasbor fleksibel dan alat visualisasi yang beragam untuk membantu mengidentifikasi kemunculan masalah.

Buat proses untuk perencanaan kapasitas

Tetapkan proses untuk perencanaan kapasitas dan dokumentasikan rencana ini.

Saat Anda membuat rencana ini, lakukan hal berikut:

  1. Jalankan uji beban untuk menentukan seberapa banyak beban yang dapat ditangani sistem sementara memenuhi target latensi, dengan jumlah resource yang tetap. Pengujian beban harus menggunakan campuran jenis permintaan yang cocok dengan profil traffic produksi dari pengguna aktif. Jangan gunakan campuran operasi yang seragam atau acak. Sertakan lonjakan penggunaan dalam profil traffic Anda.
  2. Buat model kapasitas. Model kapasitas adalah sekumpulan formula untuk menghitung resource inkremental yang diperlukan per peningkatan unit dalam beban layanan, seperti yang ditentukan dari pengujian beban.
  3. Perkirakan traffic mendatang dan perhitungkan pertumbuhan. Lihat artikel Mengukur Pemuatan Masa Depan untuk ringkasan tentang cara Google membuat perkiraan traffic.
  4. Terapkan model kapasitas ke perkiraan untuk menentukan kebutuhan sumber daya di masa mendatang.
  5. Perkirakan biaya resource yang dibutuhkan oleh organisasi Anda. Kemudian, dapatkan persetujuan anggaran dari bagian Keuangan Anda. Langkah ini sangat penting karena bisnis dapat menentukan untuk melakukan kompromi biaya versus risiko di berbagai produk. Konsekuensi tersebut dapat berarti memperoleh kapasitas yang lebih rendah atau lebih tinggi dibandingkan dengan prediksi kebutuhan untuk produk tertentu berdasarkan prioritas bisnis.
  6. Bekerja samalah dengan penyedia cloud Anda untuk mendapatkan jumlah resource yang tepat pada waktu yang tepat dengan kuota dan reservasi. Libatkan tim infrastruktur untuk perencanaan kapasitas dan membuat operasi membuat rencana kapasitas dengan interval keyakinan.
  7. Ulangi langkah sebelumnya setiap seperempat atau dua langkah.

Untuk panduan yang lebih mendetail tentang proses perencanaan kapasitas sekaligus mengoptimalkan penggunaan resource, lihat Perencanaan Kapasitas.

Pastikan kuota Anda sesuai dengan kebutuhan kapasitas Anda

Google Cloud menggunakan quotas untuk membatasi jumlah resource Google Cloud bersama yang dapat Anda gunakan. Setiap kuota mewakili resource tertentu yang dapat dihitung, seperti panggilan API ke layanan tertentu, jumlah load balancer yang digunakan secara bersamaan oleh berbagai project Anda, atau jumlah project yang dapat Anda buat Misalnya, kuota memastikan bahwa beberapa pelanggan atau project tidak dapat memonopoli core CPU di wilayah atau zona tertentu.

Saat melakukan peninjauan kuota, pertimbangkan detail berikut:

  • Rencanakan dahulu persyaratan kapasitas project Anda untuk mencegah pembatasan yang tidak terduga pada konsumsi resource Anda
  • Siapkan kuota dan kapasitas Anda untuk menangani region gagal penuh.
  • Gunakan kuota untuk membatasi pemakaian resource tertentu. Misalnya, Anda dapat menetapkan kuota maksimum penggunaan kueri per hari melalui BigQuery API untuk memastikan bahwa project tidak melakukan pembelanjaan berlebihan di BigQuery.
  • Buat rencana lonjakan penggunaan dan sertakan lonjakan ini sebagai bagian dari perencanaan kuota Anda. Lonjakan penggunaan dapat berupa fluktuasi yang diperkirakan sepanjang hari, peristiwa traffic puncak yang tidak terduga, atau peristiwa peluncuran dan traffic puncak yang diketahui. Untuk detail tentang cara merencanakan traffic puncak dan peristiwa peluncuran, baca bagian berikutnya di Keunggulan Operasional: Merencanakan traffic puncak dan peristiwa peluncuran.

Jika kuota saat ini tidak cukup, Anda dapat mengelola kuota menggunakan Google Cloud Console. Jika Anda memerlukan kapasitas besar, hubungi tim penjualan Google Cloud. Namun, Anda perlu mengetahui bahwa banyak layanan juga memiliki batasan yang tidak terkait dengan sistem kuota. Untuk mengetahui informasi selengkapnya, lihat Menangani kuota.

Tinjau kuota Anda secara berkala. Kirimkan permintaan kuota sebelum diperlukan. Baca artikel Menangani kuota untuk mengetahui detail tentang cara permintaan kuota dievaluasi dan cara permintaan disetujui atau ditolak.

Terdapat beberapa cara untuk melihat dan mengelola kuota Google Cloud Anda:

Langkah selanjutnya