Skalabilitas cloud adalah kemampuan sistem cloud computing untuk menambah atau mengurangi resource-nya, seperti daya komputasi, penyimpanan, dan bandwidth jaringan, guna memenuhi perubahan permintaan. Hal ini dapat menjadi manfaat utama cloud karena memungkinkan bisnis menangani peningkatan atau penurunan workload tanpa merombak seluruh infrastruktur mereka. Artinya, Anda dapat dengan mudah menyesuaikan resource seiring pertumbuhan bisnis atau perubahan traffic ke aplikasi Anda, dan hanya membayar sesuai penggunaan.
Meskipun sering digunakan secara bergantian, skalabilitas dan elastisitas adalah konsep yang berbeda. Keduanya berkaitan dengan kemampuan sistem untuk menangani perubahan permintaan, tetapi melakukannya dengan cara yang berbeda.
Skalabilitas adalah kemampuan sistem untuk menangani peningkatan jumlah tugas dengan menambahkan resource dari waktu ke waktu. Hal ini sering kali merupakan pendekatan jangka panjang yang terencana untuk memenuhi peningkatan permintaan. Misalnya, sebuah perusahaan mungkin berencana untuk meningkatkan skala resource database-nya untuk mengantisipasi kampanye pemasaran besar yang akan mendatangkan lebih banyak pengguna. Skalabilitas adalah kemampuan sistem untuk berkembang guna memenuhi pertumbuhan di masa mendatang.
Elastisitas adalah kemampuan sistem untuk menyesuaikan resource secara otomatis dan cepat secara real time, yang merespons perubahan permintaan yang terjadi secara tiba-tiba. Anggap saja seperti karet gelang yang meregang dan menyusut. Misalnya, situs e-commerce dapat dirancang untuk otomatis menambahkan lebih banyak server guna menangani lonjakan traffic yang tiba-tiba pada hari libur seperti Black Friday, lalu mengurangi jumlah server saat traffic menurun. Elastisitas adalah penyesuaian dinamis dan on-demand untuk memenuhi permintaan saat ini, yang dapat membantu mengoptimalkan biaya dan performa.
Skalabilitas cloud terutama hadir dalam dua bentuk: penskalaan vertikal dan penskalaan horizontal. Pendekatan yang tepat bergantung pada arsitektur aplikasi dan sifat workload.
Penskalaan vertikal, yang juga dikenal sebagai "peningkatan skala" atau "penurunan skala", adalah proses penambahan atau penghapusan resource dari satu server atau mesin. Hal ini seperti mengupgrade satu komputer dengan prosesor yang lebih cepat atau RAM yang lebih besar. Tujuannya adalah membuat suatu mesin menjadi lebih canggih.
Cara kerja penskalaan vertikal
Anda dapat melakukan penskalaan vertikal dengan meningkatkan kapasitas virtual machine (VM) yang ada. Misalnya, jika aplikasi berjalan di VM dengan jumlah core CPU dan jumlah memori tertentu, Anda dapat meningkatkan skala dengan memilih VM yang lebih besar dengan lebih banyak resource. Demikian pula, Anda dapat memperkecil skala dengan beralih ke VM yang lebih kecil.
Penskalaan horizontal, yang juga disebut "penyebaran skala" atau "penurunan skala", melibatkan peningkatan jumlah mesin atau node dalam sistem untuk mendistribusikan workload secara lebih efektif. Hal ini seperti menambahkan lebih banyak komputer ke jaringan untuk berbagi pekerjaan. Tujuannya adalah meningkatkan kapasitas dengan menggunakan beberapa mesin, bukan membuat satu mesin menjadi lebih canggih.
Cara kerja penskalaan horizontal
Penskalaan horizontal melibatkan menjalankan aplikasi Anda di beberapa VM, dan load balancer kemudian mendistribusikan traffic masuk ke seluruh machine ini. Seiring meningkatnya permintaan, Anda dapat menambahkan lebih banyak VM ke grup secara otomatis atau manual. Saat permintaan menurun, Anda dapat menghapusnya.
Keputusan antara penskalaan vertikal dan horizontal bergantung pada arsitektur aplikasi dan kebutuhan bisnis Anda.
Fitur | Penskalaan vertikal | Penskalaan horizontal |
Kompleksitas | Lebih sederhana, karena hanya melibatkan satu mesin. | Lebih kompleks, karena memerlukan pengelolaan beberapa node dan load balancer. |
Periode nonaktif | Dapat menyebabkan gangguan layanan singkat selama upgrade. | Biasanya tidak memiliki periode nonaktif karena mesin baru ditambahkan tanpa mengganggu mesin yang ada. |
Batas skalabilitas | Dibatasi oleh kapasitas fisik satu mesin. | Hampir tidak terbatas, karena Anda dapat menambahkan mesin sebanyak yang Anda butuhkan. |
Fault-tolerance | Memiliki titik tunggal kegagalan; jika mesin tidak berfungsi, aplikasi tidak tersedia. | Fault-tolerance yang tinggi; jika satu mesin gagal, mesin lainnya dapat terus beroperasi. |
Fitur
Penskalaan vertikal
Penskalaan horizontal
Kompleksitas
Lebih sederhana, karena hanya melibatkan satu mesin.
Lebih kompleks, karena memerlukan pengelolaan beberapa node dan load balancer.
Periode nonaktif
Dapat menyebabkan gangguan layanan singkat selama upgrade.
Biasanya tidak memiliki periode nonaktif karena mesin baru ditambahkan tanpa mengganggu mesin yang ada.
Batas skalabilitas
Dibatasi oleh kapasitas fisik satu mesin.
Hampir tidak terbatas, karena Anda dapat menambahkan mesin sebanyak yang Anda butuhkan.
Fault-tolerance
Memiliki titik tunggal kegagalan; jika mesin tidak berfungsi, aplikasi tidak tersedia.
Fault-tolerance yang tinggi; jika satu mesin gagal, mesin lainnya dapat terus beroperasi.
Untuk peningkatan performa awal, penskalaan vertikal dapat menjadi metode yang paling efektif. Seiring berkembangnya aplikasi dan meningkatnya kebutuhan akan ketersediaan, transisi ke penskalaan horizontal mungkin menjadi lebih tepat. Pendekatan hybrid, yang terkadang disebut "penskalaan diagonal", juga menggabungkan kedua metode tersebut.
Meskipun banyak penyedia menawarkan kemampuan penskalaan standar, Google Cloud menyediakan serangkaian alat fleksibel dan berbeda yang dirancang untuk memenuhi kebutuhan aplikasi modern yang terus berkembang. Mulai dari prediksi berbasis machine learning hingga kemampuan hybrid yang unik, penawaran ini dapat membantu Anda mengoptimalkan performa dan biaya secara lebih efektif.
Penskalaan otomatis tradisional bersifat reaktif—penskalaan ini menambahkan resource hanya setelah permintaan melonjak, yang terkadang dapat menyebabkan jeda performa singkat. Penskalaan otomatis prediktif Compute Engine mengatasi masalah ini dengan menggunakan machine learning untuk memperkirakan beban di masa mendatang berdasarkan data historis Anda. Hal ini dapat menyebarkan skala infrastruktur Anda sebelum traffic yang diprediksi datang, sehingga membantu memastikan aplikasi Anda siap melayani pengguna saat permintaan tiba.
Sebagian besar penyedia cloud mengharuskan Anda memilih dari "ukuran t-shirt" yang telah ditentukan sebelumnya untuk virtual machine Anda, yang sering kali menyebabkan Anda membayar resource yang tidak diperlukan. Google Cloud menawarkan jenis mesin kustom, yang memungkinkan Anda menyesuaikan jumlah vCPU dan memori yang tepat untuk workload Anda. Kontrol terperinci ini membantu Anda menskalakan infrastruktur secara vertikal dengan efisien, menyesuaikan resource dengan tugas, bukan sebaliknya.
Bagi organisasi dengan infrastruktur lokal, menangani lonjakan traffic yang tiba-tiba dapat menjadi suatu tantangan. Cloud bursting memungkinkan Anda untuk "meledakkan" traffic berlebih ke cloud publik dengan lancar saat pusat data pribadi Anda mencapai kapasitasnya. Solusi hybrid dan multi-cloud Google Cloud, seperti GKE Enterprise, memberikan konsistensi dan fleksibilitas yang diperlukan untuk mengelola workload di berbagai lingkungan, sehingga Anda dapat melakukan penskalaan tanpa batas tanpa perlu mengabaikan investasi yang sudah ada.
Cloud Run memungkinkan Anda menjalankan aplikasi dalam container tanpa perlu mengelola infrastruktur yang mendasarinya. Pembeda utamanya adalah kemampuannya untuk melakukan penskalaan hingga nol, yang berarti jika tidak ada traffic, Anda tidak menggunakan resource dan tidak membayar apa pun. Saat traffic kembali tersedia, Cloud Run dapat hampir secara instan melakukan peningkatan skala dari nol hingga ribuan instance, sehingga cocok untuk aplikasi dengan pola traffic yang sangat bervariasi atau tidak dapat diprediksi.
Skalabilitas bukan hanya tentang menambahkan server, tetapi juga tentang mengarahkan traffic ke server tersebut secara efisien. Google Cloud Load Balancing menggunakan satu alamat IP anycast global untuk mendistribusikan traffic di seluruh resource Anda di seluruh dunia. Hal ini memungkinkan Anda menskalakan aplikasi secara global tanpa penyiapan DNS yang rumit atau fragmentasi regional, sehingga pengguna selalu dirutekan ke instance responsif terdekat dengan kapasitas yang tersedia.
Skalabilitas cloud dapat menawarkan beberapa manfaat penting yang sulit dicapai dengan infrastruktur lokal tradisional.
Efisiensi biaya
Anda berpotensi menghindari penyediaan resource yang berlebihan dan biaya tinggi untuk memelihara hardware yang tidak digunakan. Dengan skalabilitas cloud, Anda hanya membayar resource yang Anda gunakan, sehingga mengubah biaya tetap menjadi biaya variabel.
Peningkatan performa dan ketersediaan
Dengan menyesuaikan resource secara dinamis, aplikasi Anda dapat lebih mudah mempertahankan performa tinggi bahkan selama puncak permintaan, sehingga mencegah perlambatan dan gangguan layanan yang dapat membuat pengguna frustrasi.
Menangani permintaan yang tidak dapat diprediksi
Skalabilitas membantu Anda menangani lonjakan traffic yang tidak terduga, seperti yang berasal dari postingan media sosial yang viral, tanpa harus menambahkan hardware baru secara manual.
Ketangkasan bisnis
Kemampuan untuk melakukan penskalaan dengan cepat membantu Anda berinovasi dan merespons perubahan pasar dengan lebih cepat. Anda dapat men-deploy fitur atau aplikasi baru tanpa menunggu infrastruktur disiapkan.
Google Cloud menawarkan berbagai layanan yang dirancang untuk membantu Anda membangun aplikasi yang sangat skalabel. Banyak layanan ini memiliki fitur penskalaan otomatis bawaan, sehingga Anda tidak perlu mengelola infrastruktur yang mendasarinya.



Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.