Infrastruktur yang andal adalah persyaratan penting untuk workload di cloud. Sebagai arsitek cloud, untuk merancang infrastruktur workload yang andal, Anda memerlukan pemahaman yang baik mengenai kemampuan keandalan penyedia cloud pilihan Anda. Dokumen ini menjelaskan elemen penyusun keandalan di Google Cloud (zona, region, dan resource cakupan lokasi) dan tingkat ketersediaan yang disediakannya. Dokumen ini juga memberikan panduan untuk menilai persyaratan keandalan workload Anda, dan menyajikan rekomendasi arsitektur untuk membangun serta mengelola infrastruktur yang andal di Google Cloud.
Dokumen ini dibagi menjadi bagian-bagian berikut:
- Ringkasan dari keandalan (bagian ini)
- Elemen penyusun keandalan di Google Cloud
- Menilai persyaratan keandalan untuk workload cloud Anda
- Mendesain infrastruktur yang andal untuk workload Anda di Google Cloud
- Mengelola traffic dan muatan untuk workload Anda di Google Cloud
- Mengelola dan memantau infrastruktur Google Cloud Anda
Jika Anda telah membaca panduan ini sebelumnya dan ingin melihat apa yang berubah, lihat Catatan rilis.
Ringkasan keandalan
Aplikasi atau workload dikatakan dapat diandalkan jika memenuhi tujuan Anda dan memiliki ketersediaan dan ketahanan terhadap kegagalan.
Ketersediaan (atau waktu beroperasi) adalah persentase waktu penggunaan aplikasi. Misalnya, untuk aplikasi yang memiliki target ketersediaan 99,99%, total periode nonaktif tidak boleh melebihi 8,64 detik selama periode 24 jam. Terkadang, ketersediaan diukur sebagai proporsi permintaan yang berhasil ditayangkan oleh aplikasi selama periode tertentu. Misalnya, untuk aplikasi yang memiliki target ketersediaan 99,99%, untuk setiap 100.000 permintaan yang diterima, yang boleh gagal tidak lebih dari sepuluh permintaan. Ketersediaan sering kali dinyatakan dengan angka sembilan dalam persentase. Misalnya, ketersediaan 99,99% dinyatakan dengan "4 angka sembilan".
Bergantung pada tujuan aplikasi, Anda mungkin memiliki kumpulan indikator yang berbeda untuk menunjukkan keandalan aplikasi. Berikut adalah contoh indikator keandalan:
- Untuk aplikasi yang menayangkan konten, indikator keandalan yang penting antara lain ketersediaan, latensi, dan throughput. Indikator ini menunjukkan apakah aplikasi dapat merespons permintaan, berapa lama aplikasi dapat merespons permintaan, dan berapa banyak permintaan yang dapat diproses oleh aplikasi dengan sukses dalam periode tertentu.
- Untuk database dan sistem penyimpanan, indikator keandalannya berupa latensi, throughput, ketersediaan, dan ketahanan (seberapa baik data terlindungi dari kehilangan atau kerusakan). Metrik ini menunjukkan berapa lama sistem membutuhkan waktu untuk membaca atau menulis data, dan apakah data dapat diakses secara on-demand.
- Untuk big data dan workload analisis seperti pipeline pemrosesan data, performa pipeline yang konsisten (throughput dan latensi) sangat penting untuk memastikan keaktualan produk data, dan merupakan indikator keandalan yang penting. Metrik ini menunjukkan jumlah data yang dapat diproses, dan berapa lama waktu yang dibutuhkan pipeline untuk bergerak dari penyerapan data ke pemrosesan data.
- Sebagian besar aplikasi menjadikan ketepatan data sebagai indikator keandalan yang penting.
Guna mengetahui panduan lebih lanjut untuk menentukan tujuan keandalan aplikasi, baca Menilai persyaratan keandalan untuk workload cloud Anda.
Faktor-faktor yang memengaruhi keandalan aplikasi
Keandalan aplikasi yang di-deploy di Google Cloud bergantung pada faktor-faktor berikut:
- Desain internal aplikasi.
- Aplikasi atau komponen sekunder yang menjadi dependensi aplikasi.
- Resource infrastruktur Google Cloud berupa komputasi, jaringan, penyimpanan, database, dan keamanan tempat aplikasi berjalan, serta cara aplikasi menggunakan infrastruktur tersebut.
- Kapasitas infrastruktur yang Anda sediakan, dan cara kapasitas diskalakan.
- DevOps memproses dan alat yang Anda gunakan untuk mem-build, men-deploy, dan mengelola aplikasi, beserta dependensinya, juga infrastruktur Google Cloud.
Faktor-faktor ini dirangkum dalam diagram berikut:
Seperti yang ditunjukkan pada diagram sebelumnya, keandalan aplikasi yang di-deploy di Google Cloud bergantung pada beberapa faktor. Fokus dari panduan ini adalah keandalan infrastruktur Google Cloud.
Langkah selanjutnya
- Elemen penyusun keandalan di Google Cloud
- Menilai persyaratan keandalan untuk workload cloud Anda
- Mendesain infrastruktur yang andal untuk workload Anda di Google Cloud
- Mengelola traffic dan muatan untuk workload Anda di Google Cloud
- Mengelola dan memantau infrastruktur Google Cloud Anda
Kontributor
Penulis:
- Nir Tarcic | UTL SRE Siklus Proses Cloud
- Kumar Dhanagopal | Developer Solusi Lintas Produk
Kontributor lainnya:
- Alok Kumar | Distinguished Engineer
- Andrew Fikes | Engineering Fellow, Reliability
- Chris Heiser | SRE TL
- David Ferguson | Direktur, Site Reliability Engineering
- Joe Tan | Senior Product Counsel
- Krzysztof Duleba | Principal Engineer
- Narayan Desai | SRE Utama
- Sailesh Krishnamurthy | VP, Engineering
- Steve McGhee | Reliability Advocate
- Sudhanshu Jain | Product Manager
- Yaniv Aknin | Software Engineer