Mengoptimalkan secara berkelanjutan

Last reviewed 2024-09-25 UTC

Prinsip ini dalam pilar pengoptimalan biaya pada Framework Arsitektur Google Cloud memberikan rekomendasi untuk membantu Anda mengoptimalkan biaya deployment cloud berdasarkan tujuan bisnis yang terus berubah dan berkembang.

Seiring berkembangnya bisnis Anda, workload cloud Anda perlu beradaptasi dengan perubahan persyaratan resource dan pola penggunaan. Untuk mendapatkan nilai maksimum dari pembelanjaan cloud, Anda harus mempertahankan efisiensi biaya sekaligus terus mendukung tujuan bisnis. Hal ini memerlukan pendekatan proaktif dan adaptif yang berfokus pada peningkatan dan pengoptimalan berkelanjutan.

Ringkasan prinsip

Untuk mengoptimalkan biaya secara berkelanjutan, Anda harus memantau dan menganalisis lingkungan cloud secara proaktif dan melakukan penyesuaian yang sesuai untuk memenuhi persyaratan saat ini. Fokuskan upaya pemantauan Anda pada indikator performa utama (KPI) yang secara langsung memengaruhi pengalaman pengguna akhir, selaras dengan sasaran bisnis Anda, dan memberikan insight untuk peningkatan berkelanjutan. Pendekatan ini memungkinkan Anda mengidentifikasi dan mengatasi inefektivitas, beradaptasi dengan kebutuhan yang berubah, dan terus menyelaraskan pembelanjaan cloud dengan sasaran bisnis strategis. Untuk menyeimbangkan visibilitas komprehensif dengan efektivitas biaya, pahami biaya dan manfaat pemantauan penggunaan resource dan gunakan strategi peningkatan proses dan pengoptimalan yang sesuai.

Rekomendasi

Untuk memantau lingkungan Google Cloud secara efektif dan mengoptimalkan biaya secara berkelanjutan, pertimbangkan rekomendasi berikut.

Berfokus pada metrik yang relevan dengan bisnis

Pemantauan yang efektif dimulai dengan mengidentifikasi metrik yang paling penting untuk bisnis dan pelanggan Anda. Metrik ini mencakup:

  • Metrik pengalaman pengguna: Metrik latensi, rasio error, throughput, dan kepuasan pelanggan berguna untuk memahami pengalaman pengguna akhir saat menggunakan aplikasi Anda.
  • Metrik hasil bisnis: Pendapatan, pertumbuhan pelanggan, dan engagement dapat dikaitkan dengan penggunaan resource untuk mengidentifikasi peluang pengoptimalan biaya.
  • Metrik DevOps Research & Assessment (DORA): Metrik seperti frekuensi deployment, waktu tunggu untuk perubahan, tingkat kegagalan perubahan, dan waktu untuk memulihkan memberikan insight tentang efisiensi dan keandalan proses pengiriman software Anda. Dengan meningkatkan metrik ini, Anda dapat meningkatkan produktivitas, mengurangi periode nonaktif, dan mengoptimalkan biaya.
  • Metrik Site Reliability Engineering (SRE): Anggaran error membantu tim mengukur dan mengelola tingkat gangguan layanan yang dapat diterima. Dengan menetapkan ekspektasi yang jelas untuk keandalan, anggaran error memberdayakan tim untuk berinovasi dan menerapkan perubahan dengan lebih percaya diri, dengan mengetahui margin keamanan mereka. Pendekatan proaktif ini mendorong keseimbangan antara inovasi dan stabilitas, sehingga membantu mencegah biaya operasional yang berlebihan yang terkait dengan penonaktifan besar atau periode nonaktif yang berkepanjangan.

Menggunakan kemampuan observasi untuk pengoptimalan resource

Berikut adalah rekomendasi untuk menggunakan visibilitas guna mengidentifikasi bottleneck resource dan resource yang kurang dimanfaatkan dalam deployment cloud Anda:

  • Memantau penggunaan resource: Gunakan metrik penggunaan resource untuk mengidentifikasi resource Google Cloud yang kurang dimanfaatkan. Misalnya, gunakan metrik seperti pemakaian CPU dan memori untuk mengidentifikasi resource VM yang tidak ada aktivitas. Untuk Google Kubernetes Engine (GKE), Anda dapat melihat perincian biaya mendetail dan metrik pengoptimalan terkait biaya. Untuk Google Cloud VMware Engine, tinjau penggunaan resource untuk mengoptimalkan CUD, penggunaan penyimpanan, dan penyesuaian ukuran ESXi.
  • Gunakan rekomendasi cloud: Active Assist adalah portofolio alat cerdas yang membantu Anda mengoptimalkan operasi cloud. Alat ini memberikan rekomendasi yang dapat ditindaklanjuti untuk mengurangi biaya, meningkatkan performa, meningkatkan keamanan, dan bahkan membuat keputusan yang berfokus pada keberlanjutan. Misalnya, insight penyesuaian ukuran VM dapat membantu mengoptimalkan alokasi resource dan menghindari pembelanjaan yang tidak perlu.
  • Mengaitkan penggunaan resource dengan performa: Menganalisis hubungan antara penggunaan resource dan performa aplikasi untuk menentukan apakah Anda dapat mendowngrade ke resource yang lebih murah tanpa memengaruhi pengalaman pengguna.

Menyeimbangkan kebutuhan pemecahan masalah dengan biaya

Data visibilitas yang mendetail dapat membantu mendiagnosis dan memecahkan masalah. Namun, menyimpan data visibilitas dalam jumlah yang berlebihan atau mengekspor data yang tidak perlu ke alat pemantauan eksternal dapat menyebabkan biaya yang tidak perlu. Untuk pemecahan masalah yang efisien, pertimbangkan rekomendasi berikut:

  • Kumpulkan data yang memadai untuk pemecahan masalah: Pastikan solusi pemantauan Anda mengumpulkan data yang memadai untuk mendiagnosis dan menyelesaikan masalah secara efisien saat masalah tersebut muncul. Data ini dapat mencakup log, rekaman aktivitas, dan metrik pada berbagai tingkat perincian.
  • Gunakan sampling dan agregasi: Seimbangkan kebutuhan akan data mendetail dengan pertimbangan biaya menggunakan teknik sampling dan agregasi. Pendekatan ini memungkinkan Anda mengumpulkan data perwakilan tanpa menimbulkan biaya penyimpanan yang berlebihan.
  • Memahami model harga alat dan layanan pemantauan: Evaluasi berbagai solusi pemantauan dan pilih opsi yang sesuai dengan kebutuhan, anggaran, dan pola penggunaan spesifik project Anda. Pertimbangkan faktor-faktor seperti volume data, persyaratan retensi, dan fitur yang diperlukan saat membuat pilihan.
  • Tinjau konfigurasi pemantauan Anda secara berkala: Hindari mengumpulkan data yang berlebihan dengan menghapus metrik atau log yang tidak diperlukan.

Menyesuaikan pengumpulan data dengan peran dan menetapkan kebijakan retensi khusus peran

Pertimbangkan kebutuhan data spesifik dari berbagai peran. Misalnya, developer mungkin terutama memerlukan akses ke rekaman aktivitas dan log tingkat aplikasi, sedangkan administrator IT mungkin berfokus pada log sistem dan metrik infrastruktur. Dengan menyesuaikan pengumpulan data, Anda dapat mengurangi biaya penyimpanan yang tidak perlu dan menghindari membingungkan pengguna dengan informasi yang tidak relevan.

Selain itu, Anda dapat menentukan kebijakan retensi berdasarkan kebutuhan setiap peran dan persyaratan peraturan apa pun. Misalnya, developer mungkin memerlukan akses ke log mendetail untuk jangka waktu yang lebih singkat, sementara analis keuangan mungkin memerlukan data jangka panjang.

Pertimbangkan persyaratan peraturan dan kepatuhan

Di industri tertentu, persyaratan peraturan mewajibkan retensi data. Untuk menghindari risiko hukum dan keuangan, Anda harus memastikan bahwa praktik pemantauan dan retensi data membantu Anda mematuhi peraturan yang relevan. Pada saat yang sama, Anda perlu mempertahankan efisiensi biaya. Pertimbangkan rekomendasi berikut:

  • Tentukan persyaratan retensi data spesifik untuk industri atau wilayah Anda, dan pastikan strategi pemantauan Anda memenuhi persyaratan tersebut.
  • Terapkan mekanisme pengarsipan dan pengambilan data yang sesuai untuk memenuhi kebutuhan audit dan kepatuhan sekaligus meminimalkan biaya penyimpanan.

Menerapkan pemberitahuan cerdas

Pemberitahuan membantu mendeteksi dan menyelesaikan masalah secara tepat waktu. Namun, keseimbangan diperlukan antara pendekatan yang terus memberi tahu Anda, dan pendekatan yang membanjiri Anda dengan notifikasi. Dengan mendesain sistem pemberitahuan cerdas, Anda dapat memprioritaskan masalah penting yang memiliki dampak bisnis yang lebih tinggi. Pertimbangkan saran berikut:

  • Prioritaskan masalah yang memengaruhi pelanggan: Buat pemberitahuan yang memicu dengan cepat untuk masalah yang secara langsung memengaruhi pengalaman pelanggan, seperti pemadaman situs, waktu respons lambat, atau kegagalan transaksi.
  • Menyesuaikan untuk masalah sementara: Gunakan nilai minimum dan mekanisme penundaan yang sesuai untuk menghindari pemberitahuan yang tidak perlu terkait masalah sementara atau masalah sistem perbaikan mandiri yang tidak memengaruhi pelanggan.
  • Menyesuaikan tingkat keparahan pemberitahuan: Pastikan masalah yang paling mendesak menerima perhatian langsung dengan membedakan antara pemberitahuan kritis dan nonkritis.
  • Gunakan saluran notifikasi dengan bijak: Pilih saluran yang sesuai untuk notifikasi pemberitahuan (email, SMS, atau paging) berdasarkan tingkat keparahan dan urgensi pemberitahuan.