Prinsip ini dalam pilar pengoptimalan biaya Framework Arsitektur Google Cloud memberikan rekomendasi untuk membantu Anda merencanakan dan menyediakan resource agar sesuai dengan persyaratan dan pola penggunaan workload cloud Anda.
Ringkasan prinsip
Untuk mengoptimalkan biaya resource cloud, Anda perlu memahami persyaratan resource dan pola beban workload secara menyeluruh. Pemahaman ini adalah dasar untuk model biaya yang ditentukan dengan baik yang memungkinkan Anda memperkirakan total biaya kepemilikan (TCO) dan mengidentifikasi pendorong biaya selama perjalanan adopsi cloud Anda. Dengan menganalisis dan memperkirakan pengeluaran cloud secara proaktif, Anda dapat membuat pilihan yang tepat tentang penyediaan, pemanfaatan, dan pengoptimalan biaya resource. Pendekatan ini memungkinkan Anda mengontrol pembelanjaan cloud, menghindari penyediaan berlebih, dan memastikan bahwa resource cloud selaras dengan kebutuhan dinamis workload dan lingkungan Anda.
Rekomendasi
Untuk mengoptimalkan penggunaan resource cloud secara efektif, pertimbangkan rekomendasi berikut.
Memilih resource khusus lingkungan
Setiap lingkungan deployment memiliki persyaratan yang berbeda untuk ketersediaan, keandalan, dan skalabilitas. Misalnya, developer mungkin lebih memilih lingkungan yang memungkinkan mereka men-deploy dan menjalankan aplikasi dengan cepat untuk durasi singkat, tetapi mungkin tidak memerlukan ketersediaan tinggi. Di sisi lain, lingkungan produksi biasanya memerlukan ketersediaan tinggi. Untuk memaksimalkan penggunaan resource, tentukan persyaratan khusus lingkungan berdasarkan kebutuhan bisnis Anda. Tabel berikut mencantumkan contoh persyaratan khusus lingkungan.
Lingkungan | Persyaratan |
Produksi |
|
Pengembangan dan pengujian |
|
Lingkungan lain (seperti staging dan QA) |
|
Memilih resource khusus beban kerja
Setiap workload cloud Anda mungkin memiliki persyaratan yang berbeda untuk ketersediaan, skalabilitas, keamanan, dan performa. Untuk mengoptimalkan biaya, Anda perlu menyelaraskan pilihan resource dengan persyaratan spesifik dari setiap workload. Misalnya, aplikasi stateless mungkin tidak memerlukan tingkat ketersediaan atau keandalan yang sama dengan backend stateful. Tabel berikut mencantumkan contoh lain dari persyaratan khusus beban kerja.
Jenis beban kerja | Persyaratan beban kerja | Opsi resource |
Misi penting | Ketersediaan berkelanjutan, keamanan yang andal, dan performa tinggi | Resource premium dan layanan terkelola seperti Spanner untuk ketersediaan tinggi dan konsistensi data global. |
Tidak penting | Infrastruktur hemat biaya dan penskalaan otomatis | Resource dengan fitur dasar dan resource sementara seperti Spot VM. |
Berbasis peristiwa | Penskalaan dinamis berdasarkan permintaan kapasitas dan performa saat ini | Layanan serverless seperti Cloud Run dan fungsi Cloud Run. |
Workload eksperimental | Lingkungan fleksibel dan berbiaya rendah untuk pengembangan, iterasi, pengujian, dan inovasi yang cepat | Resource dengan fitur dasar, resource sementara seperti Spot VM, dan lingkungan sandbox dengan batas pembelanjaan yang ditentukan. |
Manfaat cloud adalah peluang untuk memanfaatkan daya komputasi yang paling sesuai untuk beban kerja tertentu. Beberapa beban kerja dikembangkan untuk memanfaatkan set instruksi prosesor, dan yang lainnya mungkin tidak dirancang dengan cara ini. Lakukan benchmark dan buat profil workload Anda. Kategorikan workload Anda dan buat pilihan resource khusus workload (misalnya, pilih keluarga mesin yang sesuai untuk VM Compute Engine). Praktik ini membantu mengoptimalkan biaya, memungkinkan inovasi, dan mempertahankan tingkat ketersediaan dan performa yang diperlukan oleh beban kerja Anda.
Berikut adalah contoh cara menerapkan rekomendasi ini:
- Untuk workload penting yang melayani pengguna yang didistribusikan secara global, pertimbangkan untuk menggunakan Spanner. Spanner menghilangkan kebutuhan untuk deployment database yang kompleks dengan memastikan keandalan dan konsistensi data di semua region.
- Untuk beban kerja dengan tingkat beban yang berfluktuasi, gunakan penskalaan otomatis untuk memastikan bahwa Anda tidak dikenai biaya saat beban rendah, tetapi tetap mempertahankan kapasitas yang memadai untuk memenuhi beban saat ini. Anda dapat mengonfigurasi penskalaan otomatis untuk banyak layanan Google Cloud, termasuk VM Compute Engine, cluster Google Kubernetes Engine (GKE), dan Cloud Run. Saat menyiapkan autoscaling, Anda dapat mengonfigurasi batas penskalaan maksimum untuk memastikan biaya tetap dalam anggaran yang ditentukan.
Memilih region berdasarkan persyaratan biaya
Untuk workload cloud Anda, evaluasi dengan cermat region Google Cloud yang tersedia dan pilih region yang sesuai dengan tujuan biaya Anda. Region dengan biaya terendah mungkin tidak menawarkan latensi yang optimal atau mungkin tidak memenuhi persyaratan keberlanjutan Anda. Buat keputusan yang tepat tentang tempat men-deploy workload untuk mencapai keseimbangan yang diinginkan. Anda dapat menggunakan Pemilih Region Google Cloud untuk memahami kompromi antara biaya, keberlanjutan, latensi, dan faktor lainnya.
Menggunakan opsi pengoptimalan biaya bawaan
Produk Google Cloud menyediakan fitur bawaan untuk membantu Anda mengoptimalkan penggunaan resource dan mengontrol biaya. Tabel berikut mencantumkan contoh fitur pengoptimalan biaya yang dapat Anda gunakan di beberapa produk Google Cloud:
Produk | Fitur pengoptimalan biaya |
Compute Engine |
|
GKE |
|
Cloud Storage |
|
BigQuery |
|
Google Cloud VMware Engine |
|
Mengoptimalkan berbagi resource
Untuk memaksimalkan pemanfaatan resource cloud, Anda dapat men-deploy beberapa aplikasi atau layanan di infrastruktur yang sama, sambil tetap memenuhi keamanan dan persyaratan aplikasi lainnya. Misalnya, di lingkungan pengembangan dan pengujian, Anda dapat menggunakan infrastruktur cloud yang sama untuk menguji semua komponen aplikasi. Untuk lingkungan produksi, Anda dapat men-deploy setiap komponen pada kumpulan resource terpisah untuk membatasi tingkat dampaknya jika terjadi insiden.
Berikut adalah contoh cara menerapkan rekomendasi ini:
- Gunakan satu instance Cloud SQL untuk beberapa lingkungan non-produksi.
- Memungkinkan beberapa tim pengembangan berbagi cluster GKE menggunakan fitur pengelolaan tim fleet di GKE Enterprise dengan kontrol akses yang sesuai.
- Gunakan Autopilot GKE untuk memanfaatkan teknik pengoptimalan biaya seperti bin packing dan penskalaan otomatis yang diterapkan GKE secara default.
- Untuk workload AI dan ML, hemat biaya GPU dengan menggunakan strategi berbagi GPU seperti GPU multi-instance, GPU berbagi waktu, dan NVIDIA MPS.
Mengembangkan dan mengelola arsitektur referensi
Buat dan kelola repositori arsitektur referensi yang disesuaikan untuk memenuhi persyaratan berbagai lingkungan deployment dan jenis beban kerja. Untuk menyederhanakan proses desain dan penerapan untuk setiap project, blueprint dapat dikelola secara terpusat oleh tim seperti Cloud Center of Excellence (CCoE). Tim project dapat memilih blueprint yang sesuai berdasarkan kriteria yang ditentukan dengan jelas, untuk memastikan konsistensi arsitektur dan penerapan praktik terbaik. Untuk persyaratan yang unik bagi suatu project, tim project dan tim arsitektur pusat harus berkolaborasi untuk mendesain arsitektur referensi baru. Anda dapat membagikan arsitektur referensi di seluruh organisasi untuk mendorong berbagi pengetahuan dan memperluas repositori solusi yang tersedia. Pendekatan ini memastikan konsistensi, mempercepat pengembangan, menyederhanakan pengambilan keputusan, dan mendorong pemanfaatan resource yang efisien.
Tinjau arsitektur referensi yang disediakan oleh Google untuk berbagai kasus penggunaan dan teknologi. Arsitektur referensi ini menggabungkan praktik terbaik untuk pemilihan, ukuran, konfigurasi, dan deployment resource. Dengan menggunakan arsitektur referensi ini, Anda dapat mempercepat proses pengembangan dan mencapai penghematan biaya sejak awal.
Menerapkan disiplin biaya menggunakan kebijakan organisasi
Pertimbangkan untuk menggunakan kebijakan organisasi untuk membatasi lokasi dan produk Google Cloud yang tersedia yang dapat digunakan anggota tim. Kebijakan ini membantu memastikan bahwa tim mematuhi solusi yang hemat biaya dan menyediakan resource di lokasi yang selaras dengan sasaran pengoptimalan biaya Anda.
Memperkirakan anggaran yang realistis dan menetapkan batas keuangan
Buat anggaran mendetail untuk setiap project, workload, dan lingkungan deployment. Pastikan anggaran mencakup semua aspek operasi cloud, termasuk biaya infrastruktur, lisensi software, personel, dan perkiraan pertumbuhan. Untuk mencegah pengeluaran berlebih dan memastikan penyelarasan dengan sasaran keuangan Anda, tetapkan batas atau nilai minimum pembelanjaan yang jelas untuk project, layanan, atau resource tertentu. Pantau pembelanjaan cloud secara berkala terhadap batas ini. Anda dapat menggunakan notifikasi kuota proaktif untuk mengidentifikasi potensi pembengkakan biaya lebih awal dan mengambil tindakan korektif yang tepat waktu.
Selain menetapkan anggaran, Anda dapat menggunakan kuota dan batas untuk membantu menerapkan disiplin biaya dan mencegah lonjakan pengeluaran yang tidak terduga. Anda dapat menerapkan kontrol terperinci atas konsumsi resource dengan menetapkan kuota di berbagai tingkat, termasuk project, layanan, dan bahkan jenis resource tertentu.
Berikut adalah contoh cara menerapkan rekomendasi ini:
- Kuota tingkat project: Tetapkan batas pembelanjaan atau kuota resource di tingkat project untuk menetapkan batas keuangan secara keseluruhan dan mengontrol penggunaan resource di semua layanan dalam project.
- Kuota khusus layanan: Konfigurasikan kuota untuk layanan Google Cloud tertentu seperti Compute Engine atau BigQuery untuk membatasi jumlah instance, CPU, atau kapasitas penyimpanan yang dapat disediakan.
- Kuota khusus jenis resource: Terapkan kuota ke setiap jenis resource seperti VM Compute Engine, bucket Cloud Storage, instance Cloud Run, atau node GKE untuk membatasi penggunaannya dan mencegah kelebihan biaya yang tidak terduga.
- Pemberitahuan kuota: Dapatkan notifikasi saat penggunaan kuota Anda (di level project) mencapai persentase nilai maksimum.
Dengan menggunakan kuota dan batas bersama dengan penganggaran dan pemantauan, Anda dapat membuat pendekatan proaktif dan multi-lapisan untuk pengendalian biaya. Pendekatan ini membantu memastikan bahwa pembelanjaan cloud Anda tetap berada dalam batas yang ditentukan dan selaras dengan tujuan bisnis Anda. Ingat, kontrol biaya ini tidak permanen atau kaku. Untuk memastikan kontrol biaya tetap selaras dengan standar industri saat ini dan mencerminkan kebutuhan bisnis Anda yang terus berkembang, Anda harus meninjau kontrol secara berkala dan menyesuaikannya untuk menyertakan teknologi dan praktik terbaik baru.