Pemantauan di lingkungan Solusi Bare Metal
Solusi Bare Metal memungkinkan Anda menjalankan workload khusus di ekstensi regional yang terletak di dekat Google Cloud pusat data. Dengan menerapkan lingkungan Solusi Bare Metal, Anda dapat menurunkan biaya secara keseluruhan dan mengurangi risiko yang terkait dengan migrasi ke cloud.
Ringkasan pemantauan
Salah satu prioritas utama kami adalah memberikan ketersediaan tertinggi untuk lingkungan Solusi Bare Metal. Oleh karena itu, Google Cloud dan partner kami melakukan berbagai aktivitas pemantauan. Berikut adalah daftar perangkat infrastruktur di lingkungan Solusi Bare Metal yang kami pantau:
Infrastruktur komputasi
- Hardware server
Infrastruktur penyimpanan
- Perangkat penyimpanan
- Switch SAN
Infrastruktur jaringan
- Router
- Tombol
- Infrastruktur interkoneksi
Google Cloud juga melacak lingkungan pusat data, termasuk suhu dan kelembapan ruang server.
Kami tidak memantau sistem operasi, aktivitas dan beban kerja tingkat aplikasi, serta traffic jaringan yang berjalan ke dan dari server Solusi Bare Metal. Untuk melihat pratinjau utilitas yang memungkinkan Anda menggunakan Cloud Operations untuk memantau aktivitas tingkat OS, hubungi Google Cloud Penjualan.
Alat pemantauan
Partner kami menggunakan solusi software kelas komersial untuk pemantauan yang sepenuhnya mematuhi Information Technology Infrastructure Library (ITIL). Google Cloud dan partner kami juga menggunakan layanan Google Cloud , seperti Pub/Sub, Cloud Run Functions, dan Cloud Monitoring, untuk mengumpulkan dan memproses data pemantauan ini. Sistem notifikasi dan penjualan tiket internal kami berfungsi langsung dengan layanan ini.
Memantau data
Pada tingkat tinggi, data pemantauan kami berasal dari sumber berikut:
- Perangkap SNMP
- Pesan syslog
- Pesan dari software pengelolaan khusus
- Intelligent Platform Management Interface (IPMI)
Metrik umum perangkat yang dipantau:
- Pemakaian CPU
- Antarmuka Jaringan:
- Penggunaan bandwidth
- Penghapusan paket
- Error
Pemberitahuan
Google Cloud melakukan aktivitas normalisasi dan validasi yang ekstensif untuk persyaratan spesifik lingkungan Solusi Bare Metal. Jika peristiwa tersertifikasi berada di luar rentang normal, sistem pemantauan akan memicu pemberitahuan.
Manajemen insiden
Google Cloud dan penyedia infrastruktur partner kami memiliki tim khusus yang beroperasi 24/7 dan bertanggung jawab atas respons insiden. Tim jembatan juga tersedia 24/7 untuk melakukan analisis awal setiap tiket dukungan dan mengambil tindakan yang diperlukan untuk mengurangi masalah. Berdasarkan tingkat keparahan insiden, kami akan mengerahkan tim yang sesuai untuk menyelesaikan insiden tersebut.
Cloud Customer Care bekerja sama dengan Google Cloud Tim SysOps Engineering. Mereka dapat memberikan info terbaru, dan mengoordinasikan tindakan apa pun yang memerlukan bantuan Anda. Jika diperlukan,Google Cloud Tim Engineering akan menghubungi partner penyedia infrastruktur atau vendor hardware untuk membantu menyelesaikan masalah Anda.
Proses analisis akar masalah
Jika insiden memiliki dampak yang luas dan serius, Google akan memberikan laporan insiden yang menjelaskan gejala, dampak, akar masalah, perbaikan, dan pencegahan insiden di masa mendatang. Seperti halnya postmortem, kami memberikan perhatian khusus pada langkah-langkah yang kami ambil untuk belajar dari masalah dan meningkatkan keandalan.
Kami harap ringkasan kemampuan pemantauan kami ini dapat membantu Anda merasa percaya diri di lingkungan Solusi Bare Metal saat memigrasikan infrastruktur dan aplikasi ke cloud.