Pemantauan di lingkungan Solusi Bare Metal

Dengan Solusi Bare Metal, Anda dapat menjalankan workload khusus di ekstensi regional yang berada di dekat pusat data Google Cloud. Dengan menerapkan lingkungan Solusi Bare Metal, Anda dapat menurunkan biaya keseluruhan dan mengurangi risiko yang terkait dengan migrasi ke cloud.

Ringkasan pemantauan

Salah satu prioritas utama kami adalah memberikan ketersediaan tertinggi untuk lingkungan Solusi Bare Metal. Oleh karena itu, Google Cloud dan partner kami melakukan berbagai aktivitas pemantauan. Berikut adalah daftar perangkat infrastruktur di lingkungan Solusi Bare Metal yang kami pantau:

Infrastruktur komputasi

  • Hardware server

Infrastruktur penyimpanan

  • Perangkat penyimpanan
  • Tombol SAN

Infrastruktur jaringan

  • Router
  • {i>Switch<i}
  • Infrastruktur interkoneksi

Google Cloud juga memantau lingkungan pusat data, termasuk suhu dan kelembapan ruang server.

Kami tidak memantau sistem operasi, aktivitas tingkat aplikasi, dan beban kerja, serta traffic jaringan yang beralih ke dan dari server Solusi Bare Metal. Untuk melihat pratinjau utilitas yang memungkinkan Anda menggunakan Cloud Operations guna memantau aktivitas tingkat OS, hubungi bagian Penjualan Google Cloud.

Alat pemantauan

Partner kami menggunakan solusi software tingkat komersial untuk pemantauan yang sepenuhnya mematuhi Information Technology Infrastructure Library (ITIL). Google Cloud dan partner kami juga menggunakan layanan Google Cloud, seperti Pub/Sub, Cloud Functions, dan Cloud Monitoring, untuk mengumpulkan dan memproses data pemantauan ini. Sistem antrian dan pemberitahuan internal kami bekerja langsung dengan layanan ini.

Data pemantauan

Pada tingkat tinggi, data pemantauan kami berasal dari sumber berikut:

  • Perangkap SNMP
  • Pesan Syslog
  • Pesan dari software pengelolaan khusus
  • Intelligent Platform Management Interface (IPMI)

Metrik umum perangkat yang dipantau:

  • CPU utilization
  • Antarmuka Jaringan:
    • Pemakaian bandwidth
    • Paket dihapus
    • Error

Pemberitahuan

Google Cloud melakukan aktivitas normalisasi dan validasi ekstensif untuk persyaratan khusus lingkungan Solusi Bare Metal. Jika peristiwa tersertifikasi berada di luar rentang normal, sistem pemantauan akan memicu pemberitahuan.

Manajemen insiden

Google Cloud dan penyedia infrastruktur partner kami memiliki tim khusus 24/7 yang bertanggung jawab atas respons insiden. Tim penghubung juga tersedia 24/7 untuk melakukan analisis awal atas setiap tiket dukungan dan mengambil tindakan yang diperlukan untuk memitigasi masalah. Berdasarkan tingkat keparahan insiden, kami mengirimkan tim yang tepat untuk mengatasi insiden tersebut.

Cloud Customer Care bekerja sama dengan Tim Google Cloud Engineering SysOps. Mereka dapat memberi Anda informasi terbaru, dan mengoordinasikan tindakan apa pun yang memerlukan bantuan Anda. Sesuai kebutuhan, Tim Engineer Google Cloud bekerja sama dengan partner penyedia infrastruktur atau vendor hardware untuk membantu menyelesaikan masalah Anda.

Proses analisis akar masalah

Saat insiden memiliki dampak yang luas dan serius, Google memberikan laporan insiden yang menjelaskan gejala, dampak, penyebab utama, perbaikan, dan pencegahan insiden di masa mendatang. Seperti halnya postmortem, kami memberikan perhatian khusus pada langkah-langkah yang kami ambil untuk belajar dari masalah dan meningkatkan keandalan.

Kami harap ringkasan kemampuan pemantauan kami ini dapat membantu Anda mempercayai lingkungan Solusi Bare Metal saat memigrasikan infrastruktur dan aplikasi Anda ke cloud.