Monitoraggio in un ambiente Bare Metal Solution
La soluzione Bare Metal ti consente di eseguire carichi di lavoro specializzati in estensioni regionali situate vicino ai data center Google Cloud . Implementando un ambiente Bare Metal Solution, puoi ridurre i costi complessivi e i rischi associati alla migrazione al cloud.
Panoramica del monitoraggio
Una delle nostre principali priorità è offrire la massima disponibilità per l'ambiente Bare Metal Solution. Per questo motivo, Google Cloud i nostri partner svolgono una serie di attività di monitoraggio. Di seguito è riportato un elenco dei dispositivi di infrastruttura in un ambiente Bare Metal Solution che monitoriamo:
Infrastruttura di calcolo
- Hardware del server
Infrastruttura di archiviazione
- Dispositivi di archiviazione
- Switch SAN
Infrastruttura di rete
- Router
- Interruttori
- Infrastruttura di interconnessione
Google Cloud monitora anche l'ambiente del data center, tra cui la temperatura e l'umidità della stanza dei server.
Non monitoriamo i sistemi operativi, le attività e i workload a livello di applicazione e il traffico di rete in entrata e in uscita dai server Bare Metal Solution. Per visualizzare un'anteprima di un'utilità che ti consente di utilizzare Cloud Operations per monitorare l'attività a livello di sistema operativo, contatta il team di Google Cloud vendita.
Strumenti di monitoraggio
Il nostro partner utilizza soluzioni software di livello commerciale per il monitoraggio conformi in toto all'Information Technology Infrastructure Library (ITIL). Google Cloud e il nostro partner utilizzano anche Google Cloud servizi come Pub/Sub, Cloud Run Functions e Cloud Monitoring per raccogliere e elaborare questi dati di monitoraggio. I nostri sistemi di gestione dei ticket e delle notifiche interni lavorano direttamente con questi servizi.
Dati di monitoraggio
In linea generale, i nostri dati di monitoraggio provengono dalle seguenti fonti:
- Trappole SNMP
- Messaggi syslog
- Messaggi da software di gestione dedicati
- Intelligent Platform Management Interface (IPMI)
Metriche comuni dei dispositivi monitorati:
- Utilizzo CPU
- Interfaccia di rete:
- Utilizzo della larghezza di banda
- Rifiutazioni di pacchetti
- Errori
Avvisi
Google Cloud ha svolto ampie attività di normalizzazione e convalida per i requisiti specifici dell'ambiente Bare Metal Solution. Se un evento certificato non rientra nell'intervallo normale, il sistema di monitoraggio attiva un avviso.
Gestione degli incidenti
Google Cloud e il nostro fornitore di infrastrutture partner hanno un team dedicato attivo 24 ore su 24, 7 giorni su 7, responsabile della risposta agli incidenti. È inoltre disponibile un team di assistenza dedicato attivo 24 ore su 24, 7 giorni su 7, per eseguire l'analisi iniziale di ogni ticket di assistenza e intraprendere le azioni necessarie per mitigare il problema. In base alla gravità dell'incidente, déployiamo i team appropriati per risolverlo.
L'assistenza clienti di Cloud collabora con il Google Cloud team di SysOps dell'Ingegneria. Possono fornirti aggiornamenti e coordinare eventuali azioni che richiedono il tuo aiuto. Se necessario, il Google Cloud team tecnico collabora con il partner fornitore di infrastrutture o con i fornitori di hardware per aiutarti a risolvere il problema.
Procedura di analisi delle cause principali
Quando gli incidenti hanno un impatto ampio e grave, Google fornisce report sugli incidenti che descrivono i sintomi, l'impatto, la causa principale, la correzione e la prevenzione futura degli incidenti. Come per i post mortem, prestiamo particolare attenzione ai passaggi che intraprendiamo per imparare dal problema e migliorare l'affidabilità.
Ci auguriamo che questo riepilogo delle nostre funzionalità di monitoraggio ti aiuti a sentirti tranquillo nell'ambiente Bare Metal Solution durante la migrazione dell'infrastruttura e delle applicazioni al cloud.