Supervisión en un entorno de solución Bare Metal

La solución Bare Metal te permite ejecutar cargas de trabajo especializadas en extensiones regionales ubicadas cerca de Google Cloud centros de datos. Si implementas un entorno de Bare Metal Solution, puedes reducir los costos generales y los riesgos asociados con la migración a la nube.

Descripción general de Monitoring

Una de nuestras principales prioridades es ofrecer la mayor disponibilidad para el entorno de la solución Bare Metal. Por esa razón, Google Cloud y nuestros socios realizan una variedad de actividades de supervisión. A continuación, se muestra una lista de los dispositivos de infraestructura en un entorno de la solución Bare Metal que supervisamos:

Infraestructura de procesamiento

  • Hardware del servidor

Infraestructura de almacenamiento

  • Dispositivos de almacenamiento
  • Interruptores SAN

Infraestructura de red

  • Routers
  • Interruptores
  • Infraestructura de interconexión

Google Cloud también realiza un seguimiento del entorno del centro de datos, incluida la temperatura y la humedad de la sala del servidor.

No supervisamos los sistemas operativos, la actividad y las cargas de trabajo a nivel de la aplicación, ni el tráfico de red que se envía a los servidores de la solución Bare Metal y desde ellos. Para obtener una vista previa de una utilidad que te permita usar Operaciones en la nube para supervisar la actividad a nivel del SO, comunícate con Ventas deGoogle Cloud .

Herramientas de supervisión

Nuestro socio usa soluciones de software de grado comercial para la supervisión que cumplen por completo con la Biblioteca de infraestructura de tecnología de la información (ITIL).Google Cloud y nuestro socio también usan Google Cloud servicios, como Pub/Sub, funciones de Cloud Run y Cloud Monitoring, para recopilar y procesar estos datos de supervisión. Nuestros sistemas internos de tickets y notificaciones trabajan directamente con estos servicios.

Datos de supervisión

En general, nuestros datos de supervisión provienen de las siguientes fuentes:

  • Capturas de SNMP
  • Mensajes de Syslog
  • Mensajes de software de administración específico
  • Interfaz de administración de plataforma inteligente (IPMI)

Métricas comunes de los dispositivos supervisados:

  • Uso de CPU
  • Interfaz de red:
    • Utilización del ancho de banda
    • Descarte de paquetes
    • Errores

Alertas

Google Cloud realizó amplias actividades de normalización y validación para los requisitos específicos del entorno de la solución Bare Metal. Si un evento certificado se encuentra fuera del rango normal, el sistema de supervisión activa una alerta.

Administración de incidentes

Google Cloud y nuestro proveedor de infraestructura asociado tienen un equipo dedicado las 24 horas, todos los días, responsable de la respuesta ante incidentes. También hay un equipo de puente disponible las 24 horas, todos los días, para realizar el análisis inicial de cada ticket de asistencia y tomar las medidas necesarias para mitigar el problema. Según la gravedad del incidente, desplegamos los equipos adecuados para resolverlo.

Atención al cliente de Cloud trabajo con el Google Cloud equipo de SysOps de Ingeniería. Pueden brindarte actualizaciones y coordinar las acciones que requieran tu ayuda. Según sea necesario, el equipo de ingeniería deGoogle Cloud interactúa con el socio proveedor de infraestructura o los proveedores de hardware para ayudar a resolver el problema.

Proceso de análisis de causa raíz

Cuando los incidentes tienen un impacto amplio y grave, Google proporciona informes de incidentes que describen los síntomas, el impacto, la causa raíz, la solución y la prevención futura de incidentes. Como ocurre con los análisis de resultados, prestamos especial atención a las medidas que tomamos para aprender del problema y mejorar la confiabilidad.

Esperamos que este resumen de nuestras capacidades de supervisión te ayude a confiar en el entorno de Bare Metal Solution a medida que migras tu infraestructura y tus aplicaciones a la nube.