Supervisión en un entorno de la solución Bare Metal

La solución Bare Metal te permite ejecutar cargas de trabajo especializadas en extensiones regionales ubicadas cerca de los centros de datos de Google Cloud. Implementando una solución Bare Metal puedes reducir los costos generales y los riesgos asociados con la migración a la nube.

Descripción general de Monitoring

Una de nuestras principales prioridades es entregarles para el entorno de la solución Bare Metal. Por ese motivo, Google Cloud y nuestros socios realizan diversas actividades de supervisión. A continuación, se muestra una lista de los dispositivos de infraestructura en un entorno de la solución Bare Metal que supervisamos:

Infraestructura de procesamiento

  • Hardware del servidor

Infraestructura de almacenamiento

  • Dispositivos de almacenamiento
  • Conmutadores de SAN

Infraestructura de red

  • Routers
  • Interruptores
  • Infraestructura de interconexión

Google Cloud también realiza un seguimiento del entorno del centro de datos, incluida la temperatura y la humedad de la sala de servidores.

No supervisamos los sistemas operativos, la actividad y las cargas de trabajo a nivel de la aplicación, ni el tráfico de red que se envía a los servidores de la solución Bare Metal y desde ellos. Para obtener una vista previa de una utilidad que te permita usar Operaciones de Cloud para supervisar la actividad a nivel del SO, comunícate con Ventas de Google Cloud.

Herramientas de supervisión

Nuestro socio usa soluciones de software de grado comercial para la supervisión que cumplen por completo con la Biblioteca de Infraestructura de Tecnologías de la Información (ITIL). Google Cloud y nuestro socio también usan los servicios de Google Cloud, como Pub/Sub, Cloud Run Functions y Cloud Monitoring para recopilar y procesar estos datos de supervisión. Nuestros sistemas internos de tickets y notificaciones trabajan directamente con estos servicios.

Supervisión de datos

En general, nuestros datos de supervisión provienen de las siguientes fuentes:

  • Capturas de SNMP
  • Mensajes de Syslog
  • Mensajes de un software de administración dedicado
  • Interfaz de administración de plataforma inteligente (IPMI)

Métricas comunes de los dispositivos supervisados:

  • Uso de CPU
  • Interfaz de red:
    • Uso del ancho de banda
    • Descartadas de paquetes
    • Errores

Alertas

Google Cloud llevó a cabo extensas actividades de normalización y validación de los requisitos específicos del entorno de la solución Bare Metal. Si una evento certificado cae fuera del rango normal, el sistema de supervisión activa una alerta.

Administración de incidentes

Google Cloud y nuestro proveedor de infraestructura de socios tienen una plataforma Equipo las 24 horas, todos los días, responsable de la respuesta ante incidentes. También hay un equipo de conexión disponible las 24 horas, todos los días, para realizar el análisis inicial de cada ticket de asistencia y obtener las medidas necesarias para mitigar el problema. Según la gravedad del incidente, y contamos con los equipos adecuados para resolver el incidente.

Atención al cliente de Cloud trabaja con el equipo de SysOps de Ingeniería de Google Cloud. Pueden brindarte actualizaciones y coordinar las acciones que requieran tu ayuda. Según sea necesario, El equipo de Ingeniería de Google Cloud interactúa con el proveedor de infraestructura socios o proveedores de hardware para ayudarte a resolver el problema.

Proceso de análisis de la causa raíz

Cuando los incidentes tienen un impacto amplio y grave, Google proporciona informes de incidentes que describen los síntomas, el impacto, la causa raíz, la corrección y la prevención de incidentes. Como ocurre con los análisis de resultados, prestamos especial atención a las medidas que tomamos para aprender del problema y mejorar la confiabilidad.

Esperamos que este resumen de nuestras funciones de supervisión te ayude a seguro en el entorno de la solución Bare Metal mientras migras tus y aplicaciones a la nube.