Actualizaciones y mantenimiento de la nube privada

Los entornos de nube privada se diseñan de las siguientes maneras para que no tengan ningún punto único de fallo:

  • Los clústeres de ESXi están configurados con alta disponibilidad (HA) de vSphere. El tamaño de los clústeres tiene al menos un nodo libre para la resiliencia.
  • vSAN proporciona almacenamiento principal redundante que requiere al menos tres nodos para proporcionar protección contra una sola falla. En clústeres más grandes, puedes configurar vSAN para proporcionar mayor resiliencia.
  • Las máquinas virtuales (VM) de vCenter, PSC y NSX se configuran con almacenamiento RAID-10 para protección contra fallas de almacenamiento. Además, las VM están protegidas contra fallas de nodo y de red por parte del HA de vSphere.
  • Los hosts ESXi tienen ventiladores y NIC redundantes.
  • Los interruptores de columna y TOR están configurados en pares de HA para proporcionar resiliencia.

VMware Engine supervisa de forma continua el tiempo de actividad, supervisa la disponibilidad y proporciona ANS de disponibilidad para los siguientes tipos de VM:

  • Hosts ESXi
  • vCenter
  • PSC
  • NSX Manager

VMware Engine supervisa de forma continua lo siguiente para detectar fallas:

  • Discos duros
  • Puertos NIC físicos
  • Servidores
  • Ventiladores
  • Energía
  • Interruptores
  • Puertos del interruptor

Si falla un disco o un nodo, VMware Engine agrega automáticamente un nodo nuevo al clúster de VMware afectado para restablecer la operabilidad del servicio.

Se mantienen y se actualizan los siguientes elementos de VMware en las nubes privadas, y se crean copias de seguridad de ellos:

  • ESXi
  • Platform Services Controller de vCenter
  • vSAN
  • NSX

Copia de seguridad y restablecimiento

Las copias de seguridad incluyen lo siguiente:

  • Copias de seguridad de las reglas de vCenter, PSC y DVS que se incrementan por las noches.
  • API nativas de vCenter que crean copias de seguridad de los componentes en la capa de la aplicación.
  • Copia de seguridad automática antes de actualizar el software de administración de VMware.

Mantenimiento

Se incluyen los siguientes tipos de mantenimiento planificado.

Backend y mantenimiento interno

Por lo general, el backend y el mantenimiento interno implican volver a configurar recursos físicos o instalar parches de software. No afecta el consumo normal de los elementos que se entregan. Dado que las NIC redundantes van a cada bastidor físico, el tráfico de red normal y las operaciones de nube privada no se ven afectadas. Es posible que observes un impacto en el rendimiento solo si tu organización espera usar el ancho de banda redundante completo durante el intervalo de mantenimiento.

Mantenimiento del portal

Se requiere un tiempo de inactividad limitado del servicio cuando se actualiza la plano de control o la infraestructura. Los intervalos de mantenimiento pueden ser tan frecuentes como una vez al mes, y se espera que disminuyan su frecuencia con el tiempo. VMware Engine te notifica sobre un mantenimiento inminente del portal y hace un esfuerzo por mantener el intervalo de mantenimiento lo más breve posible. Durante un intervalo de mantenimiento del portal, los siguientes servicios continúan funcionando sin que se produzca un impacto:

  • Plano de administración de VMware y aplicaciones
  • Acceso a vCenter
  • Todas las Herramientas de redes y el almacenamiento

Mantenimiento de la infraestructura de VMware

En ocasiones, es necesario realizar cambios en la configuración de la infraestructura de VMware. Estos intervalos pueden producirse cada uno o dos meses, pero se espera que la frecuencia disminuya con el tiempo. Por lo general, este tipo de mantenimiento puede realizarse sin interrumpir el consumo normal de la nube privada. Durante un intervalo de mantenimiento de VMware, los siguientes servicios continúan funcionando sin ningún impacto:

  • Plano de administración de VMware y aplicaciones
  • Acceso a vCenter
  • Todas las Herramientas de redes y el almacenamiento

Actualizaciones

VMware Engine es responsable de la administración del ciclo de vida del software de VMware (ESXi, vCenter, PSC y NSX) en las nubes privadas.

Las actualizaciones de software incluyen lo siguiente:

  • Parches: Parches de seguridad o correcciones de errores que lanzó VMware
  • Mejoras: Cambios de versión secundarios de un componente de pila de VMware
  • Actualizaciones: Cambios de versión importantes de un componente de pila de VMware

VMware Engine prueba los parches de seguridad críticos en cuanto estén disponibles desde VMware. Según el ANS, VMware Engine tiene como objetivo un lanzamiento de parches de seguridad para entornos de nube privada en el plazo de una semana a partir de su disponibilidad.

Cuando hay una nueva versión principal de software de VMware disponible, VMware Engine trabaja con los clientes para coordinar un período de mantenimiento adecuado a fin de aplicar la actualización. VMware Engine aplica actualizaciones de versiones principales al menos seis meses después del lanzamiento de la versión principal y notifica a los clientes con un mes de anticipación cuando se aplican las actualizaciones principales de versiones.

VMware Engine también trabaja con proveedores clave de la industria para garantizar que admitan la última versión del software de VMware antes de lanzar una actualización a una versión principal. Para obtener información sobre la asistencia para proveedores específicos, comunícate con Atención al cliente de Cloud.

Preparación

Google recomienda que realices los siguientes preparativos antes de comenzar una actualización:

  • Verifica la capacidad de almacenamiento: Asegúrate de que el uso del espacio de almacenamiento del clúster de vSphere sea inferior al 80% para mantener el ANS. Si el uso es superior al 80%, las actualizaciones pueden tardar más de lo normal o fallar por completo. Si el uso de almacenamiento supera el 70%, agrega un nodo para expandir el clúster y evitar cualquier posible tiempo de inactividad durante las actualizaciones.
  • Cambia las políticas de almacenamiento de vSAN con FTT de 0: cambia las VM configuradas con una política de almacenamiento de vSAN para fallas en tolerar (FTT) de 0 a una política de almacenamiento de vSAN con FTT de 1 a fin de mantener el ANS.
  • Quita las activaciones de CD de VM: Quita todos los CD activados en las VMs de carga de trabajo que no sean compatibles con vMotion.
  • Instalaciones completas de la herramienta de VMware: Completa las instalaciones o actualizaciones de las herramientas de VMware antes de que comience la actualización programada.
  • Quita el bus SCSI de uso compartido de las VM:Quita el uso compartido de los bus SCSI en las VM si no deseas que las VM se apaguen.
  • Quita las VM y los almacenes de datos inaccesibles: Quita las VM inaccesibles y sin uso del inventario de vCenter. Quita los almacenes de datos externos inaccesibles.
  • Inhabilitar las reglas del programador de recursos distribuidos (DRS): Las reglas de DRS que fijan una VM a un host evitan que un nodo ingrese al modo de mantenimiento. Puedes inhabilitar las reglas de DRS antes de la actualización y habilitarlas después de que se complete la actualización.
  • Actualiza los complementos de VMware y las soluciones de terceros: Verifica que los complementos de VMware y las soluciones de terceros implementados en tu vCenter de nube privada sean compatibles con las versiones posteriores a la actualización que se mencionaron antes. Los ejemplos de herramientas incluyen las de copia de seguridad, supervisión, organización de recuperación ante desastres y otras funciones similares. Verifica con el proveedor de la solución y actualízala con anticipación si es necesario para garantizar la compatibilidad después de la actualización.

Configuraciones que podrían afectar los procesos de mantenimiento

VMware Engine aprovecha el modo de mantenimiento de VMware para realizar actualizaciones y mantenimiento de nodos. Esto garantiza la operación continua de tus cargas de trabajo de nube privada. Sin embargo, las siguientes opciones de configuración pueden requerir pasos adicionales antes de que un nodo pueda ingresar en modo de mantenimiento:

  • Reglas de DRS: DEBEN ser reglas que obliguen a las VMs a permanecer en un nodo específico
  • Uso compartido de bus SCSI: VMs configuradas para compartir buses SCSI.
  • Activaciones de CD-ROM: Las VM con CD-ROM adjuntos, en especial si esos CD-ROM no se pueden mover a otro nodo con vMotion.
  • Conexiones de puerto en serie: Son las VMs que usan conexiones de puerto en serie que evitan que se muevan a otro nodo con vMotion.
  • Asignaciones de dispositivos sin procesar (RDM): Las VMs que acceden directamente a dispositivos de almacenamiento físico

Si es necesario realizar una acción

Si existe alguna de estas opciones de configuración en un nodo, Atención al cliente de Cloud te notifica al menos 24 horas antes de tomar las medidas de corrección necesarias para mantener la disponibilidad de tu nube privada. En algunos casos, los pasos, como apagar una VM, moverla con vMotion y encenderla, o quitar los CD-ROM, podrían interrumpir brevemente tu carga de trabajo.

¿Qué sigue?